Такой примерчик:
в формочку вставляем текст, и получаем отсортированый масив
<?php
function is_relevant($var) {
if ( (!empty($var) && (strlen($var)>4) )  )  return 1;
 else return 0;
 }
function lowercase_cyr($source_text)
{
 return strtr($source_text,\'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯЇІЄ\',\'абвгдеёжзийклмнопрстуфхцчшщьыъэюяїіє\');
}
if (!empty($target)) {
$dest="http://127.0.0.1/".$target;
$fp = @fopen ($dest, \'r\');
if ($fp) {
   while (! feof ($fp))  {$content .= fgets ($fp, 4096);}
   fclose($fp);
}
$words=preg_split("\'\\s+\'i"," {$content} ");
sort($words);
$relevant=array();
$rel=array();
for ($i=1;$i<count($words); $i++) {
      if (is_relevant($words[$i])) {
      $word=$words[$i];
      $word=strtr($words[$i],"“”«».!«,?","        ");
      $word = eregi_replace ("[[:digit:][:punct:][:space:][:alpha:]]","",$word);
      $word=substr($word, 0,-1);
      $word=lowercase_cyr($word);
      if (is_relevant($word))   $rel[] =$word;
      }
}
$relevant = array_count_values($rel);
arsort($relevant);
}
echo "<form action=\\"$PHP_SELF\\"><input type=text name=target value=\\"$target\\"><input type=submit value=\\">>>\\"></form>
";
echo "
<hr><pre>\\n";
print_r($relevant);
echo "\\n</pre><hr>
\\n";
?>