Такой примерчик:
в формочку вставляем текст, и получаем отсортированый масив
<?php
function is_relevant($var) {
if ( (!empty($var) && (strlen($var)>4) ) ) return 1;
else return 0;
}
function lowercase_cyr($source_text)
{
return strtr($source_text,\'АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯЇІЄ\',\'абвгдеёжзийклмнопрстуфхцчшщьыъэюяїіє\');
}
if (!empty($target)) {
$dest="http://127.0.0.1/".$target;
$fp = @fopen ($dest, \'r\');
if ($fp) {
while (! feof ($fp)) {$content .= fgets ($fp, 4096);}
fclose($fp);
}
$words=preg_split("\'\\s+\'i"," {$content} ");
sort($words);
$relevant=array();
$rel=array();
for ($i=1;$i<count($words); $i++) {
if (is_relevant($words[$i])) {
$word=$words[$i];
$word=strtr($words[$i],"“”«».!«,?"," ");
$word = eregi_replace ("[[:digit:][:punct:][:space:][:alpha:]]","",$word);
$word=substr($word, 0,-1);
$word=lowercase_cyr($word);
if (is_relevant($word)) $rel[] =$word;
}
}
$relevant = array_count_values($rel);
arsort($relevant);
}
echo "<form action=\\"$PHP_SELF\\"><input type=text name=target value=\\"$target\\"><input type=submit value=\\">>>\\"></form>
";
echo "
<hr><pre>\\n";
print_r($relevant);
echo "\\n</pre><hr>
\\n";
?>