Наши скрипты > Sanitarium WebLoG
search (поиск) тормозит ?
Green Kakadu:
--- Цитировать ---и дальше идут окончания слов... зачем?
--- Конец цитаты ---
;) проверка вашей грамотности с автоматической коррекцией.
\'Попугай\', \'попугаями\' - по идее, слово одно, а кол-во букв разное. При индексации, система пытается все преобразовать к одному варианту (чтоб посчитать частоту слова, места сэкономить). Окончания обрезаем, получаем \'попуг\' ;) с этим можно работать, кстати потом еще урежется одна последняя буква и в индекс запишется \'попу\' :)
xcreator:
во ё ...
xcreator:
http://tip.net.au/tip/info/calc-passwd.html
Вот очень ркутая веща которую я нашёл, поставил пароль через неё в .htpasswd и прописав в htaccess защита директории работает :-)
Добавьте ее в след. релиз!
:
Я работаю на Unicode и это
# BIG RUSSIAN LETTERS \\xC0-\\xDF\\xA8 (xA8 - ¨)
# small russian letters \\xE0-\\xFF\\xB8\' (xB8 - ¸)
$page=~s/]+>/ /g;#Strip ALL HTML Tags
$page=~s/&[\\w]+;//g;#Strip ALL HTMLs like <
$page=~tr/A-Z\\xC0-\\xDF\\xA8/a-z\\xE0-\\xFF\\xB8/;#BIG to small
map{$page=~s/$_[^a-z\\xE0-\\xFF\\xB8]/ /g if length($_)>3} @word_ends;#Delete word ends
map($page=~s/[^a-z\\xE0-\\xFF\\xB8]$_[^a-z\\xE0-\\xFF\\xB8]/ /g, @stop_words);#Delete stop words
$page=~s/([-a-z\\xE0-\\xFF\\xB8])\\1+/$1/g;#Delete double symbols
my(@words) = split(/[^-a-z\\d\\xE0-\\xFF\\xB8]+/, $page);#Delete non alphabetic symbols and splite to array
undef $page;
@words=grep{length > 2} @words;#Delete all words from 1 or 2 symbols
my %count=();
ограничивает кодировку. Как его изменит???
Навигация
Перейти к полной версии