Наши скрипты > Sanitarium WebLoG

search (поиск) тормозит ?

<< < (5/5)

Green Kakadu:

--- Цитировать ---и дальше идут окончания слов... зачем?
--- Конец цитаты ---

;) проверка вашей грамотности с автоматической коррекцией.

\'Попугай\', \'попугаями\' - по идее, слово одно, а кол-во букв разное. При индексации, система пытается все преобразовать к одному варианту (чтоб посчитать частоту слова, места сэкономить). Окончания обрезаем, получаем \'попуг\' ;) с этим можно работать, кстати потом еще урежется одна последняя буква и в индекс запишется \'попу\' :)

xcreator:
во ё ...

xcreator:
http://tip.net.au/tip/info/calc-passwd.html
Вот очень ркутая веща которую я нашёл, поставил пароль через неё в .htpasswd и прописав в htaccess защита директории работает :-)

Добавьте ее в след. релиз!

:
Я работаю на Unicode и это

# BIG RUSSIAN LETTERS \\xC0-\\xDF\\xA8 (xA8 - ¨)
# small russian letters \\xE0-\\xFF\\xB8\' (xB8 - ¸)
$page=~s/]+>/ /g;#Strip ALL HTML Tags
$page=~s/&[\\w]+;//g;#Strip ALL HTMLs like <
$page=~tr/A-Z\\xC0-\\xDF\\xA8/a-z\\xE0-\\xFF\\xB8/;#BIG to small

map{$page=~s/$_[^a-z\\xE0-\\xFF\\xB8]/ /g if length($_)>3} @word_ends;#Delete word ends
map($page=~s/[^a-z\\xE0-\\xFF\\xB8]$_[^a-z\\xE0-\\xFF\\xB8]/ /g, @stop_words);#Delete stop words
$page=~s/([-a-z\\xE0-\\xFF\\xB8])\\1+/$1/g;#Delete double symbols
my(@words) = split(/[^-a-z\\d\\xE0-\\xFF\\xB8]+/, $page);#Delete non alphabetic symbols and splite to array
undef $page;
@words=grep{length > 2} @words;#Delete all words from 1 or 2 symbols
my %count=();

ограничивает кодировку. Как его изменит???

Навигация

[0] Главная страница сообщений

[*] Предыдущая страница

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 
Перейти к полной версии