Forum Webscript.Ru
Программирование => Perl => Тема начата: alexxmfk от 28 Апреля 2002, 05:11:55
-
Посоветуйте хороший скрипт поиска по сайту. Чтоб по функциональнее был, да и чтоб бесплатный хостер (Вебсервис) за него не убил.
А то скриптов много, не знаю какой выбрать, желательно посмотреть на него в работе.
-
RiSearch
-
Вот тут посмотри
http://www.comp.hobi.ru/cgi-bin/catalog/show.pl?board=perl&page=1
-
RiSearch
А где его взять то?
Вот тут посмотри
Там много, мне надо что то конкретное, на что в действии посмотреть можно
-
Вот тут посмотри
http://www.comp.hobi.ru/cgi-bin/cat...ard=perl&page=1
ESE, в дальнейшем подобные ссылки буду расценивать как рекламу со всеми вытекающими.
Ссылки на конкретные скрипты в своем каталоге допустимы.
-
Ссылки на конкретные скрипты в своем каталоге допустимы
:) прально, на вебскрипте свой каталог есть:
http://www.webscript.ru/scripts кстати и RiSearch там тоже есть ;)
-
понял не дурак, вот ссылка
http://risearch.org/download/risearch/risearch.zip
зачем-ж так строго?
А вообще у меня там два с половиной скрипта
из них полтора - поисковые :)
:beer:
-
А вообще у меня там два с половиной скрипта
из них полтора - поисковые
Я видел.:)) Но все-таки получается реклама каталога, чем помощь спрашивающему в поиске конкретного скрипта.:))
-
Спасибо всем огромное.
Но у меня вопрос: а вебсервис.ру за него не убьёт? И вообще как сильно он сервер напрягает?
а где можно взглянуть на него в действии?
-
alexxmfk, не убьёт, не напрягает, http://bukinist.agava.ru/
-
alexxmfk, не убьёт, не напрягает
А я бы запятые немного иначе раставил... :)
Дело в том, что при индексации большого количества страниц он сильно грузит сервер, да и времени занимает немало. Хотя это все в документации написано. Как совет-запускать его cron-ом часа в 2 ночи...
-
Индексация сайта в 60 страниц заняла около 1-2 секунд.
Так-что сервер оно не очень-то напрягает.Для огромных
сайтов 1000 и более страниц может быть и да а так для простой хоме пейдж ничего. Скрипт действительно стоящий!
На вебсервис ру не будет работать паук но он в принципе и не нужон!
-
>>он сильно грузит сервер, да и времени занимает немало
Это не совсем так. На локальной машине он индексирует со скоростью порядка 20-30 Мб в минуту. Вполне приемлимая скорость. А вот памяти может потребоваться очень много. Тут конечно подразумеваются не маленькие сайты с 1000 страниц, а средние - 10000-20000 страниц. Для более крупных сайтов можно попробовать RiFlex.
PS Чтобы не напрягать сервер, можно индексировать на локальной машине. И паука тоже можно запускать на локальной машине.
-
Индексировал я сайт на локалке, время на индексацию 26 мб ушло примерно 3-4 сек. (http://mfk.net.ru)
Только проблемка получилась... пришлось убрать дискриптион, т.к. в нём отображалось везде одно и тоже, текст начиная с самого начала страницы (Machines For Kill - mfk.net.ru navigation и и.д.), а до начала контента не доходит....
-
>>на индексацию 26 мб ушло примерно 3-4 сек
В это мне почему-то не очень верится. Может тут учтена не только текстовая информация.
А для решения проблемы с навигацией и описанием страницы было сделано выборочное индексирование, которое позволяет вырезать навигацию перед индексацией.
-
В это мне почему-то не очень верится. Может тут учтена не только текстовая информация.
Да нет, вроде только текстовая, да и комп не слабый. А что это много?
А для решения проблемы с навигацией и описанием страницы было сделано выборочное индексирование, которое позволяет вырезать навигацию перед индексацией.
А какже такое сделать можно? Очень нужно !!! Я не нашёл... :(
сенькс заранее
-
==============================================
$use_selective_indexing = "NO"; - данная опция полезна при индексировании больших сайтов со сложной навигацией, новостными колонками и прочими элементами дизайна, которые появляются почти на каждой странице сайта и не должны индексироваться. Она позволяет указать индексирующему скрипту фрагменты кода, которые должны быть вырезаны в процессе анализа страницы. Для этого необходимо включить эту опцию ("YES") и раскомментировать нижеследующие строки в "config.pl".
%no_index_strings = (
q[] => q[],
q[] => q[],
);
Внутри квадратных скобок необходимо указать две строки. Все, что находится в индексируемом файле между этими строками, будет вырезано (учтите, что если данные строки встречаются несколько раз, будет обработан каждый случай). В HTML файлах для этих целей можно использовать специальные метки, которые разделяют элементы дизайна (либо любые строки, которые однозначно определяют нужное место).
==============================================
Не знаю, как это можно не найти. Разве что совсем документацию не читать.