Forum Webscript.Ru
Программирование => Perl => Тема начата: Jan от 12 Февраля 2002, 00:36:50
-
Посоветуйте пожалуйста скрипт поиска по сайту.
Заранее спасибо - Дмитрий.
-
http://www.hotscripts.com/
на свой вкус можно подобрать.
еще поисковая система:
http://www.mnogosearch.ru/
-
А может вот тут что есть? http://www.woscripts.com/cgi-bin/phps/wocatalog.cgi?act=goto&category=Поиск
-
Нее, на мой скромный взгляд-risearch-cool
-
Поисковая система должна полностью соответствовать проекту (его сложность, объемы и т.п.).
Плюс кому, что по душе :)
-
Посмотри на MyScripts.ru там точно есть!
-
ну если уже пошла реклама, тогда еще
http://www.cgi.ru
http://www.phpheaven.net
http://www.phpbuilder.com
http://www.hotscripts.com/PHP/
http://php.resourceindex.com
-
Рисерч однозначно для малых сайтов прекрасен!
-
2 alesh
Побовал, но он слижком уж долги индексирует и лезут по ссылам туда, куда не надо (хотя я это ему и запрещал) + видит мёртвые (неиспользуемые) папки.
Да сорри всем - забыл добавить, что хост - локальный комп. с установленной системой на WinXP Co Edit + Apache 1.3... eng + Php 4.11 + MySQL 4...
-
Сходю вот сюда (http://www.infocity.kiev.ua/inet/content/inet167.phtml?id=2090)
Вроде подойдет...
-
>>Побовал, но он слижком уж долги индексирует
У меня он 100 Мб за 3-4 минуты индексирует. Нужели это медленно? А если индексировать с помощью spider.pl, то не исключено, что узкое место вовсе не в индексаторе. Сколько там страниц всего? И общий объем информации.
>>лезут по ссылам туда, куда не надо
Скорее всего в конфиге что-то неправильно.
>>видит мёртвые (неиспользуемые) папки
Да как же он различит, какие папки "живые" а какие "мертвые". Это в конфиге надо прописывать.
-
параллельно вопрос:
кто на каких тачках индексировал?
-
P3-866 512Mb SD-RAM ASUS CSL-2C Geforce4 128DDRAM
WinXP Co Edit + Apache 1.3... eng + Php 4.11 + Perl 5.5 + MySQL 4...
-
У меня Athlon 1.4, но не в этом дело. Ну будет там не 4 минуты, а 10, это не принципиально. Если я правильно понял, то индексируется динамический сайт, а в этом случае надо еще учитывать скорость соединения (если сайт удаленный) и скорость работы скриптов на сайте.
-
кстати, можно попробовать протестировать ApacheBenchmark\'ом (ab), чтобы выяснить скорость обработки/коннекта.
-
надо еще учитывать скорость соединения (если сайт удаленный)
Сайт находится на моём компе, поэтому скорость соединения я не учитываю, т.к. = 0 :)
-
вот именно, 0! ;)
все-таки нужно производительность web-сервера проверить.
возможно, плохо написанные скрипты могут тормозить процесс индексирования.
-
Небольшой тест. Динамического сайта у меня нет, поэтому проверялось на статике. 837 файлов, 40 Мб (много больших текстовых файлов).
При индексации напрямую с диска - 1 мин 37 сек
При индексации через вебсервер - 2 мин 00 сек
То есть, даже в этом случае (совсем немного статических файлов) запрос файлов через вебсервер (локальный) занимает значительно больше времени. Естественно, при индексировании динамического сайта разница может быть в несколько раз больше.
ЗЫ Я сомневаюсь, что другие скрипты будут быстрее. Разве что Яндекс купить...
-
2 RiSearcher
Всё было бы хорошо, но мой ресурс (http://www.allspy.host.sk) обновляется каждый день. В контенте сайта сотни ссылок на другие ресурсы. И, мне так кажется, что spider лезет по всем ссылкам :(
А особенно это касается форума. (http://www.allspy.d2g.com)
-
Еще раз говорю: не должен он лезть на другие ссылки. Либо конфиг на мыло, с подробным описанием проблемы. Иначе это все бессмысленный разговор. Если там есть глюк, то нужно указать, при каких именно параметрах он проявляется, иначе я не могу его исправить, потому что у меня этого глюка не наблюдается.
-
ЗЫ Я сомневаюсь, что другие скрипты будут быстрее. Разве что Яндекс купить...
это точно.
похоже этот топик пора в CGI переносить (и вроде бы, по Risearch что-то аналогичное было - тоже проблема была в том, что в конфиге что-то неверно прописали)