Forum Webscript.Ru

Программирование => Perl => Тема начата: Jan от 12 Февраля 2002, 00:36:50

Название: Скрипт поиска
Отправлено: Jan от 12 Февраля 2002, 00:36:50
Посоветуйте пожалуйста скрипт поиска по сайту.
Заранее спасибо - Дмитрий.
Название: Скрипт поиска
Отправлено: Dm от 12 Февраля 2002, 00:56:43
http://www.hotscripts.com/
на свой вкус можно подобрать.

еще поисковая система:
http://www.mnogosearch.ru/
Название: Скрипт поиска
Отправлено: ЖеньКа от 12 Февраля 2002, 03:15:26
А может вот тут что есть? http://www.woscripts.com/cgi-bin/phps/wocatalog.cgi?act=goto&category=Поиск
Название: Скрипт поиска
Отправлено: Flash от 13 Февраля 2002, 11:45:36
Нее, на мой скромный взгляд-risearch-cool
Название: Скрипт поиска
Отправлено: Dm от 13 Февраля 2002, 21:58:54
Поисковая система должна полностью соответствовать проекту (его сложность, объемы и т.п.).
Плюс кому, что по душе :)
Название: !!!!
Отправлено: rafael от 01 Марта 2002, 20:18:29
Посмотри на MyScripts.ru там точно есть!
Название: Скрипт поиска
Отправлено: Dm от 01 Марта 2002, 20:33:07
ну если уже пошла реклама, тогда еще
http://www.cgi.ru
http://www.phpheaven.net
http://www.phpbuilder.com
http://www.hotscripts.com/PHP/
http://php.resourceindex.com
Название: Скрипт поиска
Отправлено: alesh от 13 Марта 2002, 15:24:38
Рисерч однозначно для малых сайтов прекрасен!
Название: Скрипт поиска
Отправлено: Jan от 13 Марта 2002, 15:32:07
2 alesh
Побовал, но он слижком уж долги индексирует и лезут по ссылам туда, куда не надо (хотя я это ему и запрещал) + видит мёртвые (неиспользуемые) папки.
Да сорри всем - забыл добавить, что хост - локальный комп. с установленной системой на WinXP Co Edit + Apache 1.3... eng + Php 4.11 + MySQL 4...
Название: Скрипт поиска
Отправлено: alesh от 13 Марта 2002, 15:36:58
Сходю вот сюда (http://www.infocity.kiev.ua/inet/content/inet167.phtml?id=2090)
Вроде подойдет...
Название: Скрипт поиска
Отправлено: от 14 Марта 2002, 03:08:31
>>Побовал, но он слижком уж долги индексирует

У меня он 100 Мб за 3-4 минуты индексирует. Нужели это медленно? А если индексировать с помощью spider.pl, то не исключено, что узкое место вовсе не в индексаторе. Сколько там страниц всего? И общий объем информации.

>>лезут по ссылам туда, куда не надо

Скорее всего в конфиге что-то неправильно.

>>видит мёртвые (неиспользуемые) папки

Да как же он различит, какие папки "живые" а какие "мертвые". Это в конфиге надо прописывать.
Название: Скрипт поиска
Отправлено: Dm от 14 Марта 2002, 17:29:51
параллельно вопрос:
кто на каких тачках индексировал?
Название: Скрипт поиска
Отправлено: Jan от 15 Марта 2002, 01:03:15
P3-866 512Mb SD-RAM ASUS CSL-2C Geforce4 128DDRAM
WinXP Co Edit + Apache 1.3... eng + Php 4.11 + Perl 5.5 + MySQL 4...
Название: Скрипт поиска
Отправлено: от 15 Марта 2002, 01:26:04
У меня Athlon 1.4, но не в этом дело. Ну будет там не 4 минуты, а 10, это не принципиально. Если я правильно понял, то индексируется динамический сайт, а в этом случае надо еще учитывать скорость соединения (если сайт удаленный) и скорость работы скриптов на сайте.
Название: Скрипт поиска
Отправлено: Dm от 15 Марта 2002, 01:56:21
кстати, можно попробовать протестировать ApacheBenchmark\'ом (ab), чтобы выяснить скорость обработки/коннекта.
Название: Скрипт поиска
Отправлено: Jan от 18 Марта 2002, 10:30:43
Цитировать
надо еще учитывать скорость соединения (если сайт удаленный)

Сайт находится на моём компе, поэтому скорость соединения я не учитываю, т.к. = 0 :)
Название: Скрипт поиска
Отправлено: Dm от 18 Марта 2002, 20:10:44
вот именно, 0! ;)
все-таки нужно производительность web-сервера проверить.
возможно, плохо написанные скрипты могут тормозить процесс индексирования.
Название: Скрипт поиска
Отправлено: от 19 Марта 2002, 01:08:34
Небольшой тест. Динамического сайта у меня нет, поэтому проверялось на статике. 837 файлов, 40 Мб (много больших текстовых файлов).

При индексации напрямую с диска - 1 мин 37 сек
При индексации через вебсервер - 2 мин 00 сек

То есть, даже в этом случае (совсем немного статических файлов) запрос файлов через вебсервер (локальный) занимает значительно больше времени. Естественно, при индексировании динамического сайта разница может быть в несколько раз больше.

ЗЫ Я сомневаюсь, что другие скрипты будут быстрее. Разве что Яндекс купить...
Название: Скрипт поиска
Отправлено: Jan от 19 Марта 2002, 02:36:15
2 RiSearcher
Всё было бы хорошо, но мой ресурс (http://www.allspy.host.sk) обновляется каждый день. В контенте сайта сотни ссылок на другие ресурсы. И, мне так кажется, что spider лезет по всем ссылкам :(
А особенно это касается форума. (http://www.allspy.d2g.com)
Название: Скрипт поиска
Отправлено: от 19 Марта 2002, 02:54:42
Еще раз говорю: не должен он лезть на другие ссылки. Либо конфиг на мыло, с подробным описанием проблемы. Иначе это все бессмысленный разговор. Если там есть глюк, то нужно указать, при каких именно параметрах он проявляется, иначе я не могу его исправить, потому что у меня этого глюка не наблюдается.
Название: Скрипт поиска
Отправлено: Green Kakadu от 19 Марта 2002, 03:12:52
Цитировать
ЗЫ Я сомневаюсь, что другие скрипты будут быстрее. Разве что Яндекс купить...

это точно.
похоже этот топик пора в CGI переносить (и вроде бы, по Risearch что-то аналогичное было - тоже проблема была в том, что в конфиге что-то неверно прописали)