ThE0ReTiC:
PHP - 1000 слов/сек Perl - 7000 слов/сек
это скорость поиска по словарю.
ты недочитал вопроса.
Работа поисковой системы с ипользованием словаря словоформ, мне показалась удовлетворительной, если брать во внимание следующие данные:
1. объем индексируемой информации - 10-12 Мб
2. поисковый бот написан на Perl
3. поисковая машина на PHP
4. хранение данных в СУБД MySQL
По поводу быстродействия, могу сказать, что работа поисковой системы занимала не много не мало, а от 0,01 до 0,2 секунды в зависимости от количества результатов, загружености, конечно же количества слов в запросе.
по поводу количества слов в запросе: в Стокгольмском университете Д.Карлгрен и К.Франзен проводили небольшой эксперимент над студентами. Брали две группы студентов и один и тот же сайт с двумя версиями поиска, на одном было маленькое поле ввода текста, а в другом большое. так результаты показали следующее: первая группа вводила в среднем 2,8 слова, а вторая 3,2. что в свою очередь говорит о том, что в среднем ищут 3 слова.
ThE0ReTiC:
словоформенный поиск подошел бы либо для больших (!) библиотек либо для большик поисковых систем
подошел бы. но некоторые компании не имеют даже нормального с использованием ранжирования страниц, учетом релевантности слов и т.п. зато как приятно, когда ты заходишь на сайт, ищешь, и система выдает результаты, которые тебя устраивают и в результатах есть какой-то смысловой порядок.
скажем на сайте кенон поиск написан на ПХП. работает, но работает криво и странно.
ThE0ReTiC:
и там и там врядли используются скриптовые языки и обыкновенный хостинг (по крайней мере на яндексе точно не на перле написано)
понимаю. но я говорю о небольшом сайте, на котором есть контент, который ищут. почему нельзя этот поиск сделать таким, чтобы получать удовольствия от этого процесса ;-) (о затратах я, конечно, не говорю)