Разное > Флейм

по-настоящему мощый поиск...

<< < (3/5) > >>

ThE0ReTiC:
commander
пока нет.

USE:

--- Цитировать ---ThE0ReTiC:
PHP - 1000 слов/сек Perl - 7000 слов/сек
--- Конец цитаты ---

это скорость поиска по словарю.
ты недочитал вопроса.

Работа поисковой системы с ипользованием словаря словоформ, мне показалась удовлетворительной, если брать во внимание следующие данные:
1. объем индексируемой информации - 10-12 Мб
2. поисковый бот написан на Perl
3. поисковая машина на PHP
4. хранение данных в СУБД MySQL
По поводу быстродействия, могу сказать, что работа поисковой системы занимала не много не мало, а от 0,01 до 0,2 секунды в зависимости от количества результатов, загружености, конечно же количества слов в запросе.

по поводу количества слов в запросе: в Стокгольмском университете Д.Карлгрен и К.Франзен проводили небольшой эксперимент над студентами. Брали две группы студентов и один и тот же сайт с двумя версиями поиска, на одном было маленькое поле ввода текста, а в другом большое. так результаты показали следующее: первая группа вводила в среднем 2,8 слова, а вторая 3,2. что в свою очередь говорит о том, что в среднем ищут 3 слова.


--- Цитировать ---ThE0ReTiC:
словоформенный поиск подошел бы либо для больших (!) библиотек либо для большик поисковых систем
--- Конец цитаты ---

подошел бы. но некоторые компании не имеют даже нормального с использованием ранжирования страниц, учетом релевантности слов и т.п. зато как приятно, когда ты заходишь на сайт, ищешь, и система выдает результаты, которые тебя устраивают и в результатах есть какой-то смысловой порядок.

скажем на сайте кенон поиск написан на ПХП. работает, но работает криво и странно.


--- Цитировать ---ThE0ReTiC:
и там и там врядли используются скриптовые языки и обыкновенный хостинг (по крайней мере на яндексе точно не на перле написано)
--- Конец цитаты ---

понимаю. но я говорю о небольшом сайте, на котором есть контент, который ищут. почему нельзя этот поиск сделать таким, чтобы получать удовольствия от этого процесса ;-) (о затратах я, конечно, не говорю)

USE:

--- Цитировать ---commander:
В больших поисковых системах
--- Конец цитаты ---

я сомневаюсь, что кто-то собирается писать большую поисковую систему. хотите переплюнуть гугл?

--- Цитировать ---commander:
это комерческая тайна
--- Конец цитаты ---

:-))) чья комерческая тайна? компанию назови. или это тоже тайна?

ThE0ReTiC:

--- Цитировать ---USE:
это скорость поиска по словарю.
--- Конец цитаты ---

значит реальная скорость поиска будет еще меньше

--- Цитировать ---USE:
о затратах я, конечно, не говорю
--- Конец цитаты ---

так милок в них все и упирается.
как по-твоему, если человек делает сайт за 500 уе он будет платить еще 1500 за подобный минияндекс?
на бывает неразрешимых задач.
бывает недостаточное финансирование и недостаточные сроки на реализацию.

USE:

--- Цитировать ---commander:
Проблемма в том, что вместо одного слова алгоритм должен прогнать поиск по 5 - 50 словам
--- Конец цитаты ---

это ж когда надо по 50 словах?

Навигация

[0] Главная страница сообщений

[#] Следующая страница

[*] Предыдущая страница

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 
Перейти к полной версии