Разное > Флейм
по-настоящему мощый поиск...
Sniper:
Делал недавно поиск к сайту.
Он, значит ищет все вхождения строки в базе и в файлах.
НО..... Он также ищет вхождения и в словах, не имеющих отношения к искомому слову.
Например:
ищу "сталь"
Результаты:
"сталь", "стальной" и т.д.
И там же остальной, хрустальной.
А как бы сделать поиск с учетом словоформ, чтобы в результатах были все формы слова "сталь":
"сталь", "стали", сталью?
Яндекс так ищет.
Сразу прихдит в голову логичная, но совсем не практичная мысль.
На Яндексе есть некий словарь словоформ.
И каждый раз при поиске он все искомые слова он прогоняет по этому словарю,
ищет там вхождения и ищет эти словоформы в сети.
Не практичная эта мысль потому, что словарь хотя бы (русский) толковый словарь с буквами
от "А", до (например) "П", перенести из комнаты в комнату за один раз в одиночку не получится.
Так там не все словоформы, там существительное, в им. падеже, в ед. числе, без склонений.
Так, что если бы было так как я преполагаю, сервер яндекса "стал" бы при первом же поиске.
USE:
ищи в интернете. уже существуют словари словоформ, некоторые даже бесплатно раздают. у ресерчера есть кажется какая-то разработка по этому поводу: словарь и класс на ПХП для поиска по нему.
http://www.risearch.org
commander:
Sniper
Если хочешь серьездный поиск организонать, то придеться писать модуль перевода слова во все словоформы... Проблемма в том, что вместо одного слова алгоритм должен прогнать поиск по 5 - 50 словам... А если введено предложение то все слова в этом пердложении придеться прогонять через этот модуль... В связи с этим встает вопрос о том, что обычные БД для этого не годяться... так же для этого не годиться и PHP... поскольку скорость оставит желать лучшего...
Совет: Если у тебя поиск по одному сайту... то не стоит даже вникать в эту проблемму - утонешь... :) пользуй оператор LIKE и радуйся жизни... :)
USE:
commander почитай, например, http://www.risearch.org/rus/rumor/index.html и не гони.
commander:
--- Цитировать ---USE
и не гони.
--- Конец цитаты ---
оргументируй...
Навигация
Перейти к полной версии