Автор Тема: Организация поиска на сайте  (Прочитано 7520 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Glum

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 3
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Организация поиска на сайте
« : 05 Мая 2006, 09:51:16 »
Здравствуйте!

Имеется куча файлов *.doc. Передо мной стоит задача организовать поиск по этим файлам. Как правильно это сделать?
Мне всё представляется так. Движок поисковика состоит из двух частей: "индексатор" и скрипт поиска по индексу, взаимодействуют они через MySQL.
Вторая часть будет писаться на PHP (из web-языков он для меня самый понятный), тут в принципе все ясно. А вот на чем можно написать "индексатор" (можно ли это сделать на PHP или в крайнем случае на Delphi?). И каковы основные функции у него должны быть, примерные алгоритмы их решения?

Подскажите, в каком направлении мне двигаться дальше.

Оффлайн CGVictor

  • теперь местный
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2511
  • +0/-0
  • 2
    • Просмотр профиля
    • http://cg.net.ru
Организация поиска на сайте
« Ответ #1 : 05 Мая 2006, 10:57:12 »
Glum
На PHP работать с .doc будет весьма и весьма геморройно. Я бы не стал.
Можно и на Delphi (от языка вообще мало зависит, надо будет или файлы разбирать, или Word.Application юзать).
LJ: Backslashed life (rss)

Оффлайн Glum

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 3
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Организация поиска на сайте
« Ответ #2 : 05 Мая 2006, 17:42:28 »
Пришла идея сначала конвертировать doc в txt и индексировать уже txt, ведь форматирование, картинки и тд тут не важны. Это можно реализовать в Delphi, но это на крайний случай т.к. будет немного неудобно. Можно ли сделать это силами PHP & Perl? Либо может есть готовые утилитки?

Оффлайн alex007

  • Фанат форума
  • Ветеран
  • *****
  • Сообщений: 835
  • +0/-0
  • 0
    • Просмотр профиля
    • http://www.russians-in-london.co.uk/
Организация поиска на сайте
« Ответ #3 : 06 Мая 2006, 01:10:08 »
А не легче ли в датабазу всё переместить и делать поиск используя датабазу.

Или же раскажите как поисковик построить типа Гугла который бы открывал все виды документов и интексировал?
Русские-в-Лондоне. Как они там? Интересно. Инфо (FAQ), Форум и Магазин

Оффлайн Glum

  • Заглянувший
  • Новичок
  • *
  • Сообщений: 3
  • +0/-0
  • 0
    • Просмотр профиля
    • http://
Организация поиска на сайте
« Ответ #4 : 06 Мая 2006, 22:21:15 »
2 alex007
У меня сотни рефератов по которым нужно организовать поиск, считаю нецелесообразным весь текст из них помещать в БД, лучше проиндексировать. Или я не прав?
Основной же мой вопрос к вам, уважаемые, таков: каким образом мне можно программно прочитать doc-файлы или же конвертировать их в txt.
Гугль мне тут асболютно не нужен, и поисковую систему по всему инету я кодить не собираюсь, так что попрошу без сарказма.

Оффлайн CGVictor

  • теперь местный
  • Глобальный модератор
  • Ветеран
  • *****
  • Сообщений: 2511
  • +0/-0
  • 2
    • Просмотр профиля
    • http://cg.net.ru
Организация поиска на сайте
« Ответ #5 : 12 Мая 2006, 09:57:42 »
Glum
На чем сервер? Nix или Win?
LJ: Backslashed life (rss)

Оффлайн Sxandy

  • Новичок
  • *
  • Сообщений: 1
  • +0/-0
    • Просмотр профиля
Re: Организация поиска на сайте
« Ответ #6 : 11 Ноября 2014, 15:29:05 »
Взять дампы документов в html из любой бухгалтерской софтины (1C).

Если интересуют какие-то типовые формы, то можно поискать на klerk.ru, но вот конкретно для счетов и актов, например, я уже любых-произвольных навидался...
Scarlett

Оффлайн Kebebza

  • Новичок
  • *
  • Сообщений: 2
  • +0/-0
    • Просмотр профиля
Re: Организация поиска на сайте
« Ответ #7 : 16 Августа 2019, 10:29:33 »
Это замечательная вещь

Оффлайн oldDantist

  • Новичок
  • *
  • Сообщений: 1
  • +0/-0
    • Просмотр профиля
    • Здоровое окно
Re: Организация поиска на сайте
« Ответ #8 : 30 Сентября 2019, 12:25:52 »
Ничего не понял. но очень интересно

 

Sitemap 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28