Forum Webscript.Ru
Программирование => PHP => Тема начата: zuko от 24 Мая 2006, 12:44:24
-
Подскажите, плиз, можно ли силами PHP искать текст в PDF-файлах. Хотелось бы, чтобы результатом поиска были номера страниц в файле и отрывки текста из файле, где найдны искомые слова.
Может вариант сложный, тупиковый или есть попроще, но я уже чего-то нарыл в инете (буквально мизер). Из сайта Adobe стянул Adobe PDF IFilter. На сайте о нем говорят:
Adobeᆴ PDF IFilter is designed for technically savvy users or administrators who wish to index Adobe PDF documents with Microsoft indexing clients. This allows the user to easily search for text within Adobe PDF documents.
Может кто подскажет, как пользоваться "Microsoft indexing clients"?
Из документации к ПХП я понял, что функции ПХП могут только создавать ПДФ...
-
на PHP не сделаешь. была похожая ситуация, директор стучал ножками об оп пол и хотел видеть статистику разговоров по офису по мобильникам по WAP-там отчОты в PDF были..единственный способ который я нашел-это конвертация в текст или CSV и последущая их обработка :) так что вот так
-
reLax[0x00]:
...единственный способ который я нашел-это конвертация в текст или CSV и последущая их обработка так что вот так
Я думал о таком варианте, но одно дело периодически составлять статистику, а другое дело ждать по полчаса (размер всех файлов документации несколько гектаров) результатов поиска.
А кто-нить подскажет о индексации файлов?