Программирование > Perl
Parsing HTML-файла
(1/1)
Bazzilic:
Задача стоит следующая: есть большое количество однотипных html-страниц, содержащих информацию типа той, что хранится на афише.ру, т.е. всякие музеи, выставки, театры, достопримечательности и т.д. Надо извлекать оттуда инфу, т.е. очистить от html-кода и определить, что есть что.
Ну и в связи с этим вопросы:
[*] Не сталкивался ли кто-нибудь с такой задачей, и если сталкивался, то как решал?
[*] Какой есть модуль для качественного разбора html-файлов? Я использовал HTML::Parser, но он зачем-то использует многопоточность, что вызывает больше проблем, чем решает.
[/list]
Навигация
Перейти к полной версии