Forum Webscript.Ru

Программирование => Perl => Тема начата: Alex V. White от 18 Июля 2005, 17:35:01

Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 18 Июля 2005, 17:35:01
Читаю Перл скриптом файл новостей rss.xml
есть файл с новостями:


-
-
Обком
http://obkom.net.ua
Обком, интернет-газета
-
http://obkom.net.ua/export/obkom.gif
Обком, интернет-газета
http://obkom.net.ua

-
На Луганщине врачи "Скорой помощи" митингуют против грибов
http://obkom.net.ua/news/2005-07-18/1055.shtml?rss
Новости Украины
Mon, 18 Jul 2005 10:55:50 +0300
В Лисичанске (Луганская область) организован агитрейд машин "Скорой помощи" против употребления в пищу дикорастущих грибов.

-
Ющенко положил вето на депутатские поруки
http://obkom.net.ua/news/2005-07-18/1046.shtml?rss
Новости Украины
Mon, 18 Jul 2005 10:46:02 +0300
Президент Украины Виктор Ющенко применил право вето на закон о взятии на поруки депутатами любого человека, содержащегося под стражей.


и т.д.

как мне захватить только то, что находится месту тегами ?
т.е. служебная инфа, как то название издания и прочее мне не нужна.

вот код:

if (m,(.*),) { # ВОТ ТУТ ГРАБЛИ И ЕСТЬ, как корректно написать эту строку?

if (m,(.*),) {
$title=$1;
}

if (m,(.*),) {
$link=$1;
}

if (m,(.*),) {
$pubDate=$1;
}

if (m,(.*),) {
$description=$1;
# тут делаем с данными что надо
}

}

спасибо!
Название: импорт новостей из XML - Регулярные выражения
Отправлено: ondr от 18 Июля 2005, 17:41:46
мдя... %))

http://search.cpan.org/search?query=rss&mode=all
http://search.cpan.org/search?query=xml&mode=all
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 18 Июля 2005, 17:54:00
однако!
сейчас попробую разобраться
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 18 Июля 2005, 18:37:15
много там всего интересного)
можно в кокретный модуль (желательно из стандартной поставки) пальцем ткнуть - время давит(((((((
Спасибо!
Название: импорт новостей из XML - Регулярные выражения
Отправлено: NeoNox от 18 Июля 2005, 18:53:09
XML::RSS::Parser. Нет в стандартной поставке.
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 18 Июля 2005, 18:59:36
я так и думал))))))))))
тогда подскажите с регулярным выражением
Название: импорт новостей из XML - Регулярные выражения
Отправлено: NeoNox от 18 Июля 2005, 19:12:42
perldoc re
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Green Kakadu от 19 Июля 2005, 18:23:28
Цитировать
Alex V. White:
тогда подскажите с регулярным выражением

не самое благодатное дело парсить rss регулярными выражениями, лучше все-таки воспользоваться XML::RSS::Parser потому как если вы посмотрите описание стандарта rss 0.91, 0.92, 1.0, 2.0 то увидите, что это штука весьма неоднозначная
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 19 Июля 2005, 19:04:00
спасибо!
толковый мануал (желательно на русском) по этому делу не подскажите?

еще раз спасибо!
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Green Kakadu от 20 Июля 2005, 02:15:44
Цитировать
Alex V. White:
спасибо! толковый мануал (желательно на русском) по этому делу не подскажите?

http://blogs.law.harvard.edu/tech/rss
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Alex V. White от 20 Июля 2005, 11:36:18
я имел в виду мануал по XML::RSS::Parser
Название: импорт новостей из XML - Регулярные выражения
Отправлено: Green Kakadu от 20 Июля 2005, 12:22:27
Цитировать
Alex V. White:
я имел в виду мануал по XML::RSS::Parser

POD документация.
Книжка издательства Oreilly Perl&XML (продается русская, там правда про RSS немного, но вполне достаточно всего остального), английскую версию книги вполне реально найти в электронном виде.