Forum Webscript.Ru
Программирование => Perl => Тема начата: perl81 от 24 Апреля 2006, 17:46:10
-
Привет.
задача:
Есть html файл, нужно вытащить все названия ссылок.
для примера есть :
лучшая девушка в СССР
надо получить : лучшая девушка в СССР
В сторону какого модуля копать? думаю что то вроде HTTP::Parser или HTML::LinkExtor?? или неправ?
-
@all_name_links = $content =~ m%(.+?)%ig;
-
use HTML::TokeParser;
my $p = HTML::TokeParser->new("index.html");
if ($p->get_tag("title")){
my $title = $p->get_trimmed_text; # Содержимое
}
while (my $token = $p->get_tag("a")) { # перибираем все
my $url = $token->[1]{href} || "";
my $text = $p->get_trimmed_text("/a"); # Текст между и
}