use HTML::TokeParser;
my $p = HTML::TokeParser->new("index.html");
if ($p->get_tag("title")){
my $title = $p->get_trimmed_text; # Содержимое <title>
}
while (my $token = $p->get_tag("a")) { # перибираем все <a href>
my $url = $token->[1]{href} || "";
my $text = $p->get_trimmed_text("/a"); # Текст между <a ...> и </a>
}URL:
Обсуждается: http://www.opennet.me/tips/info/456.shtml
Предложенный вариант у меня не сработал, зато сработал вот этот:use HTML::TokeParser;
$p = HTML::TokeParser->new("temp.htm");while ($token = $p->get_tag("a")) {
$url = $token->[1]{href} || "-";
$text = $p->get_trimmed_text("/a");
print "$url\t$text\n";
}