URL: https://www.opennet.me/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 16438
[ Назад ]

Исходное сообщение
"Раздел полезных советов: Как на Perl правильно выделить все A HREF ссылки из HTML файла."

Отправлено auto_tips , 15-Июн-06 16:23 
use HTML::TokeParser;
my $p = HTML::TokeParser->new("index.html");
if ($p->get_tag("title")){
   my $title = $p->get_trimmed_text; # Содержимое <title>
}
while (my $token = $p->get_tag("a")) {  # перибираем все <a href>
   my $url = $token->[1]{href} || "";
   my $text = $p->get_trimmed_text("/a"); # Текст между <a ...> и </a>
}

URL:
Обсуждается: http://www.opennet.me/tips/info/456.shtml


Содержание

Сообщения в этом обсуждении
"Как на Perl правильно выделить все A HREF ссылки из HTML файла."
Отправлено Igor , 15-Июн-06 16:23 
Предложенный вариант у меня не сработал, зато сработал вот этот:

use HTML::TokeParser;
$p = HTML::TokeParser->new("temp.htm");

  while ($token = $p->get_tag("a")) {
      $url = $token->[1]{href} || "-";
      $text = $p->get_trimmed_text("/a");
      print "$url\t$text\n";
  }