As I Please

MTのいんすとーるの練習と、その他びぼうろく・・・

便利な HTML::TagParse.pm

Encode.pm とのバージョンでハマリまくり。。。pure Perl で動くということで、つられて持ってきて、そこそこに動いていた気がしたけど、どうも漢字変換がおかしい・・・
うーん、まさに、Result:UTF-8 Shift_JIS Shift_JIS UTF-8だったり。がーん。影響でかすぎ、かぁ???
とりあえずパッチあててしのいでます~。

htmlページからの抜き出し例:

my $html= HTML::TagParser->new($fname);
my $title = $html->getElementsByTagName("title"); # title タグ
my $desc = $html->getElementsByName("description"); # meta タグ内の description を対象にしたい

print STDOUT "\"",$title->innerText(),"\"" if ref $title; # の中の値
print STDOUT "\"",$desc->getAttribute("content"),"\"" if ref $desc; # の内容

コメントする