Encode.pm とのバージョンでハマリまくり。。。pure Perl で動くということで、つられて持ってきて、そこそこに動いていた気がしたけど、どうも漢字変換がおかしい・・・
うーん、まさに、Result:UTF-8 Shift_JIS Shift_JIS UTF-8だったり。がーん。影響でかすぎ、かぁ???
とりあえずパッチあててしのいでます~。
便利な HTML::TagParse.pm
htmlページからの抜き出し例:
my $html= HTML::TagParser->new($fname);
my $title = $html->getElementsByTagName("title"); # title タグ
my $desc = $html->getElementsByName("description"); # meta タグ内の description を対象にしたい
print STDOUT "\"",$title->innerText(),"\"" if ref $title; #
print STDOUT "\"",$desc->getAttribute("content"),"\"" if ref $desc; # の内容
コメントする