WWW-RobotRules-Parser

| コメント(0) | トラックバック(0)



ちょっと使えると思ったのでとりあえず書いておいた。WWW::RobotRulesは先にUser-Agentを決めてから実行して、そのAgentにマッチするルール以外は全て捨ててしまうが、これはパースした結果をそのまま返すだけだから後で好きなように使える。



use WWW::RobotRules::Parser;


my $p = WWW::RobotRules::Parser->new;


my %r = $p->parse_uri('http://hoge/robots.txt’);



そのうちコレを使うモジュール書く。


Author

Daisuke Maki (a.k.a lestrrat): Perl hacker, Director of Japan Perl Association, YAPC::Asia Tokyo Organizer (2009-2012), Fluent in Japanese, English. Ex-Brazilian (sorta)

#perl #c #ruby #java #mysql #english #japanese #opensource #stf #cooking #scotch #cigar


このエントリーをはてなブックマ
ークに追加

翔泳社よりモダンPerl入門(2010)を出版させていただいております。できれば内容をアップデートしたいので是非皆様・・・現在の在庫処理にお力をお貸しください!><

月別アーカイブ