Mecabマンセー

| コメント(0) | トラックバック(0)



日本語の読みを一瞬で抽出:



use Mecab;
my $string = "....";
my $m = Mecab::Tagger->new;
for (my $n = $m->parseToNode($string); $n; $n = $n->{next}) {
next unless $n->{surface};
my $y = (split(/,/, $n->{feature}))[7];
$yomi .= $y ? $y : $n->{surface};
}
print $yomi, "\n";

しかも速っ!惜しむらくはインターフェース的にIteratorにしてくれるといいなぁ、という感じ。


Author

Daisuke Maki (a.k.a lestrrat): Perl hacker, Director of Japan Perl Association, YAPC::Asia Tokyo Organizer (2009-2012), Fluent in Japanese, English. Ex-Brazilian (sorta)

#perl #c #ruby #java #mysql #english #japanese #opensource #stf #cooking #scotch #cigar


このエントリーをはてなブックマ
ークに追加

翔泳社よりモダンPerl入門(2010)を出版させていただいております。できれば内容をアップデートしたいので是非皆様・・・現在の在庫処理にお力をお貸しください!><

月別アーカイブ