Daily programming #0033
言語処理100本ノック 2015の#31をやっていく。
第4章: 形態素解析の前提
夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をMeCabを使って形態素解析し,その結果をneko.txt.mecabというファイルに保存せよ.このファイルを用いて,以下の問に対応するプログラムを実装せよ.
なお,問題37, 38, 39はmatplotlibもしくはGnuplotを用いるとよい.
このあたりの記述を参考にMeCab、およびmecab-ipadic-NEologdをインストールし、neko.txt.mecabを作成する。
neko.txt.mecabのサイズが大きいためglot.ioではそのまま実行できないため、第4章は実行結果を記載する方針とする。
31. 動詞[Golang]
Question
動詞の表層形をすべて抽出せよ.
Code
Output
$ ./main ../neko.txt.mecab [生れ つか 泣い し いる 始め 見 聞く 捕え 煮]
例として最初から10個分を出力した。
Comment
#30の結果を使えばすぐにできる。
1文ごとになどの指定はないので1つのスライスに格納した。