Daily programming #0039

言語処理100本ノック 2015の#37をやっていく。

第4章: 形態素解析の前提

夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をMeCabを使って形態素解析し,その結果をneko.txt.mecabというファイルに保存せよ.このファイルを用いて,以下の問に対応するプログラムを実装せよ.

なお,問題37, 38, 39はmatplotlibもしくはGnuplotを用いるとよい.

このあたりの記述を参考にMeCab、およびmecab-ipadic-NEologdをインストールし、neko.txt.mecabを作成する。

neko.txt.mecabのサイズが大きいためglot.ioではそのまま実行できないため、第4章は実行結果を記載する方針とする。

37. 頻度上位10語[Golang]

Question

出現頻度が高い10語とその出現頻度をグラフ(例えば棒グラフなど)で表示せよ.

Code

100knock #37

Output

f:id:re3turn:20210209002943p:plain

Gonum Plotは日本語非対応なので棒グラフのラベルは出力されない。

Comment

しばらくできていなかったが今日から再開する。

Gonum Plotというグラフを描画するパッケージを使用した。

使用方法は公式のドキュメント及び先人のコードを参考にした。