Daily Programming #0007

言語処理100本ノック 2015の#05をやっていく。

05. n-gram [Golang]

Question

与えられたシーケンス(文字列やリストなど)からn-gramを作る関数を作成せよ. この関数を用い,"I am an NLPer"という文から単語bi-gram,文字bi-gramを得よ.

n-gramとは?

「N文字インデックス法」「Nグラム法」などともいう。検索対象を単語単位ではなく文字単位で分解し、後続の N-1 文字を含めた状態で出現頻度を求める方法。Nの値が1なら「ユニグラム(英: uni-gram)」、2なら「バイグラム(英: bi-gram)」、3なら「トライグラム(英: tri-gram)」と呼ばれる。出典: Wikipedia

Code

スライスをそのまま出力するだけだとスペース含まれてる部分がちょっと見づらくなっちゃうな・・・