Daily programming #0045
言語処理100本ノック 2015の#43をやっていく。
第5章: 係り受け解析
夏目漱石の小説『吾輩は猫である』の文章(neko.txt)をCaboChaを使って係り受け解析し,その結果をneko.txt.cabochaというファイルに保存せよ.このファイルを用いて,以下の問に対応するプログラムを実装せよ.
このあたりの記述を参考にCaboChaをインストールし、neko.txt.cabochaを作成する。
neko.txt.cabochaのサイズが大きく、glot.ioではそのまま実行できないため、第5章は実行結果を記載する方針とする。
43. 名詞を含む文節が動詞を含む文節に係るものを抽出[Golang]
Question
名詞を含む文節が,動詞を含む文節に係るとき,これらをタブ区切り形式で抽出せよ.ただし,句読点などの記号は出力しないようにせよ.
Code
Output
$ ./main ../neko.txt.cabocha どこで 生れた かとんと つかぬ 見当が つかぬ した所で 泣いて いた事だけは 記憶している 吾輩は 見た ここで 始めて ものを 見た <以下省略>
Comment
名詞を含む文節が動詞を含む文節に係るとは
名詞を含む文節
が動詞を含む文節
を装飾していること
つまり以下になっているものを抽出する
名詞を含む文節 動詞を含む文節