オフコース時代の小田和正の歌詞のテキスト解析

オフコース時代の小田和正の歌詞のテキスト解析をしてみました。

基本的にMATLABのAnalyze Japanese Text Dataに沿っています。

87曲の歌詞のテキストを使用しました。一番大変なのが、歌詞を集めてくることかも知れませんね。

品詞を区別しない場合

ひとまずざっくりWord Cloudを表示させてみるとこんな感じです:

なんと「君」が多いようです。「もう」「ふたり」「ことば」もかなり多そうですね。

名詞

では名詞はどんな語が多く使われているでしょうか…。

「愛」「心」がやたらと多いようです。これは確かにそうでしょうね。

「ふたり」「涙」「ひとり」「夜」「世界」と、まあ聴いた印象とあまり離れていないように思います。

形容詞

次は形容詞。

「いい」「哀しい」「やさしい」がトップ3。

「切ない」「甘い」「若い」「新しい」が続くようです。以前から「切ない」は多い印象でしたが、実際多いのですね。

動詞

動詞はというと…:

「消える」が一番多いのですね。「生きる」「愛す」「流す」「流れる」「信じる」「ゆく」「抱く」「忘れる」「終わる」など、小田ワールドという感じはしますね。

代名詞

最後は代名詞。

「君」と「僕(ぼく)」ばかりのようです。「俺」や「おまえ」はないです。これが鈴木康博だったら「俺」が多そうですね。

おわりに

1970年代、1980年代、1990年代など時期を区切るとさらに面白いかも。

他の人の詞の傾向も興味があるので、歌詞が集ったらまたやるかも知れません。