Product

学校の講義や研究、また趣味で作ったものまで紹介していきます。

歌詞から曲の印象を分類する機械学習プログラム

2017-07-27

説明

 ウェブインテリジェンス特論という講義の最終課題で、歌詞から曲の印象を分類する機械学習プログラムを作りました。手法として、まず印象がユーザの投票で共有されている歌詞共有サイトhttp://utaten.com/から、曲の印象(友情・感動・恋愛・元気)を頑張ってスクレイピングしてきてました。ここではそれぞれの印象に対して50曲準備しときました。次に得られた曲の歌詞を形態素解析して単語に分解し、文書ベクトルを作成しました。ここで得られた文書ベクトルと曲の印象を機械学習することによって、曲が4つの印象の中でどれが一番当てはまるかという予測をすることにしました。結果としてはF値が0.3とかで精度はあまりよくありませんでした....。

 悪かった原因として、今回は歌詞の全部を利用しているので色々な単語があらわれすぎて過学習してしまっていることなどが考えられます。したがって今後は歌詞の特徴的な単語(TF-IDF値など)を見るべきなのではないかなと考えています。

使用した言語

Python

関連リンク