More Related Content
More from Itaru Otomaru (9)
勉強会資料 トピック紹介「音楽と機械学習」
- 6. 教師あり学習 | ジャンル・ムード・印象認識
• 音楽音響信号をあらかじめ定められた複数のクラスのいずれかに分
類することは、教師あり学習の最も典型的な問題
– ジャンル・ムード・印象 etc.
VA空間: 横軸がValence(Negative-Positive),
縦軸がArousal (Silent-Energetic) を示してお
り、これらの組み合わせで様々な印象を表
現する。
- 7. 教師あり学習 | ジャンル・ムード・印象認識
• 通常の学習に基づく分類と同様、特徴量抽出と特徴量識別という2
つのステップから構成されている。
• 用いられる特徴量:
– メル周波数ケプストラム係数(MFCC):
人間の知覚特性(低いところはよく分かる、高いところは大雑把)を考慮して
算出されたスペクトラムの概形。12次元程度のベクトル。
– 低レベル特徴量:
zero-crossing rate(音声の波形を描いたときに、波が0をまたぐ頻度をカウント
したもの)
- 9. 教師あり学習 | 和音推定
• ルート音12種類と和音タイプ(major or minor)の2種類の組み合わ
せに対し、無音などの非和音を含め、2×12+1 = 25 クラスの分類問
題
• 和音推定でも、DNNの利用が進められている
• スペクトル系列を入力し、和音系列を直接出力するような再帰型
ニューラルネットワーク(RNN) を学習する試みもなされている
- 10. 教師なし学習 | 自動採譜
• 現状の(学習に基づかないアプローチとして)、一般的には、非負
値行列因子分解(NMF)が使用されている。
– しかし、得られる譜面自体の良さを評価する仕組みがないため、音楽として不
自然な配置が頻発する問題があった。
http://www.slideshare.net/NAIST_IS/div
ergence-optimization-based-on-
tradeoff-between-separation-and-
extrapolation-abilities-in-
superresolutionbased-nonnegative-
matrix-factorization/2
- 11. 教師なし学習 | 自動採譜
• 最近のアプローチ:
– 推定すべき楽譜自体の生成
過程を確立モデルで表現す
ることで、楽譜の生成モデ
ルを事前分布、音響信号の
生成モデルを尤度関数とみ
なし、両者をベイズ的に統
合。