Divergence optimization based on trade-off between separation and extrapolation abilities in superresolution-based nonnegative matrix factorization
1. Divergence optimization based on trade-off between
separation and extrapolation abilities in
superresolution-based nonnegative matrix factorization
超解像型非負値行列因子分解における分離性能と外挿能力の
トレードオフに基づく最適なダイバージェンスの検討
☆北村大地, 猿渡洋, 中村哲
(奈良先端科学技術大学院大学)
高橋祐, 近藤多伸
(ヤマハ株式会社)
2. 背景: 非負値行列因子分解による音源分離
• 音源分離: 複数の音源から成る混合音から特定の音源を分離
• 非負値行列因子分解(nonnegative matrix factorization: NMF)[Lee, 2001]
Amplitude
Frequency
Frequency
– スパース分解表現による特徴量抽出手法
Time
観測スペクトログラム
Time
Amplitude
アクティベーション行列
基底スペクトル行列
Ω: 周波数ビン数
𝑇: 時間フレーム数
𝐾: 基底数
• 一般に各音源毎に基底を選別することは困難
• 目的音源の基底を学習する教師ありNMF [Smaragdis, 2010], [Yagi, 2012]
2