Soumettre la recherche
Mettre en ligne
コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用
•
Télécharger en tant que PPTX, PDF
•
0 j'aime
•
157 vues
Kitamura Laboratory
Suivre
岩瀬佑太, "コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用," 香川高等専門学校電気情報工学科 卒業研究論文, 56 pages, 2020年2月.
Lire moins
Lire la suite
Ingénierie
Signaler
Partager
Signaler
Partager
1 sur 16
Télécharger maintenant
Recommandé
直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
奈良先端大 情報科学研究科
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
Daichi Kitamura
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
Daichi Kitamura
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
Daichi Kitamura
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
Daichi Kitamura
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
Daichi Kitamura
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
Shinnosuke Takamichi
ICASSP2017読み会(関東編)・AASP_L3(北村担当分)
ICASSP2017読み会(関東編)・AASP_L3(北村担当分)
Daichi Kitamura
Recommandé
直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
直交化及び距離最大化則条件を用いた教師あり非負値行列因子分解による音楽信号分離
奈良先端大 情報科学研究科
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
半教師あり非負値行列因子分解における音源分離性能向上のための効果的な基底学習法
Daichi Kitamura
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
非負値行列因子分解に基づくブラインド及び教師あり音楽音源分離の効果的最適化法
Daichi Kitamura
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
非負値行列分解の確率的生成モデルと多チャネル音源分離への応用 (Generative model in nonnegative matrix facto...
Daichi Kitamura
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
音響メディア信号処理における独立成分分析の発展と応用, History of independent component analysis for sou...
Daichi Kitamura
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
独立低ランク行列分析に基づくブラインド音源分離(Blind source separation based on independent low-rank...
Daichi Kitamura
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
Shinnosuke Takamichi
ICASSP2017読み会(関東編)・AASP_L3(北村担当分)
ICASSP2017読み会(関東編)・AASP_L3(北村担当分)
Daichi Kitamura
Music signal separation using supervised nonnegative matrix factorization wit...
Music signal separation using supervised nonnegative matrix factorization wit...
Daichi Kitamura
音情報処理における特徴表現
音情報処理における特徴表現
NU_I_TODALAB
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
Daichi Kitamura
Ea2015 7for ss
Ea2015 7for ss
SaruwatariLabUTokyo
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
Daichi Kitamura
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
Daichi Kitamura
深層学習を利用した音声強調
深層学習を利用した音声強調
Yuma Koizumi
時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証
Masaharu Kinoshita
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
Daichi Kitamura
AutoEncoderで特徴抽出
AutoEncoderで特徴抽出
Kai Sasaki
TensorFlowで逆強化学習
TensorFlowで逆強化学習
Mitsuhisa Ohta
非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧
Kitamura Laboratory
深層学習と音響信号処理
深層学習と音響信号処理
Yuma Koizumi
DNN音響モデルにおける特徴量抽出の諸相
DNN音響モデルにおける特徴量抽出の諸相
Takuya Yoshioka
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術
Yuma Koizumi
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
Daichi Kitamura
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類
Keisuke Imoto
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
Yui Sudo
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
Daichi Kitamura
Max-Sliced Wasserstein Distance and its use for GANs
Max-Sliced Wasserstein Distance and its use for GANs
Hideki Tsunashima
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
Kitamura Laboratory
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
Kitamura Laboratory
Contenu connexe
Tendances
Music signal separation using supervised nonnegative matrix factorization wit...
Music signal separation using supervised nonnegative matrix factorization wit...
Daichi Kitamura
音情報処理における特徴表現
音情報処理における特徴表現
NU_I_TODALAB
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
Daichi Kitamura
Ea2015 7for ss
Ea2015 7for ss
SaruwatariLabUTokyo
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
Daichi Kitamura
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
Daichi Kitamura
深層学習を利用した音声強調
深層学習を利用した音声強調
Yuma Koizumi
時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証
Masaharu Kinoshita
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
Daichi Kitamura
AutoEncoderで特徴抽出
AutoEncoderで特徴抽出
Kai Sasaki
TensorFlowで逆強化学習
TensorFlowで逆強化学習
Mitsuhisa Ohta
非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧
Kitamura Laboratory
深層学習と音響信号処理
深層学習と音響信号処理
Yuma Koizumi
DNN音響モデルにおける特徴量抽出の諸相
DNN音響モデルにおける特徴量抽出の諸相
Takuya Yoshioka
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術
Yuma Koizumi
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
Daichi Kitamura
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類
Keisuke Imoto
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
Yui Sudo
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
Daichi Kitamura
Max-Sliced Wasserstein Distance and its use for GANs
Max-Sliced Wasserstein Distance and its use for GANs
Hideki Tsunashima
Tendances
(20)
Music signal separation using supervised nonnegative matrix factorization wit...
Music signal separation using supervised nonnegative matrix factorization wit...
音情報処理における特徴表現
音情報処理における特徴表現
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
Ea2015 7for ss
Ea2015 7for ss
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
独立性基準を用いた非負値行列因子分解の効果的な初期値決定法(Statistical-independence-based efficient initia...
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
基底変形型教師ありNMFによる実楽器信号分離 (in Japanese)
深層学習を利用した音声強調
深層学習を利用した音声強調
時系列問題に対するCNNの有用性検証
時系列問題に対するCNNの有用性検証
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
独立低ランク行列分析に基づく音源分離とその発展(Audio source separation based on independent low-rank...
AutoEncoderで特徴抽出
AutoEncoderで特徴抽出
TensorFlowで逆強化学習
TensorFlowで逆強化学習
非負値行列因子分解を用いた被り音の抑圧
非負値行列因子分解を用いた被り音の抑圧
深層学習と音響信号処理
深層学習と音響信号処理
DNN音響モデルにおける特徴量抽出の諸相
DNN音響モデルにおける特徴量抽出の諸相
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
独立性に基づくブラインド音源分離の発展と独立低ランク行列分析 History of independence-based blind source sep...
環境音の特徴を活用した音響イベント検出・シーン分類
環境音の特徴を活用した音響イベント検出・シーン分類
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
統計的独立性と低ランク行列分解理論に基づくブラインド音源分離 –独立低ランク行列分析– Blind source separation based on...
Max-Sliced Wasserstein Distance and its use for GANs
Max-Sliced Wasserstein Distance and its use for GANs
Plus de Kitamura Laboratory
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
Kitamura Laboratory
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
Kitamura Laboratory
ギタータブ譜からのギターリフ抽出アルゴリズム
ギタータブ譜からのギターリフ抽出アルゴリズム
Kitamura Laboratory
時間微分スペクトログラムに基づくブラインド音源分離
時間微分スペクトログラムに基づくブラインド音源分離
Kitamura Laboratory
Amplitude spectrogram prediction from mel-frequency cepstrum coefficients and...
Amplitude spectrogram prediction from mel-frequency cepstrum coefficients and...
Kitamura Laboratory
周波数双方向再帰に基づく深層パーミュテーション解決法
周波数双方向再帰に基づく深層パーミュテーション解決法
Kitamura Laboratory
Heart rate estimation of car driver using radar sensors and blind source sepa...
Heart rate estimation of car driver using radar sensors and blind source sepa...
Kitamura Laboratory
DNN-based frequency-domain permutation solver for multichannel audio source s...
DNN-based frequency-domain permutation solver for multichannel audio source s...
Kitamura Laboratory
双方向LSTMによるラウドネス及びMFCCからの振幅スペクトログラム予測と評価
双方向LSTMによるラウドネス及びMFCCからの振幅スペクトログラム予測と評価
Kitamura Laboratory
深層ニューラルネットワークに基づくパーミュテーション解決法の基礎的検討
深層ニューラルネットワークに基づくパーミュテーション解決法の基礎的検討
Kitamura Laboratory
多重解像度時間周波数表現に基づく独立低ランク行列分析,
多重解像度時間周波数表現に基づく独立低ランク行列分析,
Kitamura Laboratory
深層パーミュテーション解決法の基礎的検討
深層パーミュテーション解決法の基礎的検討
Kitamura Laboratory
深層学習に基づく音響特徴量からの振幅スペクトログラム予測
深層学習に基づく音響特徴量からの振幅スペクトログラム予測
Kitamura Laboratory
音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析
Kitamura Laboratory
調波打撃音モデルに基づく線形多チャネルブラインド音源分離
調波打撃音モデルに基づく線形多チャネルブラインド音源分離
Kitamura Laboratory
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
Kitamura Laboratory
Linear multichannel blind source separation based on time-frequency mask obta...
Linear multichannel blind source separation based on time-frequency mask obta...
Kitamura Laboratory
Prior distribution design for music bleeding-sound reduction based on nonnega...
Prior distribution design for music bleeding-sound reduction based on nonnega...
Kitamura Laboratory
Blind audio source separation based on time-frequency structure models
Blind audio source separation based on time-frequency structure models
Kitamura Laboratory
独立成分分析に基づく信号源分離精度の予測
独立成分分析に基づく信号源分離精度の予測
Kitamura Laboratory
Plus de Kitamura Laboratory
(20)
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
付け爪センサによる生体信号を用いた深層学習に基づく心拍推定
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
STEM教育を目的とした動画像処理による二重振り子の軌跡推定
ギタータブ譜からのギターリフ抽出アルゴリズム
ギタータブ譜からのギターリフ抽出アルゴリズム
時間微分スペクトログラムに基づくブラインド音源分離
時間微分スペクトログラムに基づくブラインド音源分離
Amplitude spectrogram prediction from mel-frequency cepstrum coefficients and...
Amplitude spectrogram prediction from mel-frequency cepstrum coefficients and...
周波数双方向再帰に基づく深層パーミュテーション解決法
周波数双方向再帰に基づく深層パーミュテーション解決法
Heart rate estimation of car driver using radar sensors and blind source sepa...
Heart rate estimation of car driver using radar sensors and blind source sepa...
DNN-based frequency-domain permutation solver for multichannel audio source s...
DNN-based frequency-domain permutation solver for multichannel audio source s...
双方向LSTMによるラウドネス及びMFCCからの振幅スペクトログラム予測と評価
双方向LSTMによるラウドネス及びMFCCからの振幅スペクトログラム予測と評価
深層ニューラルネットワークに基づくパーミュテーション解決法の基礎的検討
深層ニューラルネットワークに基づくパーミュテーション解決法の基礎的検討
多重解像度時間周波数表現に基づく独立低ランク行列分析,
多重解像度時間周波数表現に基づく独立低ランク行列分析,
深層パーミュテーション解決法の基礎的検討
深層パーミュテーション解決法の基礎的検討
深層学習に基づく音響特徴量からの振幅スペクトログラム予測
深層学習に基づく音響特徴量からの振幅スペクトログラム予測
音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析
調波打撃音モデルに基づく線形多チャネルブラインド音源分離
調波打撃音モデルに基づく線形多チャネルブラインド音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
コサイン類似度罰則条件付き非負値行列因子分解に基づく音楽音源分離
Linear multichannel blind source separation based on time-frequency mask obta...
Linear multichannel blind source separation based on time-frequency mask obta...
Prior distribution design for music bleeding-sound reduction based on nonnega...
Prior distribution design for music bleeding-sound reduction based on nonnega...
Blind audio source separation based on time-frequency structure models
Blind audio source separation based on time-frequency structure models
独立成分分析に基づく信号源分離精度の予測
独立成分分析に基づく信号源分離精度の予測
Dernier
Sachpazis Costas: Geotechnical Engineering: A student's Perspective Introduction
Sachpazis Costas: Geotechnical Engineering: A student's Perspective Introduction
Dr.Costas Sachpazis
Electronically Controlled suspensions system .pdf
Electronically Controlled suspensions system .pdf
me23b1001
Concrete Mix Design - IS 10262-2019 - .pptx
Concrete Mix Design - IS 10262-2019 - .pptx
KartikeyaDwivedi3
Unit7-DC_Motors nkkjnsdkfnfcdfknfdgfggfg
Unit7-DC_Motors nkkjnsdkfnfcdfknfdgfggfg
saravananr517913
Instrumentation, measurement and control of bio process parameters ( Temperat...
Instrumentation, measurement and control of bio process parameters ( Temperat...
121011101441
Study on Air-Water & Water-Water Heat Exchange in a Finned Tube Exchanger
Study on Air-Water & Water-Water Heat Exchange in a Finned Tube Exchanger
Anamika Sarkar
Indian Dairy Industry Present Status and.ppt
Indian Dairy Industry Present Status and.ppt
Madan Karki
Oxy acetylene welding presentation note.
Oxy acetylene welding presentation note.
eptoze12
Transport layer issues and challenges - Guide
Transport layer issues and challenges - Guide
GOPINATHS437943
Class 1 | NFPA 72 | Overview Fire Alarm System
Class 1 | NFPA 72 | Overview Fire Alarm System
irfanmechengr
🔝9953056974🔝!!-YOUNG call girls in Rajendra Nagar Escort rvice Shot 2000 nigh...
🔝9953056974🔝!!-YOUNG call girls in Rajendra Nagar Escort rvice Shot 2000 nigh...
9953056974 Low Rate Call Girls In Saket, Delhi NCR
POWER SYSTEMS-1 Complete notes examples
POWER SYSTEMS-1 Complete notes examples
Dr. Gudipudi Nageswara Rao
IVE Industry Focused Event - Defence Sector 2024
IVE Industry Focused Event - Defence Sector 2024
Mark Billinghurst
Risk Assessment For Installation of Drainage Pipes.pdf
Risk Assessment For Installation of Drainage Pipes.pdf
ROCENODodongVILLACER
Software and Systems Engineering Standards: Verification and Validation of Sy...
Software and Systems Engineering Standards: Verification and Validation of Sy...
VICTOR MAESTRE RAMIREZ
Application of Residue Theorem to evaluate real integrations.pptx
Application of Residue Theorem to evaluate real integrations.pptx
959SahilShah
Correctly Loading Incremental Data at Scale
Correctly Loading Incremental Data at Scale
Alluxio, Inc.
Piping Basic stress analysis by engineering
Piping Basic stress analysis by engineering
JuanCarlosMorales19600
complete construction, environmental and economics information of biomass com...
complete construction, environmental and economics information of biomass com...
asadnawaz62
US Department of Education FAFSA Week of Action
US Department of Education FAFSA Week of Action
Mebane Rash
Dernier
(20)
Sachpazis Costas: Geotechnical Engineering: A student's Perspective Introduction
Sachpazis Costas: Geotechnical Engineering: A student's Perspective Introduction
Electronically Controlled suspensions system .pdf
Electronically Controlled suspensions system .pdf
Concrete Mix Design - IS 10262-2019 - .pptx
Concrete Mix Design - IS 10262-2019 - .pptx
Unit7-DC_Motors nkkjnsdkfnfcdfknfdgfggfg
Unit7-DC_Motors nkkjnsdkfnfcdfknfdgfggfg
Instrumentation, measurement and control of bio process parameters ( Temperat...
Instrumentation, measurement and control of bio process parameters ( Temperat...
Study on Air-Water & Water-Water Heat Exchange in a Finned Tube Exchanger
Study on Air-Water & Water-Water Heat Exchange in a Finned Tube Exchanger
Indian Dairy Industry Present Status and.ppt
Indian Dairy Industry Present Status and.ppt
Oxy acetylene welding presentation note.
Oxy acetylene welding presentation note.
Transport layer issues and challenges - Guide
Transport layer issues and challenges - Guide
Class 1 | NFPA 72 | Overview Fire Alarm System
Class 1 | NFPA 72 | Overview Fire Alarm System
🔝9953056974🔝!!-YOUNG call girls in Rajendra Nagar Escort rvice Shot 2000 nigh...
🔝9953056974🔝!!-YOUNG call girls in Rajendra Nagar Escort rvice Shot 2000 nigh...
POWER SYSTEMS-1 Complete notes examples
POWER SYSTEMS-1 Complete notes examples
IVE Industry Focused Event - Defence Sector 2024
IVE Industry Focused Event - Defence Sector 2024
Risk Assessment For Installation of Drainage Pipes.pdf
Risk Assessment For Installation of Drainage Pipes.pdf
Software and Systems Engineering Standards: Verification and Validation of Sy...
Software and Systems Engineering Standards: Verification and Validation of Sy...
Application of Residue Theorem to evaluate real integrations.pptx
Application of Residue Theorem to evaluate real integrations.pptx
Correctly Loading Incremental Data at Scale
Correctly Loading Incremental Data at Scale
Piping Basic stress analysis by engineering
Piping Basic stress analysis by engineering
complete construction, environmental and economics information of biomass com...
complete construction, environmental and economics information of biomass com...
US Department of Education FAFSA Week of Action
US Department of Education FAFSA Week of Action
コサイン類似度罰則条件付き半教師あり非負値行列因子分解と音源分離への応用
1.
香川高専 電気情報工学科 北村研究室 5年 岩瀬
佑太 コサイン罰則条件付き半教師あり 非負値行列因子分解と音源分離への応用 Semi-supervised nonnegative matrix factorization with cosine penalty condition and application to audio source separation 香川高専 電気情報工学科 卒業研究発表
2.
研究背景 • 音源分離とは 1 − 混合された観測信号から個々の音源の信号を抽出・分離する技術 −
音声認識や自動採譜といったものに利用されている − オーケストラで後から特定の楽器のメロディーのみを抽出することが可能 − 音源分離の手法の一つに非負値行列因子分解 (nonnegative matrix factorization: NMF)がある 音源分離
3.
短時間フーリエ変換(short-time Fourier transform:
STFT) 2 • STFTの概要 時間領域 フーリエ変換長 時間周波数領域 時間波形 … 離散フーリエ変換 シフト長 離散フーリエ変換 離散フーリエ変換 スペクトログラム 複素数要素を持つ行列 周波数 時間 … 非負振幅スペクトログラム 非負(ゼロ以上)の実数要素の行列 要素毎の絶対値 窓関数
4.
NMF [D. D.
Lee, et al., 1999] • 非負行列𝑿を別の2つの行列 と行列 の積で低ランク近似する 3 ≈ Amplitude Amplitude 非負の観測行列 (音の時間周波数強度) 基底行列 (音色パーツ) アクティベーション行列 (音量と音価) Time Time Frequency Frequency 基底 : 周波数ビン数 : 時間フレーム数 : 基底数 アクティベーション :音源の頻出スペクトルパターン :時間的な強度変化 を含む
5.
NMFのパラメータ推定 4 − 二乗ユークリッド距離のコスト関数 − KLダイバージェンスのコスト関数
6.
半教師ありNMF(Semi-supervised NMF: SNMF)
[P. Smaragdis, et al.,2007] • 5 分離ステージ 学習ステージ 学習ステージで得た目的音 の基底行列 目的音の 基底行列 その他の基底 分離目的音のサンプ ル音(教師音) 𝒀 𝑿 𝑭 𝑭 𝑸 は固定し , , のみ求める 𝑭 目的音源の基底行列のみをあらかじめ学習
7.
SNMFにおける問題点 6 分離ステージ 学習ステージ 目的音の 基底行列 𝒀 𝑿 𝑭 𝑭 𝑸 • 似たような音はどちらの行列にも入りうる 混入
8.
問題点の改善法 と を直交に近づける直交化罰則項を与える 7 • 直交化罰則条件付きSNMF(Penalized
SNMF: PSNMF) [D. Kitamura, et al., 2014] 直交化罰則項 事前学習した目的音源の基底 重み係数 類似させない
9.
PSNMFの問題点 8 ① ① ② • ①と②を両方ともに小さくする
を求める ( は定数) • ②は を0行列に近づけるだけで小さくなる ①
10.
提案手法:PSNMFの再定式化 • コサイン類似度に基づくPSNMF ⁃ コサイン類似度を罰則条件としてSNMFに付与 9 コサイン類似度 −
コサイン類似度の対数和を付与 − コサイン類似度は全スペクトル総当たりで求める コスト関数:
11.
更新式の導出 • 各変数の更新式 10
12.
実験条件 11 使用する楽器 公開データセット(songKitamura)より オーボエ (Ob.),
トランペット (Tp.), ホルン (Hr.), フルート (Fl.), ヴァイオリン (Vn.), クラリネット (Cl.), ピアノ (Pf.), チェロ (Vc.),ハープシコード (Hp.), トロンボーン (Tb.), ファゴット (Fg.) 楽器の組み合わせ 数 2楽器の混合信号を90個 2オクターブの上昇音階 Ob. or Tp. or Hr. Fl. or Cl. or Vn. Pf. or Hp. Fg. or Tb. or Vc. メロディーパート
13.
実験結果 12 • 従来手法との比較 − Fg.
と Hp. の混合音 − Tb. と Pf.の混合音 0 1 2 3 4 5 6 7 8 0.001 0.01 0.1 1 10 100 1000 10000 SDR [dB] 重み係数 従来手法 提案手法 3 4 5 6 7 8 9 0.001 0.01 0.1 1 10 100 1000 10000 SDR [dB] 重み係数 従来手法 提案手法
14.
実験結果 13 − Fl. と
Hp. の混合音 手法 平均値 [dB] 中央値 [dB] SNMF (μ=0) 6.09 5.73 直交化に基づく PSNMF 8.51 7.91 コサイン類似度に 基づくPSNMF 8.73 8.22 0 0.5 1 1.5 2 2.5 3 3.5 4 0.001 0.01 0.1 1 10 100 100010000 SDR [dB] 重み係数 従来手法 提案手法
15.
まとめ・今後の課題 • まとめ • 課題 14 –
従来手法より高い分離精度が達成できた – 重み係数の最適値がピーキー – 多くの混合音で重み係数の値が1~50の範囲で最大値をとる – 提案手法を実用的にするためには,楽器ごとに SDR値が最大となる重み係数の傾向を掴む必要がある
16.
FAQ 15
Notes de l'éditeur
今からこのような題目で北村研究室の岩瀬佑太が発表をしていきます。
まず、音源分離とは、混合された観測信号から個々の音源の信号を抽出・分離する技術であり主に音声認識や自動採譜といったものに利用されています。 さらに、図のような音楽信号であるオーケストラのような複数の楽器が演奏されている状況から特定の楽器のメロディーのみを抽出するといった活用法があります。 本研究ではNMFを用いた手法を議論の対象として発表します。
その前に音響信号における基本的な変換を説明します。 短時間フーリエ変換を適用して得られる非負値観測行列を扱うことが一般的です。 時間波形を短いフーリエ変換長に分割し,窓関数を乗ずることで離散フーリエ変換を適用します。この処理を任意の時間ごとに行うことにより,時間と周波数の情報を持つ二次元信号が得られます。
Télécharger maintenant