SlideShare une entreprise Scribd logo
1  sur  65
Télécharger pour lire hors ligne
Microsoft Imagine Cupと
深層学習を用いた音源分離技術について
佐藤邦彦
1. Microsoft Imagine Cupについて
2. 深層学習を利用して,特定の人物の声を
抽出するソフトウェア「Mediated Ear」
Mediated Ear
 Micorosoftが主催する学生向けITコンテスト.
 過去に190 を超える国から,延べ 200 万人以上の学生が参加.
 テクノロジーにフォーカス.
 優勝賞金 8 万 5000 ドル.
Imagine Cupとは
Mediated Ear
Imagine Cup 2018 日本大会決勝(2018年4月16日)に参加
https://tech-camp.in/note/technology/41540/
https://news.microsoft.com/ja-jp/2018/04/17/blog-microsoft-innovation-day-2018/
世界大会進出決定.
Mediated Ear 6
名前:佐藤邦彦
所属:LINE株式会社 開発(2018年4月入社)
2016年~2018年
筑波大学 情報学群 情報メディア創成学類2012年~2016年
東京大学大学院 学際情報学府 修士課程 暦本研究室
Mediated Ear
高校時代 未踏2015
Imagine Cup 2017
世界大会SXSW2017
8
Imagine Cup 2017 日本代表選出.
Mediated Ear 9
トランプ大統領
"I have many friends I actually have a large group of people friends
that I have a great people but they do suffer these..."
深層学習を用いて,入力音声を特定の人物の声質に変換するソフトウェア
Imagine Cup 2017 プロダクト「NeuroVoice」
Mediated Ear 10
マイケルジャクソン
"I have many friends I actually have a large group of people friends
that I have a great people but they do suffer these..."
トランプ大統領
深層学習を用いて,入力音声を特定の人物の声質に変換するソフトウェア
Imagine Cup 2017 プロダクト「NeuroVoice」
Mediated Ear 11
マイケルジャクソン
"I have many friends I actually have a large group of people friends
that I have a great people but they do suffer these..."
トランプ大統領
深層学習を用いて,入力音声を特定の人物の声質に変換するソフトウェア
Imagine Cup 2017 プロダクト「NeuroVoice」
同時再生
世界大会(2017年)
一回戦で負けてしまいました.
13
Imagine Cup 2018
世界大会(2018年7月頃開催)で
リベンジ!
Mediated Ear特定の人物の声を抽出するソフトウェア
Mediated Ear
補聴器利用者の友人の話
Mediated Ear
聴覚障害者の悩み
人混みでは,
会話相手の声が聞こえない.
Mediated Ear
聴覚障害者の音の聞こえ方
音が小さく聞こえるのではなく,
周りの音すべてが混ざって聞こえる.
深層学習を利用して,
特定の人物の声を抽出するソフトウェア
Mediated Ear
Mediated Ear
聞きたい声が聞こえる「Mediated Ear」
Mediated Ear
雑音や複数話者の声が混ざった入力音源から,特定の人物の声だけを抽出.
入力波形 特定の人物の声
20
入力音声(複数の話者が混ざっています)
抽出の対象となる話者
Mediated Earによって対象者の声を抽出
複数話者が重なっている音源からの抽出結果
21
入力音声(背景で音楽が鳴っています)
抽出の対象となる話者
Mediated Earによって対象者の声を抽出
BGMが重なっている音源からの抽出結果
Mediated Ear
https://kakakumag.com/av-kaden/?id=12058http://kodawari-story.com/movie/rion.html http://trendy.nikkeibp.co.jp/atcl/pickup/15/1003590/110901435/?P=2
現在の補聴器・イヤホン
雑音抑制や音声強調機能が搭載.
Mediated Ear
https://kakakumag.com/av-kaden/?id=12058http://kodawari-story.com/movie/rion.html http://trendy.nikkeibp.co.jp/atcl/pickup/15/1003590/110901435/?P=2
現在の補聴器・イヤホン
雑音抑制や音声強調機能が搭載.
複数話者の声を分離することはできない.
Mediated Ear
Mediated Earの働き
抽出対象の人物の声 実際の抽出波形
Mediated Ear
Mediated Earの働き
抽出対象の人物の声 実際の抽出波形
雑音や対象人物以外の声 実際の抽出波形
Mediated Ear
音源分離技術の先行事例
音源分離技術
マルチマイク
(マルチチャンネル)
シングルマイク
(モノラルチャンネル)
Mediated Ear
音源分離技術の先行事例
音源分離技術
シングルマイク
(モノラルチャンネル)
Mediated Ear
音源分離技術の先行事例
音源分離技術
シングルマイク
(モノラルチャンネル)
雑音除去 話者分離
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去 話者分離 Mediated Ear
雑音と人の声を
分離できる.
短所
長所
話者分離は
できない.
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去サンプル
“Deep Clustering and Conventional Networks for Music Separation: Stronger Together”
http://danetapi.com/chimera
Luo, Yi, et al. "Deep clustering and conventional networks for music separation: Stronger together." Acoustics, Speech
and Signal Processing (ICASSP), 2017 IEEE International Conference on. IEEE, 2017.
http://danetapi.com/chimera
• 音楽が混ざった入力音声
• フィルター結果
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去サンプル
“Deep Clustering and Conventional Networks for Music Separation: Stronger Together”
http://danetapi.com/chimera
Luo, Yi, et al. "Deep clustering and conventional networks for music separation: Stronger together." Acoustics, Speech
and Signal Processing (ICASSP), 2017 IEEE International Conference on. IEEE, 2017.
• 音楽が混ざった入力音声
• フィルター結果
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去サンプル
“Deep Clustering and Conventional Networks for Music Separation: Stronger Together”
http://danetapi.com/chimera
Luo, Yi, et al. "Deep clustering and conventional networks for music separation: Stronger together." Acoustics, Speech
and Signal Processing (ICASSP), 2017 IEEE International Conference on. IEEE, 2017.
http://danetapi.com/chimera
• 音楽が混ざった入力音声
• フィルター結果
• 複数話者が含まれる入力音声
• フィルター結果
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去サンプル
“Deep Clustering and Conventional Networks for Music Separation: Stronger Together”
http://danetapi.com/chimera
Luo, Yi, et al. "Deep clustering and conventional networks for music separation: Stronger together." Acoustics, Speech
and Signal Processing (ICASSP), 2017 IEEE International Conference on. IEEE, 2017.
http://danetapi.com/chimera
• 音楽が混ざった入力音声
• フィルター結果
• 複数話者が含まれる入力音声
• フィルター結果
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去 話者分離 Mediated Ear
雑音と人の声を
分離できる.
短所
長所
話者分離は
できない.
複数話者の声を
分離できる.
雑音除去できない.
入力音源に雑音が
含まれると話者分離の
精度が落ちる.
Mediated Ear
雑音除去・話者分離・Mediated Earの違い
雑音除去 話者分離 Mediated Ear
雑音と人の声を
分離できる.
短所
長所
話者分離は
できない.
複数話者の声を
分離できる.
雑音除去できない.
入力音源に雑音が
含まれると話者分離の
精度が落ちる.
入力音源に雑音や複数話者の
声が含まれていても,特定の
人物の声を抽出できる.
特定の人物の声しか
抽出できない.
Mediated Ear
Mediated Earの実装方法
対象人物の音声にさまざまな雑音や
他人の声を重畳した音声波形
対象人物の音声のみの波形
抽出対象となる人物の音声だけを抽出するように深層学習を行う.
Mediated Ear
Mediated Earの実装方法
対象人物の音声にさまざまな雑音や
他人の声を重畳した音声波形
対象人物の音声のみの波形
抽出対象となる人物の音声だけを抽出するように深層学習を行う.
振幅のサンプリング値(8bit)をそのまま入出力.
Mediated Ear
Mediated Earの
Deep Neural Network(DNN)構造
RNN / LSTM
RNN / LSTM
Mediated Ear
RNN / LSTMの欠点
“All class-based BLSTMs performed poorly
in non-speaker-dependent settings” [1]
[1] Hershey, John R., et al. "Deep clustering: Discriminative embeddings for segmentation and separation."
Acoustics, Speech and Signal Processing (ICASSP), 2016 IEEE International Conference on. IEEE, 2016.
LSTMを用いたDNNモデルは,
訓練データに含まれない話者同士の分離が難しい.
https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0
https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0
https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0
RNNは訓練時も実行時も多くのリソースを
必要とする.
RNNの中間層は逐次実行であり,
計算結果を保持する必要がある.
Mediated Ear
出力層
隠れ層
入力層
時間方向
丸はユニット,赤い色は行列乗算を意味する.
時間方向
Convolutional NN LSTM
Dilated Convolutional Neural Network
(Dilated CNN)
Mediated EarのDNN構造
Mediated Ear
画像処理のために提案されたDNN手法
Yu, Fisher, and Vladlen Koltun. "Multi-scale context aggregation by dilated convolutions." arXiv preprint arXiv:1511.07122 (2015).
Dilated CNN
畳み込みの範囲を拡大する.
Mediated Ear
Dilated CNNを音声に適用した研究「WaveNet」
Van Den Oord, Aaron, et al. "Wavenet: A generative model for raw audio." arXiv preprint arXiv:1609.03499 (2016).
Text to Speech
“Hello”
Mediated Ear
競合との比較
https://research.googleblog.com/2018/04/looking-to-listen-audio-visual-
speech.html
Google Research、複数音から特定の発話者だけの
声を聞こえるようにする深層学習手法(2018年4月12日発表!)
Mediated Ear
競合との比較
https://research.googleblog.com/2018/04/looking-to-listen-audio-visual-
speech.html
顔認識 + 音源分離
発話者の顔画像が必要.
Google Research、複数音から特定の発話者だけの
声を聞こえるようにする深層学習手法(2018年4月12日発表!)
Mediated Ear
競合との比較
https://research.googleblog.com/2018/04/looking-to-listen-audio-visual-
speech.html
Google Research、複数音から特定の発話者だけの
声を聞こえるようにする深層学習手法(2018年4月12日発表!)
顔認識 + 音源分離
Mediated Ear
音声データのみでよい.
発話者の顔画像が必要.
Q. Mediated Earの訓練データに必要な,
抽出対象人物の音声データ量は?
A. ひとりあたりの必要な音声データ
3分
Q. Mediated Earの訓練データに必要な,
抽出対象人物の音声データ量は?
Q. ユーザーはどのような人を抽出する対象とするか?
A. ユーザーの家族,恋人,仲の良い友人など頻繁に会話する人.
Q. ユーザーはどのような人を抽出する対象とするか?
https://www.weforum.org/agenda/2017/04/treating-hearing-loss-might-be-easier-with-a-familiar-voice
親しみのある声(親,恋人,孫)を聞くことは,
聴覚が低下した人に対して,聴力を向上させる可能性がある.
Cited by World Economic Forum
親しみのある声(親,恋人,孫)を聞くことは,
聴覚が低下した人に対して,聴力を向上させる可能性がある.
親しい人の声をいつでも・
どこでも聞くことが可能に
なるだけで大きな利点.
https://www.weforum.org/agenda/2017/04/treating-hearing-loss-might-be-easier-with-a-familiar-voice
Cited by World Economic Forum
Mediated Ear
ユーザーからのフィードバック
「日常生活では,複数の人が話していると
聞きづらいことが多い.
Mediated Earは,音源に雑音が含まれ
ていても話者分離できるのが良い!」
「Mediated Earで抽出した音は
対象話者の声が聞きやすい.」
Mediated Ear
「日常生活では,複数の人が話していると
聞きづらいことが多い.
Mediated Earは,音源に雑音が含まれ
ていても話者分離できるのが良い!」
ユーザーからのフィードバック
「Imagine Cup世界大会で優勝して早く実用化してくれ.」
「Mediated Earで抽出した音は
対象話者の声が聞きやすい.」
Mediated Earの発展性
Mediated Ear
Wearableから「Hearable」へ
Mediated Ear
Wearableから「Hearable」へ
Mediated Earを搭載すれば,
イヤホンを介して,周囲の音を
選択的に聞くことが可能になる.
Mediated Ear
冨永 健 佐藤 邦彦
チーム
東京大学大学院 暦本研究室
機械設計,ソフトウェア
東京大学大学院 暦本研究室
深層学習,Human-Computer Interaction
Mediated Ear
プラン
現在
ソフトウェアとして実装
2017年 冬
着手
Hearable端末として発表
Imagine Cup 世界大会
Mediated Ear
Empowering us all.
ありがとうございました.

Contenu connexe

Tendances

深層学習と音響信号処理
深層学習と音響信号処理深層学習と音響信号処理
深層学習と音響信号処理Yuma Koizumi
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~Yui Sudo
 
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案Keisuke Imoto
 
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析Shinnosuke Takamichi
 
WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響NU_I_TODALAB
 
[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audio[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audioDeep Learning JP
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)Daichi Kitamura
 
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)Shinnosuke Takamichi
 
GAN-based statistical speech synthesis (in Japanese)
GAN-based statistical speech synthesis (in Japanese)GAN-based statistical speech synthesis (in Japanese)
GAN-based statistical speech synthesis (in Japanese)Yuki Saito
 
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう音声合成のコーパスをつくろう
音声合成のコーパスをつくろうShinnosuke Takamichi
 
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...Daichi Kitamura
 
Saito20asj_autumn
Saito20asj_autumnSaito20asj_autumn
Saito20asj_autumnYuki Saito
 
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...Deep Learning JP
 
Nakai22sp03 presentation
Nakai22sp03 presentationNakai22sp03 presentation
Nakai22sp03 presentationYuki Saito
 
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元NU_I_TODALAB
 
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast  Maximum Likelihood Samplin...[DL輪読会]Diffusion-based Voice Conversion with Fast  Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...Deep Learning JP
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告Yuki Saito
 
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”Shinnosuke Takamichi
 
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural  mask-based beamforming論文紹介 Unsupervised training of neural  mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamformingShinnosuke Takamichi
 

Tendances (20)

深層学習と音響信号処理
深層学習と音響信号処理深層学習と音響信号処理
深層学習と音響信号処理
 
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
深層学習を用いた音源定位、音源分離、クラス分類の統合~環境音セグメンテーション手法の紹介~
 
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
Onoma-to-wave: オノマトペを利用した環境音合成手法の提案
 
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
やさしく音声分析法を学ぶ: ケプストラム分析とLPC分析
 
WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響WaveNetが音声合成研究に与える影響
WaveNetが音声合成研究に与える影響
 
[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audio[DL輪読会]Wavenet a generative model for raw audio
[DL輪読会]Wavenet a generative model for raw audio
 
音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)音源分離における音響モデリング(Acoustic modeling in audio source separation)
音源分離における音響モデリング(Acoustic modeling in audio source separation)
 
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
ここまで来た&これから来る音声合成 (明治大学 先端メディアコロキウム)
 
GAN-based statistical speech synthesis (in Japanese)
GAN-based statistical speech synthesis (in Japanese)GAN-based statistical speech synthesis (in Japanese)
GAN-based statistical speech synthesis (in Japanese)
 
音声合成のコーパスをつくろう
音声合成のコーパスをつくろう音声合成のコーパスをつくろう
音声合成のコーパスをつくろう
 
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
独立深層学習行列分析に基づく多チャネル音源分離の実験的評価(Experimental evaluation of multichannel audio s...
 
Saito20asj_autumn
Saito20asj_autumnSaito20asj_autumn
Saito20asj_autumn
 
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...
[DL輪読会]VOICEFILTER: Targeted Voice Separation by Speaker-Conditioned Spectrog...
 
Nakai22sp03 presentation
Nakai22sp03 presentationNakai22sp03 presentation
Nakai22sp03 presentation
 
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
時間領域低ランクスペクトログラム近似法に基づくマスキング音声の欠損成分復元
 
Slp201702
Slp201702Slp201702
Slp201702
 
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast  Maximum Likelihood Samplin...[DL輪読会]Diffusion-based Voice Conversion with Fast  Maximum Likelihood Samplin...
[DL輪読会]Diffusion-based Voice Conversion with Fast Maximum Likelihood Samplin...
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告
 
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”
日本音響学会2017秋 ”Moment-matching networkに基づく一期一会音声合成における発話間変動の評価”
 
論文紹介 Unsupervised training of neural mask-based beamforming
論文紹介 Unsupervised training of neural  mask-based beamforming論文紹介 Unsupervised training of neural  mask-based beamforming
論文紹介 Unsupervised training of neural mask-based beamforming
 

Similaire à Microsoft Imagine Cupと深層学習を用いた音源分離技術について_言語音声ナイト

DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジYusuke Uchida
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術Shohei Hido
 
Ipsj kansai(20100922)
Ipsj kansai(20100922)Ipsj kansai(20100922)
Ipsj kansai(20100922)真 岡本
 
20111203 第1回LODチャレンジデーin 大阪 事務局より
20111203 第1回LODチャレンジデーin 大阪 事務局より20111203 第1回LODチャレンジデーin 大阪 事務局より
20111203 第1回LODチャレンジデーin 大阪 事務局よりNobuyuki Otomori
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例Yahoo!デベロッパーネットワーク
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用Yusuke Uchida
 
hirai23slp03.pdf
hirai23slp03.pdfhirai23slp03.pdf
hirai23slp03.pdfYuki Saito
 
IEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけIEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけYoji Kiyota
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムKomei Sugiura
 
NAIST ソフトウェア工学研究室紹介 2018
NAIST ソフトウェア工学研究室紹介 2018NAIST ソフトウェア工学研究室紹介 2018
NAIST ソフトウェア工学研究室紹介 2018Takashi Ishio
 
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用NU_I_TODALAB
 
信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離NU_I_TODALAB
 
Mtg if(20101210)
Mtg if(20101210)Mtg if(20101210)
Mtg if(20101210)真 岡本
 
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見Mitsutoshi Kiuchi
 
音楽・エンターテインメント x AI (29 Aug 2017)
音楽・エンターテインメント x AI (29 Aug 2017)音楽・エンターテインメント x AI (29 Aug 2017)
音楽・エンターテインメント x AI (29 Aug 2017)Yuki Abe
 
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッションAkiko Orita
 
MojiHimoji(20110218)
MojiHimoji(20110218)MojiHimoji(20110218)
MojiHimoji(20110218)真 岡本
 

Similaire à Microsoft Imagine Cupと深層学習を用いた音源分離技術について_言語音声ナイト (20)

DeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジDeNAにおける先端AI技術活用のチャレンジ
DeNAにおける先端AI技術活用のチャレンジ
 
[Japan Tech summit 2017] MAI 001
[Japan Tech summit 2017]  MAI 001[Japan Tech summit 2017]  MAI 001
[Japan Tech summit 2017] MAI 001
 
ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術ディープラーニングの産業応用とそれを支える技術
ディープラーニングの産業応用とそれを支える技術
 
Ipsj kansai(20100922)
Ipsj kansai(20100922)Ipsj kansai(20100922)
Ipsj kansai(20100922)
 
20111203 第1回LODチャレンジデーin 大阪 事務局より
20111203 第1回LODチャレンジデーin 大阪 事務局より20111203 第1回LODチャレンジデーin 大阪 事務局より
20111203 第1回LODチャレンジデーin 大阪 事務局より
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
 
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
深層学習を用いたコンピュータビジョン技術と運転行動モニタリングへの応用
 
hirai23slp03.pdf
hirai23slp03.pdfhirai23slp03.pdf
hirai23slp03.pdf
 
IEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけIEEE DSAA 2017投稿呼びかけ
IEEE DSAA 2017投稿呼びかけ
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラム
 
Panel Discussion: AI Networking and Ethics
Panel Discussion: AI Networking and EthicsPanel Discussion: AI Networking and Ethics
Panel Discussion: AI Networking and Ethics
 
NAIST ソフトウェア工学研究室紹介 2018
NAIST ソフトウェア工学研究室紹介 2018NAIST ソフトウェア工学研究室紹介 2018
NAIST ソフトウェア工学研究室紹介 2018
 
音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用音声の声質を変換する技術とその応用
音声の声質を変換する技術とその応用
 
信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離信号の独立性に基づく多チャンネル音源分離
信号の独立性に基づく多チャンネル音源分離
 
Mtg if(20101210)
Mtg if(20101210)Mtg if(20101210)
Mtg if(20101210)
 
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見
(2017.8.27) Elasticsearchと科学技術ビッグデータが切り拓く日本の知の俯瞰と発見
 
音楽・エンターテインメント x AI (29 Aug 2017)
音楽・エンターテインメント x AI (29 Aug 2017)音楽・エンターテインメント x AI (29 Aug 2017)
音楽・エンターテインメント x AI (29 Aug 2017)
 
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
 
2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション2012年情報社会学会年会知識共有セッション
2012年情報社会学会年会知識共有セッション
 
MojiHimoji(20110218)
MojiHimoji(20110218)MojiHimoji(20110218)
MojiHimoji(20110218)
 

Plus de Deep Learning Lab(ディープラーニング・ラボ)

AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方Deep Learning Lab(ディープラーニング・ラボ)
 
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~Deep Learning Lab(ディープラーニング・ラボ)
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略Deep Learning Lab(ディープラーニング・ラボ)
 

Plus de Deep Learning Lab(ディープラーニング・ラボ) (20)

Edge AI ソリューションを支える Azure IoT サービス
Edge AI ソリューションを支える Azure IoT サービスEdge AI ソリューションを支える Azure IoT サービス
Edge AI ソリューションを支える Azure IoT サービス
 
DLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event ReportDLLAB Healthcare Day 2021 Event Report
DLLAB Healthcare Day 2021 Event Report
 
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
ICTを用いた健康なまちづくりの 取り組みとAI活用への期待​
 
医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発医学と工学の垣根を越えた医療AI開発
医学と工学の垣根を越えた医療AI開発
 
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方Intel AI in Healthcare 各国事例からみるAIとの向き合い方
Intel AI in Healthcare 各国事例からみるAIとの向き合い方
 
厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について厚生労働分野におけるAI技術の利活用について
厚生労働分野におけるAI技術の利活用について
 
先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」先端技術がもたらす「より良いヘルスケアのかたち」
先端技術がもたらす「より良いヘルスケアのかたち」
 
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
AIによる細胞診支援技術の紹介と、AI人材が考える医療バイオ領域における参入障壁の乗り越え方
 
「言語」×AI Digital Device
「言語」×AI Digital Device「言語」×AI Digital Device
「言語」×AI Digital Device
 
深層強化学習と実装例
深層強化学習と実装例深層強化学習と実装例
深層強化学習と実装例
 
深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御深層強化学習を用いた複合機の搬送制御
深層強化学習を用いた複合機の搬送制御
 
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法Azure ML 強化学習を用いた最新アルゴリズムの活用手法
Azure ML 強化学習を用いた最新アルゴリズムの活用手法
 
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
Jetson x Azure ハンズオン DeepStream With Azure IoT 事前準備
 
Jetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoTJetson x Azure ハンズオン DeepStream With Azure IoT
Jetson x Azure ハンズオン DeepStream With Azure IoT
 
Jetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoTJetson x Azure ハンズオン DeepStream Azure IoT
Jetson x Azure ハンズオン DeepStream Azure IoT
 
Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援Jetson 活用による スタートアップ企業支援
Jetson 活用による スタートアップ企業支援
 
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
[Track 4-6] ディープラーニングxものづくりが日本を強くする ~高専DCONの挑戦~
 
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
[Track3-2] AI活用人材の社内育成に関する取り組みについて ~ダイキン情報技術大学~
 
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
[Track1-1] AIの売上予測を発注システムに組み込んだリンガーハットのデータ活用戦略
 
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
[Track1-2] ディープラーニングを用いたワインブドウの収穫量予測
 

Dernier

キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版Takayuki Nakayama
 
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」IGDA Japan SIG-Audio
 
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。iPride Co., Ltd.
 
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~honeshabri
 
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜Naomi Yamasaki
 
バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析sugiuralab
 
AWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りAWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りiPride Co., Ltd.
 
The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))yoshidakids7
 
これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024Hideki Saito
 
00001_test_automation_portfolio_20240313
00001_test_automation_portfolio_2024031300001_test_automation_portfolio_20240313
00001_test_automation_portfolio_20240313ssuserf8ea02
 
チームで開発するための環境を整える
チームで開発するための環境を整えるチームで開発するための環境を整える
チームで開発するための環境を整えるonozaty
 
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG-Audio
 

Dernier (12)

キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
キンドリル_ネットワーク自動化成熟度診断サービス ご紹介資料 2024年3月版
 
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
SIG-AUDIO 2024 Vol.02 オンラインセミナー 「必殺使音人(ひっさつしおとにん)カットシーンを成敗せよ」
 
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
AWS_Bedrock入門 このスライドは2024/03/08の勉強会で発表されたものです。
 
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
キャラで動かすGPT ~GPTsでどんな感じに作っているとか考えていることとか~
 
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
JAWS DAYS 2024 E-3 ランチにまつわるちょっといい話 〜給食がない町の小中学生に温かい昼食を〜
 
バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析バイオリンの運弓動作計測による初心者と経験者の差異分析
バイオリンの運弓動作計測による初心者と経験者の差異分析
 
AWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作りAWS Lambdaと AWS API Gatewayを使ったREST API作り
AWS Lambdaと AWS API Gatewayを使ったREST API作り
 
The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))The 86th National Convention of IPSJ (Student Encouragement Award))
The 86th National Convention of IPSJ (Student Encouragement Award))
 
これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024これからはじめるAnsible - Ansible Night Tokyo 2024
これからはじめるAnsible - Ansible Night Tokyo 2024
 
00001_test_automation_portfolio_20240313
00001_test_automation_portfolio_2024031300001_test_automation_portfolio_20240313
00001_test_automation_portfolio_20240313
 
チームで開発するための環境を整える
チームで開発するための環境を整えるチームで開発するための環境を整える
チームで開発するための環境を整える
 
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdfIGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
IGDA Japan SIG Audio #22 オンラインセミナー VRの知る.pdf
 

Microsoft Imagine Cupと深層学習を用いた音源分離技術について_言語音声ナイト