SlideShare a Scribd company logo
1 of 27
音声 にまつわる技術の基礎
池宮 由楽 | イケミヤ ユカラ
2016/06/04
プロフィール
 名前とか
 池宮 由楽
 京大での研究
 プロ歌手の歌い方とかを抽出 (卒論)
 音楽からボーカルを分離 (修論)
今の研究
 音響信号処理いろいろ
あらまし
1. 音声とは
2. 音声認識 Siri とか
3. 音声合成 アナウンス、VOCALOID とか
4. 声質変換 コナン君の蝶ネクタイ型...
1. 音声とは
音 = 空気の振動
人間 (鼓膜)
機械 (マイク)
音の3要素
1. 音量
 音の大きさ [単位:dB (デシベル) ]
2. 音高
 音の高さ [単位:Hz (ヘルツ) ]
3. 音色
音の3要素
1. 音量
 音の大きさ [単位:dB (デシベル) ]
2. 音高
 音の高さ [単位:Hz (ヘルツ) ]
3. 音色
「同じように提示された,大きさ,高さが
等しい2つの音が違って聞こえるとき,
その違いをもたらす性質のことである」 (JIS)
音声における音色
「あ」と「い」の違い
150 Hz の「あ」 150 Hz の「い」
音高成分 音高成分
音声における音色
「あ」と「い」の違い
150 Hz の「あ」 150 Hz の「い」
実は含まれる音高成分は同じ
成分の「混合度合い」で音色が変わる
音高成分 音高成分
2. 音声認識
“ ぱりーぽむ
ん
ぽむん ”
きゃりー
ぱみゅぱみゅ
音声認識のしくみ
機械学習
どの音色が「あ」に
対応するかなどを
むっちゃ学習する
認識
学習結果をもとに
入力された音声を
テキストに変換する
大量のデータを
持ってる Google
とかが強い
最近 NTT 研究所
とかが強い
音声認識のしくみ
つきしまそう!
日本語を
むっちゃ
学習した機械
音声認識のしくみ
つきしまそう!
「う」っぽい?
日本語を
むっちゃ
学習した機械
音声認識のしくみ
つきしまそう!
「う」っぽい?
「い」?
「い」?
「あ」?
「お」?
「う」?
日本語を
むっちゃ
学習した機械
音声認識のしくみ
つきしまそう!
「う」っぽい?
「い」?
「い」?
「あ」?
「お」?
「う」?
「つきしまそう」?
「つきしましょう」?
「くぎりましょう」?
一番それっぽいのを出力
日本語を
むっちゃ
学習した機械
3. 音声合成
「ロボットデス」
音声合成のしくみ
つ き し ま そ う
日本語を
むっちゃ
学習した機械
音声合成のしくみ
つ き し ま そ う
日本語を
むっちゃ
学習した機械
こんな音色
やろ?
音声合成のしくみ
つ き し ま そ う
日本語を
むっちゃ
学習した機械
こんな音色
やろ?
音声合成のしくみ
つ き し ま そ う
日本語を
むっちゃ
学習した機械
それっぽく滑らかに繋げる(合成する)
こんな音色
やろ?
4. 声質変換
声質変換はむずかしい
ボイスチェンジャー
声質変換
適当に声を歪ませるだけ
入力された声の音色をピンポイントで適切な
音色に変換する
声質変換のしくみ
Aさんの声と
Bさんの声を
むっちゃ
学習した機械
Aさんの声
声質変換のしくみ
Aさんの声と
Bさんの声を
むっちゃ
学習した機械
Aさんの声
声質変換のしくみ
Aさんの声と
Bさんの声を
むっちゃ
学習した機械
Aさんの声
Bさんに変えたろ
声質変換のしくみ
Aさんの声と
Bさんの声を
むっちゃ
学習した機械
Aさんの声
Bさんに変えたろ
声質変換のしくみ
Aさんの声と
Bさんの声を
むっちゃ
学習した機械
Aさんの声
Bさんに変えたろ
Bさんの声

More Related Content

Viewers also liked

社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話Yoshiaki Ito
 
Matrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer VisionMatrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer VisionActiveEon
 
AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門Amazon Web Services Japan
 
Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.Milli28
 
AWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct ConnectAWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct ConnectAmazon Web Services Japan
 
Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)amitymbaassignment
 
пикник
пикникпикник
пикникiinvestkg
 
3Com 3CO504238-00
3Com 3CO504238-003Com 3CO504238-00
3Com 3CO504238-00savomir
 
Lexymore et le Club Commerce Connecté
Lexymore et le Club Commerce ConnectéLexymore et le Club Commerce Connecté
Lexymore et le Club Commerce ConnectéJulien Durandet
 
5. alveolar bone in health part a dr-ibrahim_shaikh
5. alveolar bone in health   part a dr-ibrahim_shaikh5. alveolar bone in health   part a dr-ibrahim_shaikh
5. alveolar bone in health part a dr-ibrahim_shaikhDrIbrahim Shaikh
 
Презентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовиниПрезентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовиниsveta7940
 
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkanリーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkanItsuki Kuroda
 

Viewers also liked (17)

社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話
 
Matrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer VisionMatrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer Vision
 
AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門
 
Amazon VPC VPN接続設定 参考資料
Amazon VPC VPN接続設定 参考資料Amazon VPC VPN接続設定 参考資料
Amazon VPC VPN接続設定 参考資料
 
Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.
 
TF.RGO.93
TF.RGO.93TF.RGO.93
TF.RGO.93
 
Programa 2017
Programa 2017Programa 2017
Programa 2017
 
AWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct ConnectAWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct Connect
 
Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)
 
пикник
пикникпикник
пикник
 
HR Incentives
HR IncentivesHR Incentives
HR Incentives
 
3Com 3CO504238-00
3Com 3CO504238-003Com 3CO504238-00
3Com 3CO504238-00
 
Lexymore et le Club Commerce Connecté
Lexymore et le Club Commerce ConnectéLexymore et le Club Commerce Connecté
Lexymore et le Club Commerce Connecté
 
5. alveolar bone in health part a dr-ibrahim_shaikh
5. alveolar bone in health   part a dr-ibrahim_shaikh5. alveolar bone in health   part a dr-ibrahim_shaikh
5. alveolar bone in health part a dr-ibrahim_shaikh
 
Презентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовиниПрезентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовини
 
3 клас урок 15 як знайти дані в інтернеті.
3 клас урок 15 як знайти дані в інтернеті.3 клас урок 15 як знайти дані в інтернеті.
3 клас урок 15 як знайти дані в інтернеті.
 
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkanリーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
 

Recently uploaded

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 

Recently uploaded (10)

TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 

音声にまつわる技術の基礎