Submit Search
Upload
音声にまつわる技術の基礎
•
Download as PPTX, PDF
•
3 likes
•
2,869 views
Yukara Ikemiya
Follow
非技術者向けの音声情報処理技術の紹介
Read less
Read more
Technology
Report
Share
Report
Share
1 of 27
Download now
Recommended
吉野真由美さん合宿資料2
吉野真由美さん合宿資料2
裕司 木下
もしオオカミが赤ずきんの質問にプレゼンで回答したら
もしオオカミが赤ずきんの質問にプレゼンで回答したら
Seichi Toyomane
MUSICXperia
MUSICXperia
sagalabo
Machine Learning : Latent variable models for discrete data (Topic model ...)
Machine Learning : Latent variable models for discrete data (Topic model ...)
Yukara Ikemiya
パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)
Yukara Ikemiya
direito+costumeiro
direito+costumeiro
Netosaimon Silva
nota+2+ied
nota+2+ied
Netosaimon Silva
音声データの扱い方と基礎知識・Audacity基本操作
音声データの扱い方と基礎知識・Audacity基本操作
Yusuke Uwagaki
Recommended
吉野真由美さん合宿資料2
吉野真由美さん合宿資料2
裕司 木下
もしオオカミが赤ずきんの質問にプレゼンで回答したら
もしオオカミが赤ずきんの質問にプレゼンで回答したら
Seichi Toyomane
MUSICXperia
MUSICXperia
sagalabo
Machine Learning : Latent variable models for discrete data (Topic model ...)
Machine Learning : Latent variable models for discrete data (Topic model ...)
Yukara Ikemiya
パターン認識と機械学習6章(カーネル法)
パターン認識と機械学習6章(カーネル法)
Yukara Ikemiya
direito+costumeiro
direito+costumeiro
Netosaimon Silva
nota+2+ied
nota+2+ied
Netosaimon Silva
音声データの扱い方と基礎知識・Audacity基本操作
音声データの扱い方と基礎知識・Audacity基本操作
Yusuke Uwagaki
社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話
Yoshiaki Ito
Matrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer Vision
ActiveEon
AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門
Amazon Web Services Japan
Amazon VPC VPN接続設定 参考資料
Amazon VPC VPN接続設定 参考資料
Amazon Web Services Japan
Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.
Milli28
TF.RGO.93
TF.RGO.93
Arcee327
Programa 2017
Programa 2017
Nieves Mateo
AWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct Connect
Amazon Web Services Japan
Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)
amitymbaassignment
пикник
пикник
iinvestkg
HR Incentives
HR Incentives
Nikki Waraich
3Com 3CO504238-00
3Com 3CO504238-00
savomir
Lexymore et le Club Commerce Connecté
Lexymore et le Club Commerce Connecté
Julien Durandet
5. alveolar bone in health part a dr-ibrahim_shaikh
5. alveolar bone in health part a dr-ibrahim_shaikh
DrIbrahim Shaikh
Презентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовини
sveta7940
3 клас урок 15 як знайти дані в інтернеті.
3 клас урок 15 як знайти дані в інтернеті.
Сокальська ЗШ І-ІІІ ступенів №2
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
Itsuki Kuroda
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
More Related Content
Viewers also liked
社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話
Yoshiaki Ito
Matrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer Vision
ActiveEon
AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門
Amazon Web Services Japan
Amazon VPC VPN接続設定 参考資料
Amazon VPC VPN接続設定 参考資料
Amazon Web Services Japan
Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.
Milli28
TF.RGO.93
TF.RGO.93
Arcee327
Programa 2017
Programa 2017
Nieves Mateo
AWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct Connect
Amazon Web Services Japan
Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)
amitymbaassignment
пикник
пикник
iinvestkg
HR Incentives
HR Incentives
Nikki Waraich
3Com 3CO504238-00
3Com 3CO504238-00
savomir
Lexymore et le Club Commerce Connecté
Lexymore et le Club Commerce Connecté
Julien Durandet
5. alveolar bone in health part a dr-ibrahim_shaikh
5. alveolar bone in health part a dr-ibrahim_shaikh
DrIbrahim Shaikh
Презентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовини
sveta7940
3 клас урок 15 як знайти дані в інтернеті.
3 клас урок 15 як знайти дані в інтернеті.
Сокальська ЗШ І-ІІІ ступенів №2
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
Itsuki Kuroda
Viewers also liked
(17)
社会の窓締め忘れ通知装置を作った話
社会の窓締め忘れ通知装置を作った話
Matrix and Tensor Tools for Computer Vision
Matrix and Tensor Tools for Computer Vision
AWS初心者向けWebinar AWSとのネットワーク接続入門
AWS初心者向けWebinar AWSとのネットワーク接続入門
Amazon VPC VPN接続設定 参考資料
Amazon VPC VPN接続設定 参考資料
Como usar excel aplicándolo al ámbito educativo.
Como usar excel aplicándolo al ámbito educativo.
TF.RGO.93
TF.RGO.93
Programa 2017
Programa 2017
AWS Black Belt Techシリーズ AWS Direct Connect
AWS Black Belt Techシリーズ AWS Direct Connect
Organizational Design & Structural Process (VV2)
Organizational Design & Structural Process (VV2)
пикник
пикник
HR Incentives
HR Incentives
3Com 3CO504238-00
3Com 3CO504238-00
Lexymore et le Club Commerce Connecté
Lexymore et le Club Commerce Connecté
5. alveolar bone in health part a dr-ibrahim_shaikh
5. alveolar bone in health part a dr-ibrahim_shaikh
Презентація:Агрегатний стан речовини
Презентація:Агрегатний стан речовини
3 клас урок 15 як знайти дані в інтернеті.
3 клас урок 15 як знайти дані в інтернеті.
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
リーンスタートアップと顧客開発とアジャイル開発を一気通貫するッ #devlove #devkan
Recently uploaded
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
taisei2219
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Hiroki Ichikura
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Yuma Ohgami
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
iPride Co., Ltd.
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
sugiuralab
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
danielhu54
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
Toru Tamaki
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
Ryo Sasaki
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
Toru Tamaki
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
Toru Tamaki
Recently uploaded
(10)
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
音声にまつわる技術の基礎
1.
音声 にまつわる技術の基礎 池宮 由楽
| イケミヤ ユカラ 2016/06/04
2.
プロフィール 名前とか 池宮
由楽 京大での研究 プロ歌手の歌い方とかを抽出 (卒論) 音楽からボーカルを分離 (修論) 今の研究 音響信号処理いろいろ
3.
あらまし 1. 音声とは 2. 音声認識
Siri とか 3. 音声合成 アナウンス、VOCALOID とか 4. 声質変換 コナン君の蝶ネクタイ型...
4.
1. 音声とは
5.
音 = 空気の振動 人間
(鼓膜) 機械 (マイク)
6.
音の3要素 1. 音量 音の大きさ
[単位:dB (デシベル) ] 2. 音高 音の高さ [単位:Hz (ヘルツ) ] 3. 音色
7.
音の3要素 1. 音量 音の大きさ
[単位:dB (デシベル) ] 2. 音高 音の高さ [単位:Hz (ヘルツ) ] 3. 音色 「同じように提示された,大きさ,高さが 等しい2つの音が違って聞こえるとき, その違いをもたらす性質のことである」 (JIS)
8.
音声における音色 「あ」と「い」の違い 150 Hz の「あ」
150 Hz の「い」 音高成分 音高成分
9.
音声における音色 「あ」と「い」の違い 150 Hz の「あ」
150 Hz の「い」 実は含まれる音高成分は同じ 成分の「混合度合い」で音色が変わる 音高成分 音高成分
10.
2. 音声認識 “ ぱりーぽむ ん ぽむん
” きゃりー ぱみゅぱみゅ
11.
音声認識のしくみ 機械学習 どの音色が「あ」に 対応するかなどを むっちゃ学習する 認識 学習結果をもとに 入力された音声を テキストに変換する 大量のデータを 持ってる Google とかが強い 最近 NTT
研究所 とかが強い
12.
音声認識のしくみ つきしまそう! 日本語を むっちゃ 学習した機械
13.
音声認識のしくみ つきしまそう! 「う」っぽい? 日本語を むっちゃ 学習した機械
14.
音声認識のしくみ つきしまそう! 「う」っぽい? 「い」? 「い」? 「あ」? 「お」? 「う」? 日本語を むっちゃ 学習した機械
15.
音声認識のしくみ つきしまそう! 「う」っぽい? 「い」? 「い」? 「あ」? 「お」? 「う」? 「つきしまそう」? 「つきしましょう」? 「くぎりましょう」? 一番それっぽいのを出力 日本語を むっちゃ 学習した機械
16.
3. 音声合成 「ロボットデス」
17.
音声合成のしくみ つ き し
ま そ う 日本語を むっちゃ 学習した機械
18.
音声合成のしくみ つ き し
ま そ う 日本語を むっちゃ 学習した機械 こんな音色 やろ?
19.
音声合成のしくみ つ き し
ま そ う 日本語を むっちゃ 学習した機械 こんな音色 やろ?
20.
音声合成のしくみ つ き し
ま そ う 日本語を むっちゃ 学習した機械 それっぽく滑らかに繋げる(合成する) こんな音色 やろ?
21.
4. 声質変換
22.
声質変換はむずかしい ボイスチェンジャー 声質変換 適当に声を歪ませるだけ 入力された声の音色をピンポイントで適切な 音色に変換する
23.
声質変換のしくみ Aさんの声と Bさんの声を むっちゃ 学習した機械 Aさんの声
24.
声質変換のしくみ Aさんの声と Bさんの声を むっちゃ 学習した機械 Aさんの声
25.
声質変換のしくみ Aさんの声と Bさんの声を むっちゃ 学習した機械 Aさんの声 Bさんに変えたろ
26.
声質変換のしくみ Aさんの声と Bさんの声を むっちゃ 学習した機械 Aさんの声 Bさんに変えたろ
27.
声質変換のしくみ Aさんの声と Bさんの声を むっちゃ 学習した機械 Aさんの声 Bさんに変えたろ Bさんの声
Download now