Soumettre la recherche
Mettre en ligne
機械学習を利用したDTM音色検索フィルタの提案と音色づくり支援システムへの適用
•
0 j'aime
•
472 vues
Hajime Saito
Suivre
音楽情報科学研究会第114回発表会用の発表資料です。
Lire moins
Lire la suite
Technologie
Affichage du diaporama
Signaler
Partager
Affichage du diaporama
Signaler
Partager
1 sur 46
Télécharger maintenant
Télécharger pour lire hors ligne
Recommandé
DTMでの音色検索を対象とした機械学習アルゴリズムの提案(for FIT2016)
DTMでの音色検索を対象とした機械学習アルゴリズムの提案(for FIT2016)
Hajime Saito
ABEJA Tech LT #5 「社内公式ツールとしてNotionを利用するために実施したこと」
ABEJA Tech LT #5 「社内公式ツールとしてNotionを利用するために実施したこと」
Hajime Saito
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
Hajime Saito
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
Hajime Saito
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
Recommandé
DTMでの音色検索を対象とした機械学習アルゴリズムの提案(for FIT2016)
DTMでの音色検索を対象とした機械学習アルゴリズムの提案(for FIT2016)
Hajime Saito
ABEJA Tech LT #5 「社内公式ツールとしてNotionを利用するために実施したこと」
ABEJA Tech LT #5 「社内公式ツールとしてNotionを利用するために実施したこと」
Hajime Saito
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
Hajime Saito
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
メタデータを活用した機械学習によるDTMでの音色づくりの効率化
Hajime Saito
2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
Marius Sescu
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
Expeed Software
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
Pixeldarts
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
ThinkNow
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Contenu connexe
Dernier
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
CRI Japan, Inc.
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
sn679259
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
WSO2
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
atsushi061452
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Toru Tamaki
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Hiroshi Tomioka
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
CRI Japan, Inc.
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
Toru Tamaki
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NTT DATA Technology & Innovation
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
iPride Co., Ltd.
Dernier
(12)
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
LoRaWAN スマート距離検出デバイスDS20L日本語マニュアル
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
知識ゼロの営業マンでもできた!超速で初心者を脱する、悪魔的学習ステップ3選.pptx
Utilizing Ballerina for Cloud Native Integrations
Utilizing Ballerina for Cloud Native Integrations
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
論文紹介: The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games
新人研修 後半 2024/04/26の勉強会で発表されたものです。
新人研修 後半 2024/04/26の勉強会で発表されたものです。
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
論文紹介:Selective Structured State-Spaces for Long-Form Video Understanding
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Observabilityは従来型の監視と何が違うのか(キンドリルジャパン社内勉強会:2022年10月27日発表)
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その22024/04/26の勉強会で発表されたものです。
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
LoRaWANスマート距離検出センサー DS20L カタログ LiDARデバイス
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
論文紹介:Video-GroundingDINO: Towards Open-Vocabulary Spatio-Temporal Video Groun...
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
NewSQLの可用性構成パターン(OCHaCafe Season 8 #4 発表資料)
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
Amazon SES を勉強してみる その32024/04/26の勉強会で発表されたものです。
En vedette
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
marketingartwork
Skeleton Culture Code
Skeleton Culture Code
Skeleton Technologies
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Neil Kimberley
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
contently
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Albert Qian
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
Search Engine Journal
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
SpeakerHub
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Tessa Mero
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Lily Ray
How to have difficult conversations
How to have difficult conversations
Rajiv Jayarajah, MAppComm, ACC
Introduction to Data Science
Introduction to Data Science
Christy Abraham Joy
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
Vit Horky
The six step guide to practical project management
The six step guide to practical project management
MindGenius
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
RachelPearson36
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Applitools
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
GetSmarter
ChatGPT webinar slides
ChatGPT webinar slides
Alireza Esmikhani
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
Project for Public Spaces & National Center for Biking and Walking
En vedette
(20)
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
Skeleton Culture Code
Skeleton Culture Code
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
Getting into the tech field. what next
Getting into the tech field. what next
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
How to have difficult conversations
How to have difficult conversations
Introduction to Data Science
Introduction to Data Science
Time Management & Productivity - Best Practices
Time Management & Productivity - Best Practices
The six step guide to practical project management
The six step guide to practical project management
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
ChatGPT webinar slides
ChatGPT webinar slides
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
機械学習を利用したDTM音色検索フィルタの提案と音色づくり支援システムへの適用
1.
[タイトル]機械学習を利用したDTM 音色検索フィルタの提案と検索シス テムへの適用
2.
発表の流れ • 背景 • 学部時の研究 •
目的・目標 • 課題 • 課題解決アプローチ • 検証 • 結果・考察
3.
CGMの活性化により 、DTM(DeskTop Music)と呼ばれるPC上での作曲活動 が発展
4.
音色づくりと呼ばれる作曲プロセスを 本研究では対象とする • ソフトウェア音源のパラメータを調整し、楽曲 に適した音色を作成する作業を音色づくりと 定義する
5.
作曲者が作成したい音色と類似する 音色の音色づくり情報をメタデータを 用いて検索可能な、音色づくり支援シ ステム(TASS)を構築
6.
TASSでの音色づくり情報詳細画面例
7.
8.
9.
TASSでの問題点 • 作曲者によって音色の言語表現が異なるた め、うまく音色づくり情報を検索できない
10.
• 目的:DTM作曲者が音色づくり情報を効率よ く検索可能にすることで効率的な音色づくり ができるようにする • 目標: – DTM作曲者が適切な音色づくり情報を検索する ための 検索フィルタを作成 – 検索フィルタをシステムに適用
11.
課題:DTM作曲者ごとに音色の表現 方法が異なるため、適切な音色づくり 情報を検索できない
12.
音響特徴量と、音色の表現を用いて 機械学習を行い、作曲者ごとの検索 フィルタを作成する
13.
音響特徴量としてMFCCを用いる
14.
音色の表現にはHEVNERの形容詞ク ラスタを用いる
15.
機械学習アルゴリズムとして、計算処 理が少なく、検証が容易てある点から、 SVMと回帰式による検証を行う
16.
SVMでは音色表現を詳細化したレベ ル数という指標を定義し、利用する
17.
回帰式として作曲者の入力を考慮し た回帰式(1)を作成した。特徴は次の 通り、
18.
入力される雰囲気のデータが大きい ほど大きく更新
19.
閲覧した音色と変更前の検索フィルタ の差が大きいほど大きく更新 • 検証を行った結果、被験者ごとの検索フィル タの精度に大きな差が現れた
20.
精度の差を修正するため、回帰式(2) を作成した。特徴は次の通り。
21.
次元数を増やし、検索フィルタの急激 な変化を防ぐ
22.
該当する雰囲気のクラスタの種類が 少ないほど大きく更新 • 表現に迷う場合は小さく更新し、迷わない場 合は大きく更新
23.
検索フィルタの作成に有効なアルゴリ ズムを検証する目的で予備実験を実 施
24.
検証にはLeave-One-Out法により実施
25.
結果
26.
SVMを用いた場合、粒度の判別精度 が著しく低いため、今回用いるアルゴ リズムとしては適していない
27.
回帰式とSVM20の場合をグラフ化した ものが次のグラフ
28.
29.
回帰式(2)が最も一致率が高く、様々 なDTM作曲者に対応可能であること が判明
30.
本研究では、回帰式(2)が検索フィル タ作成アルゴリズムとして適切である と判断
31.
システム化 • TASS_V2:hFp://180.43.174.135/g2115015/ TASS_v2/Pmbres
32.
デモ • ロングバージョン • hFps://youtu.be/eWhja1Hv2EU
33.
2つの検証を実施 • 実利用ログ取得実験 • 音色づくり情報検索実験(対照実験)
34.
実利用ログ • アクセス数が少なく、有効な検証結果を得ら れなかった • 登録されている音色づくり情報が少ないとい うことが判明したため、より情報を充実させる 必要がある
35.
36.
所要時間と上位3件に出現した割合 (ヒット率)を求めた
37.
• 検索フィルタを用いることで、所要時間が減 少 • 検索フィルタを用いることで、検索結果上位に 求める音色づくり情報が出現
38.
アンケートより • システムを使い続けることで、検索フィルタの 有効性が示される
39.
• 考察 – 検索フィルタの有効性を確認 – 比較的直感的に利用でき、使い慣れるほど、シス テムが有効になる • 今後の課題 – 現状のTASSでは音色づくり情報が十分に登録さ せれておらず、実際にDTM作曲者が利用するた めには音色づくり情報を充足させる必要がある
40.
参考文献 • [1]斎藤明, “サービス・ドミナント・ロジックにおける価値共創概念と市場創造 : 「初 音ミク」という市場創造を中心として”, 情報文化学会誌, vol. 21, no. 1, pp. 29–36, Aug. 2014. • [2]齋藤創, 大場みち子, “メタデータを活用したDTM(DeskTop Music)での音づくり 支援システムの構築”, presented at the 情報処理学会第77回全国大会, 2015. •
[3]千葉祐弥, “Q:さまざまな音響特徴量それぞれの使い方や意味を教えて下さ い”, 音響学会ペディア. [Online]. Available: hFp://abcpedia.acousPcs.jp/ acousPc_feature_2.pdf. [Accessed: 30-Dec-2015]. • [4]宮澤幸希, “メル周波数ケプストラム(MFCC) - Miyazawa’s Pukiwiki 公開版”, Miyazawa’s Pukiwiki 公開版, 29-Mar-2013. [Online]. Available: hFp:// shower.human.waseda.ac.jp/~m-kouki/pukiwiki_public/66.html. [Accessed: 07- Jul-2015]. • [5]K. HEVNER, “experimental studies of the elements of expression in music”, American Journal of Psychology, vol. 48, pp. 246–268, 1936. • [6]栗田多喜夫, “サポートベクターマシーン入門,” 産業技術総合研究所 脳神経 情報研究部門, p. 21.
41.
まとめ • 目的:DTM作曲者が音色づくり情報を効率よく検索可能にすること で効率的な音色づくりができるようにする • 課題:DTM作曲者ごとに音色の表現方法が異なるため適切な 音色づくり情報を検索できない •
手法:音色の表現と音響特徴量を用いた機械学習により • 作曲者ごとの音色表現の傾向を学習した検索フィルタを作成し • システムに適用 • 検証:システムへのアクセスログとアンケートを実施 • 検索フィルタ利用と非利用時の対照実験を実施 • 結果:検索フィルタの有効性を示したが、現状のTASSでは登録され ている音色づくり情報が十分ではないということが判明した
Télécharger maintenant