Contenu connexe
Similaire à Jaws sonic 2020_yokohama_deepcomposer (20)
Plus de Akifumi Niida (8)
Jaws sonic 2020_yokohama_deepcomposer
- 2. 自己紹介
• 新居田 晃史(にいだ あきふみ)
• 所属
• JBアドバンスト・テクノロジー株式会社
• 先進技術研究所
• 日本最速ITエンジニア(※週刊BCN編集部調べ)
• フルマラソン 2:29:56
• JAWS-UG 横浜支部(宇宙一早いre:Capでお馴染みのあの支部です)
Twitter @nid777
Facebook Akifumi Niida
- 4. コンピュータが音楽を理解する方法
• Pitch
• Velocity
• Tempo
• MIDI
ピッチは、音階上の相対位置が割り当てられているトーンです。各音符には数値が割り当てられており、0から最低音まで、
最高音は127まであります。
AWS DeepComposerキーボードのキーの範囲は41〜72です。オクターブ調整ボタンは、ピッチの値を12の倍数単位で上下
にシフトして、ピッチを高くしたり低くしたりします。
1つの音符が押される強さをエンコードします。キーをより速く押すと、ベロシティの値が高くなり、より大きな音が作成
されます。速度の値の範囲は1(最小、実際には聞こえない)〜127(最大)です。
テンポは、音楽の再生速度を表します。音楽は通常、特定のビートまたはメーターに従い、演奏されるノートのリズムを
動かします。このビートの速度は、ビート/分で測定されます。1分あたりのビート数が多いほど、再生速度が速くなります
(テンポ)。
MIDIのファイル形式は、レコードや店舗の音楽をコンピュータで使用される業界標準です。ファイル形式は、使用される
楽器の再生テンポや、ノートのピッチやベロシティなど、押したり離したりするノートをエンコードする一連のイベント
などの詳細をエンコードします。
MIDI えーあい ええ感じの音
音階 音の強さ テンポ 音の種類
• ピアノ
• ギター
• ドラム
- 13. トレーニングについて
Epoch: 100
Learning rate: 0.01
Update ratio: 5
Epoch: 200
Learning rate: 0.0001
Update ratio: 5
Epoch: 200
Learning rate: 0.0005
Update ratio: 5
Discremenator Lossが0に近い値で収束
したが、十分に学習したかどうか怪しい
損失関数の値を監視しましょう
• 弁別器の損失はゼロに収束
• 発生器の損失はゼロである必要のない数値に収束することを期待
• 損失関数がplateaus(水平状態)になると、モデルが学習しなくなったことを示します。
Discremenator Lossが0で収束していな
い
良い感じ