SlideShare une entreprise Scribd logo
1  sur  30
Télécharger pour lire hors ligne
ごちゃまぜ歌ボTIPS!
歌うボイスロイドで様々な
ツールを有効活用しよう!
歌うボイスロイドワークショップ2
開催日:2018年9月24日
はなすひと:スズモフ (@suzu_dov)
加筆・公開:2018年10月21日
リズム調声は結構大変
 ボイスロイド上で一からリズムを整えていく
には音声を聴いて話速や長音の数を変えてい
く必要があります。
 もしVocalShifterやMelodyneなどのツールを
使うとして一つ一つのタイミングを直さない
といけないので結構大変。
KotonoSyncの紹介
 ボーカロイドで作成したシーケンスデータ
ファイルを使って音階に合わせたボイスロイ
ド用のフレーズ辞書を作ることが出来ます。
 更に音声保存と分析・調整を自動的に繰り返
すことで手間のかかるリズム調整を全自動で
行うことができます。
KotonoSyncとピヨ式の違い
 コトノシンクはビビピヨさんのピヨ式調声法
の考え方を元に作っています。
 全自動ではあるけどピヨ式でもある?
 手動でピヨ式調声するのとKotonoSyncで自
動調整するのにはそれぞれ利点があります。
KotonoSyncの特徴
 ボーカロイドあるいは他の歌声合成ソフトの
使い方を知っている必要がある。
 リズム調整にはそれなりに時間がかかる
(曲の長さやマシンスペックで変わります)
 タイミング合わせを最優先で行うので調整の
幅が若干狭まる(一応KotonoSyncにも様々
な変換設定を活用することで歌わせ方に幅を
持たせる事ができます)
ピヨ式調声法の特徴
 音階やリズムの調整が大変。
 一からフレーズを組み立てていくので自動調
整では見逃しがちなかわいさポイントを発見
できる可能性がある。
 コトノシンクでも結局細かい調整しようとす
るとそのあとにピヨ式調整法でフレーズを直
していく必要がある。
ピヨ式調声とKotonoSyncは
両立しない?
 どちらにもそれぞれの良さがあるので自分に
合った方を使いましょう。
 KotonoSyncはリズムの自動調整後に出来上
がったフレーズを更に調声する事も可能です。
 一つのフレーズの調声を物凄くこだわってい
くと一からピヨ式調声していく場合と時間的
に変わらない場合もある?
KotonoSyncの使い方
 改めてここからはコトノシンクの使い方を紹
介していきます。
 ただ、全ての設定を紹介するといくら時間が
あっても足りないので、特に重要な設定やよ
くある疑問に答えていく形にしていきます。
歌のデータを用意する1
 コトノシンクにはVOCALOID3または4で作っ
たVSQXファイルが必要になります。
 しかし2018年7月に発売されたVOCALOID5で
は保存時の形式がVSQXからVPRというファイ
ルに変わりました。
 じゃあ新しいボーカロイドからはコトノシン
クを使えない?
 Ver.2.0からVPR形式にも対応しました!
歌のデータを用意する2
 よくある質問「コトノシンクはボーカロイド
を持っていないと使えないの?」
 UTAUで作ったUSTファイルをVSQXに変換す
るConvMakiというUTAUプラグインおよび変
換アプリがあります!(作者:りばもさん)
 他の形式で作られたデータであっても探せば
変換ツールが公開されているかも・・・?
VOCALOID3/4 Editor
 元々コトノシンクで使うことを想定していた
アプリケーション。
 ボカロに歌わせるときの基本ソフトです。
 残念ながら新バージョン発表に関連して現在
生産分を持って販売が終了するようです。
 店舗などを探せばまだ売っているかも?
 こちらを持っているとほぼ差額でVOCALOID5
にアップグレードできる。
VOCALOID5
 最近発売された新しいボカロエディタ。
 様々なエフェクトをかけられるようになった
 シンガースキルやブレスなどの新機能沢山。
 でも残念ながらコトノシンクは読み込みだけ
でそれらの新機能に対応するような変換はで
きません。
Piapro Studio
 クリプトンから販売されているボーカロイド
製品などにバンドルされているボカロエディ
タ。これを使ってもVSQXが作成できます。
 この製品の独自形式のPPSFには対応していま
せん。
対応するボイスロイド
 今のところEXシリーズ以降のボイスロイド
に全て対応しています。
 前バージョンの琴葉姉妹は製品名にEXが
入ってませんが、EXシリーズと同等の機能
を有しているので歌わせる事ができます。
 もちろんボイスロイド2に対応しています。
 ・・・なぜかギャラ子Talkや音街ウナTalkEx
にも対応しています(コトノアシストも同様)
コトノシンクの設定を少し紹介
 していきます!
音声効果の話速に注意
 ボイスロイドのフレーズ編集で話速を0.5から
2.0の範囲で設定できますが、音声効果では最
大話速4.0まで選べるようになっています。
 テンポの速い曲では喋りが歌に追いつかない
場合があるので、事前に音声効果の話速を2.0
にする事で歌えるようになる場合も。
 例えば音声効果を2.0にするとフレーズ編集の
0.5から2.0の話速は1.0から4.0の数値に置き換
えられます。
話速目標値の設定
 ピヨ式調整法の場合も大事な部分ですが、単にリズム
を揃えるだけじゃなくてそれぞれの読みのモーラの話
速を高めや低めに出来るだけ合わせて調整する事がで
きます。
 先頭音の話速目標値を下げると子音の発音が丁寧に
なったりします。逆に上げるとハキハキした歌い方に
なります。
 長音の話速目標値は下げる方が比較的ロングトーンが
安定しやすいです。コトノシンクは元々長音の話速目
標値の初期値が0.5になっています。
 末尾の話速目標値は直前の高さの変化スピードが変わ
ります。高くするとケロケロボイスっぽく?
フレーズ分割の条件
 ボイスロイドはフレーズという単位で喋った
り歌ったりするので、音符という形で作られ
ている歌データもフレーズという形に置き換
えないといけません。
 コトノシンクは基本的に休符のある場所でフ
レーズを分割するようになっていますが、こ
れにはいくつかの例外があります。
ボカロの休符の仕様
 ボーカロイドは仕様で休符の長さが16分休
符未満になるとその前後で音を切らずに繋げ
る仕様があります。
 コトノシンクもそれに合わせて同じような長
さでは音を繋げるようになっています。
 不要な場合はこの設定をオフにしてください。
ボイロのポーズ長の制限
 ボイスロイドは任意ポーズの長さを80ミリ
秒未満に設定する事ができません。
 コトノシンクはフレーズ間の隙間まで正確に
調整しようとするので、もしこの休符が80
ミリ秒以下になってしまうと都合が悪いです。
 そこでコトノシンクでは休符が80ミリ秒未
満になりそうな場合はフレーズを分割せずに
代わりに促音を挟んで対応します。
そんな事言わずにフレーズを分
割したい!
 促音を使うとポーズを挟んだときと似たよう
な発音になる事もありますが、基本的に別物
です。
 ボイスロイド側の仕様に左右されずにフレー
ズ分割したいときはフレーズの強制分割機能
を使ってください。
琴葉姉妹で同じパートを歌う
 琴葉姉妹は感情無しで歌わせると聞き分けが
困難なくらいに同じ歌い方になります。
 そして同じパートを歌ってもらうと二人いる
事がわからなくなってしまうくらいです。
 コトノシンクのキー調整は小数点単位で設定
可能です。0.1とか0.2くらいずらせば別々に
聞こえる?
 リズム崩しで歌い方にゆらぎを持たせる事も。
他にも様々な設定があります
 息漏れ追加機能なんて言うのもあります。
 他にもボカロのVSQXファイルの解釈の仕方を
変えたり、読みにひらがなやカタカナを使い
分けることで無声化の指示を行うことも?
 PSDToolKitで使えるLAB形式のタイミング
ファイルを出力できます。口パクできるよ!
 全部の設定を知る必要はありません。必要に
なったらちょっとずつ設定を試していきま
しょう。
他のアプリの紹介
 Intervallo
ボイスロイドに歌わせた音声とVSQXファイル
やVPRファイルを使ってピッチ調整を自動的に
行えます。ボイロが本来歌えない高さも調整し
てくれてビブラートの効果を付ける事も。
 KotonoTone
ボイスロイドのロングトーンを整えてくれるア
プリです。動画を見れば大体わかるのでそちら
を見てね。
オマケ
 ボイスロイド2の感情の活用を考えてみる。
 ボイスロイド2の抑揚を0にすると喋り方の
変化がほぼ無くなってしまう。
 声質の変化は0.5以上で起こるけどその中間の
声を出す事ができない・・・
中間の声を出す方法を考える
 二つの音声を用意して重ねてみる
別々の二人が歌ってるように聞こえてしまう
 イコライザで上手く上げ下げしてみる
フォルマントの特徴とかを考えて上手くやれば
出来るかもしれないけど凄く大変・・・
 機械学習を試してみる?
そこまでせずにどうにかしたい
試作品を用意してみました
 こちらをご覧下さい。
KotonoFader コトノフェーダー
 二つの音声をいい感じに混ぜてみる実験的な
アプリです。
 今日の朝の7時前くらいに出来ました。
 そのせいでスライドの作成が大幅に遅れまし
た。本当にごめんなさい。
 大したテストしてないので実用性不明です。
どんなときに使える?
 複数の感情の中間の声がほしいとき
 複数の発音の中間の声がほしいとき
 歌だけじゃなくても喋りでも使えるかも?
 タイミングがほぼぴったり揃った二つの音声
が必要なので別キャラ同士だと上手くいかな
いかも?
 処理の性質上若干の音質の劣化が起きる?
・・・とりあえず何かに試してみてください!
今回の解説は以上です!
 非常に準備不足でごめんなさい!
 このままだとスライドが未完成すぎるので、
もう少し整えた上で後日公開します。
 コトノフェーダーはこのあと公開予定です。
 ここまでお付き合い頂きありがとうございま
した。

Contenu connexe

Tendances

伝えたいことを一瞬で伝えるスライド作成講座プラス
伝えたいことを一瞬で伝えるスライド作成講座プラス伝えたいことを一瞬で伝えるスライド作成講座プラス
伝えたいことを一瞬で伝えるスライド作成講座プラス
Takashi Fujimoto
 
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
Sho Iwamoto
 

Tendances (20)

The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022The VoiceMOS Challenge 2022
The VoiceMOS Challenge 2022
 
【出張ヒストリア2017】新しいUnreal AudioEngineでインタラクティブサウンドコンテンツはどこまでつくれるか!?
【出張ヒストリア2017】新しいUnreal AudioEngineでインタラクティブサウンドコンテンツはどこまでつくれるか!?【出張ヒストリア2017】新しいUnreal AudioEngineでインタラクティブサウンドコンテンツはどこまでつくれるか!?
【出張ヒストリア2017】新しいUnreal AudioEngineでインタラクティブサウンドコンテンツはどこまでつくれるか!?
 
音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?音声信号の分析と加工 - 音声を自在に変換するには?
音声信号の分析と加工 - 音声を自在に変換するには?
 
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
ゲーム音楽演出を進化させる「インタラクティブミュージック」と「音楽的ゲームデザイン」
 
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクトCREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
CREST「共生インタラクション」共創型音メディア機能拡張プロジェクト
 
統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展統計的音声合成変換と近年の発展
統計的音声合成変換と近年の発展
 
Unityでロボットの教師データは作れる!
Unityでロボットの教師データは作れる!Unityでロボットの教師データは作れる!
Unityでロボットの教師データは作れる!
 
Atomic Design という名のデザイン整理術
Atomic Design という名のデザイン整理術Atomic Design という名のデザイン整理術
Atomic Design という名のデザイン整理術
 
CRIWARE 最新情報 ~UE4 Editor × ADX2で加速するサウンドデザイン~ / GTMF2019
CRIWARE 最新情報 ~UE4 Editor × ADX2で加速するサウンドデザイン~ / GTMF2019CRIWARE 最新情報 ~UE4 Editor × ADX2で加速するサウンドデザイン~ / GTMF2019
CRIWARE 最新情報 ~UE4 Editor × ADX2で加速するサウンドデザイン~ / GTMF2019
 
UXデザインワークショップ資料 by ATOMOS DESIGN
UXデザインワークショップ資料 by ATOMOS DESIGNUXデザインワークショップ資料 by ATOMOS DESIGN
UXデザインワークショップ資料 by ATOMOS DESIGN
 
Ue4 bone controller
Ue4 bone controllerUe4 bone controller
Ue4 bone controller
 
Ergonomia e Gestão de Design
Ergonomia e Gestão de DesignErgonomia e Gestão de Design
Ergonomia e Gestão de Design
 
Statistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modelingStatistical voice conversion with direct waveform modeling
Statistical voice conversion with direct waveform modeling
 
伝えたいことを一瞬で伝えるスライド作成講座プラス
伝えたいことを一瞬で伝えるスライド作成講座プラス伝えたいことを一瞬で伝えるスライド作成講座プラス
伝えたいことを一瞬で伝えるスライド作成講座プラス
 
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
音源分離 ~DNN音源分離の基礎から最新技術まで~ Tokyo bishbash #3
 
【CEDEC2016】横スクロールARPG 「追憶の青」における 2Dキャラクターアニメーション〜2Dアニメの注意点とテクニック〜
【CEDEC2016】横スクロールARPG 「追憶の青」における 2Dキャラクターアニメーション〜2Dアニメの注意点とテクニック〜【CEDEC2016】横スクロールARPG 「追憶の青」における 2Dキャラクターアニメーション〜2Dアニメの注意点とテクニック〜
【CEDEC2016】横スクロールARPG 「追憶の青」における 2Dキャラクターアニメーション〜2Dアニメの注意点とテクニック〜
 
myCobotがある生活
myCobotがある生活myCobotがある生活
myCobotがある生活
 
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
ゲームにおけるインタラクションのための音楽技術「MAGI」~瞬間、波形、重ねて~
 
Riderはいいぞ!
Riderはいいぞ!Riderはいいぞ!
Riderはいいぞ!
 
Substanceのちょっといい話
Substanceのちょっといい話Substanceのちょっといい話
Substanceのちょっといい話
 

ごちゃまぜ歌ボTIPS! 歌うボイスロイドで様々なツールを有効活用しよう!(歌ボWS2)