SlideShare une entreprise Scribd logo
1  sur  51
Télécharger pour lire hors ligne
むげんミクうたと深層学習
石岡 卓也
クリプトン・フューチャー・メディア(株)
2018年6月23日(土)
自己紹介
• 石岡 卓也(@takisok)
– 2007年 北海道大学大学院 博士後期課程終了(情報科学)
• 専門は複雑ネットワーク
– 2015年からクリプトン・フューチャー・メディア(株)
• サービスの中で動いている機械学習部分などを担当
• 例: Domingo(https://domingo.ne.jp/)
– 地域密着型情報アプリ
– 情報のカテゴリ分類, 地名の認識, 嗜好に合わせた情報のおすすめなど
• 好きなボカロ曲
– Tell Your World, ダブルラリアット,
初音ミクがやってこない迷宮組曲
「むげんミクうた」とは
• 初音ミク発売10周年の記念に公開したサイト
– http://www.mugen-miku.com/
• ひたすらボカロっぽい歌詞を生成し続ける
• 個人として作成
作品例
• あるていど日本語っぽく見える歌詞
• 内容はおおむね意味不明
– まれに面白い表現がある
• 歌詞全体での一貫性はない
どのようにしてできている?
1. 歌詞データの入手
– 約3万曲分
2. seq2seq モデルで学習
– python + chainer
3. 学習したモデルを利用して歌詞を自動生成
– 生成した歌詞をDBに保存
4. Webサイト上に表示
– nginx + python + Flask
なぜ作ったのか
• 初音ミク10週年の2017年8月31日に合わ
せて何か作りたかった
– 「むげんミクうた」これまでの10年間の積み
重ねがあったからこそ作ることができる
• 文章の生成技術にブレークスルーがあった
– seq2seq による文書生成
初音ミク 10週年
• 初音ミク10周年記念サイト
http://piapro.net/miku10th/
10年ちょっと前
• 初音ミク発売
– 2007年8月31日
• 初音ミクが来ない?来た?騒動
– ワンカップP
– Amazonで購入したけどなかなか届かないことを歌にしてニコ
ニコ動画に投稿
• 毎日投稿される動画がすごく楽しかった
– 「何かが欲しい」ということがもうすでに珍しい
• 「ほしいものが、ほしいわ。」(糸井重里, 1988年)
– 「人間そのものの声」じゃなくても面白いものができる
文化的背景
1.名称の元ネタ
2.働き続ける機械
3.N次創作
4.歌詞作成が苦手な作曲者
名称の元ネタ
• 無限ピーマン
– 材料
• ピーマン千切り
• ツナ缶
• ごま油
• 中華スープの素
• 塩, 胡椒
– 調理方法
• 電子レンジで加熱
• 冷やす
無限に食べられそう!
→ これを無限と言えるなら、自動生成される歌詞
を無限と言っても怒られないよね
働き続ける機械
• 火星年代記 (1950年)
– 「優しく雨ぞ降りしきる」
• スケジュール管理や朝食の準備などが自動化され
た家
• 人がいなくなった後も動き続けている描写
• なんか良い
N次創作に加わる
• N次創作
– 「創作が創作を呼び起こす連
鎖反応(集団的創造現象)」
• (後藤、2012:468)
– 今ある歌詞の力を借りてでき
たシステム
– 誰かのインスパイアの助けに
なったら素晴らしい
いらすとや, https://www.irasutoya.com
曲は作れるけど
いつも歌詞が作れなくて
困るんだよね
やりましょう
技術的背景
1. 自然言語処理の発展
2. 人工知能とチューリングテスト
自然言語処理の発展
http://jp.wsj.com/articles/SB12090554170328684804
804581077034213786172
http://irorio.jp/nagasawamaki/20150630/241456/
2015年6月のニュース
• 紹介されていた対話の例
• 一見、話が通じているように見える
• 学習に映画の脚本データを利用
→ 映画に似たような表現があるだけでは?
人間: moralityを定義せよ。
機械: わたしにethics(倫理観)はない。
人間: わたしを助けてほしい。moralityについてもっと知りたいんだ。
機械: ethicsが何なのか分からない。
人間: それでは、どうしたらmorally(道徳的)に行動できるかを知りたい。
機械: どう伝えたら良いのか分からない。
人間: moralityとethicsは同じか。
機械: そうだ。
人間: わたしがどんなことをすると、非道徳的になるか。
機械: 知らない。
人間: 道徳的な行動の例をいくつか挙げてくれ。
機械: わたしはmoralist(倫理家)ではない。
人間: では、morality(の定義)は?
機械: integrity(誠実さ)だ。
人間: integrityって何?
機械: 申し訳ないが、他にどう説明すれば良いか分からない。
人間: 道徳的になれよ!
機械: 人間らしくしろよ!
http://jp.wsj.com/articles/SB12090554170328684804804581077034213786172
論文を確認してみた
• Oriol Vinyals and Quoc Le, A Neural Conversational Model,
https://arxiv.org/abs/1506.05869 , (2015).
– 7ページの論文
– 手法やモデルの説明は半ページくらい
– 残りはほぼ会話の実例
• 映画の台本から文字列を学習しているだけなので、機械が考えて話したり、
感情を持ったわけではない
→ 「人工知能が怒った」わけではない
• シンプルなモデルで会話らしい文字列を生成できているのがすごい → 技術
が発展しているのは事実
• それ以前の自然言語処理
– 形態素解析、係り受け解析、構文解析、意味解析
– 膨大な量の辞書
– 複雑なシステムで処理するのが普通だった
• Google 翻訳も2016年11月以降は LSTM ベースのものに
知能と文章
• チューリングテスト(1950)
– A. M. Turing “Computing Machinery and Intelligence”,
Mind 49: 433-460, (1950).
– 機械は考えることができるか?
• 話をして、人間と区別がつかないなら、その相手は「考えている」
と言えるだろう
• 姿や声に惑わされないようにチャットで
• 「話ができること」が知能の象徴だった
– 後に試してみると話の内容よりも「ゆっくりタタイピングする
」ことや「文字を修正する」ことで騙せることがわかったので
、今ではあまり盛り上がってない
1936 チューリングマシン
1946 ENIAC 情報公開
1950 チューリングテスト
1956 ダートマス会議
1958 常識とプログラム
Mackercy
1960~70’s エキスパートシステム
1972 Prolog
1982~ 第5世代コンピュータ
1992
1997 Deep Blue
チェスでカスパロフに勝利
2. 論理・推論・探索
1958 パーセプトロン
Hebb則による学習
1969 Minsky, Papert
「パーセプトロン」
性能と限界について詳述
1986 バックプロパゲーション
実用的な学習が可能に
2006 自己符号化器
2012 画像認識の精度向上
AlexNet
2013 Atariのゲームを攻略
DQN
2016 Google翻訳の精度が大幅向上
2017 Alpha go
碁で柯潔に勝利
4. ニューラルネット3. 機械学習
1967 k-平均法
1975 遺伝的アルゴリズム
1976 自己組織化写像
1989 Q学習
1992 非線形サポートベクタマシン
2003 Latent Dirichret Allocation
2006 PRML発売
2011 Watson
「Jeopardy!」で 勝利
2015 コンピュータ将棋
プロジェクト終了宣言
1950
1960
1970
1980
1990
2000
2010
1950 I, Robot
1951 アトム大使
1964 IBM System/360
1966 アニメ鉄腕アトム
1974 最初のパソコン
1977 Apple II
1982 PC-98
1983 ファミコン
2007 iPhone発売
2007 初音ミク発売
人工知能関連研究の歴史
1990 World Wide Web
1995 AIBO発売
1998 Google設立
人工知能
機械学習
統計的機械学習
Deep Learning
1. 計算
手法について
1.ニューラルネットワーク (1943)
– 神経細胞の働きをモデル化した人工ニューロンを、複数組み合わせて目的に
合った処理を行う手法
2.RNN(Recurrent Neural Network) (1982)
– ニューラルネットワークの中で、情報が一方向に流れるだけでなく、逆方向
の結合もあるもの
3.LSTM(Long Short-Term Memory) (1997)
– LSTM は RNN の信号が減衰しないように調整することで長期的な記憶を可
能にしたもの
– 忘却機能を追加されたものが広く利用されている
4.seq2seq(sequence to sequence) モデル (2014)
– 入力と出力が系列データであるモデル。LSTMを複数重ねて作ることが多い
– モデルで自然な会話文を生成
神経細胞
• 他のニューロンの軸索からシナプスを介して樹状突起につな
がっている
• 電位が一定の値を超えると発火する
– 超えなければ発火しない
– 出力は 0 か 1 か、のように見える
Public Domain, de Santiago Ramón y Cajal CC BY-SA 3.0, Original by en:User:Chris 73, updated by en:User:Diberri, converted to
SVG by tiZom - Own work,
https://en.wikipedia.org/wiki/Action_potential#/media/File:Action_potential.svg
軸索
樹状突起
人工ニューロンモデル
θ
x1
x2
x3
w1
w2
w3
y
0.
0.25
0.5
0.75
1.
1.25
-15 -10 -5 0 5 10 15
0
3
5
8
10
13
-15 -10 -5 0 5 10 15
0
0
1
1
1
1
-15. -10. -5. 0. 5. 10. 15.
階段関数: 初期に利用
シグモイド関数: 3層NNで利用
ReLU: 深いネットワークで利用
活性化関数( f(x) )の例
x
f(x)
x: つながっている先の発火状態
w: シナプス結合の強さ
θ: 発火の閾値
y: 対象ニューロンの発火状態
Feed Forward Neural Network
(FFNN)
• 左から入力された情報を右に伝えながら
出力
• 層の中には結合はない
• 1980年代には3層ニューラルネットワー
クが流行
• 最近は層を深くした深層学習が人気で、
よく研究されている
– 画像認識
– 分類, 回帰
1 2 3
in out
Recurrent Neural Network
(RNN)
• ループする結合がある
• 多くは層の内部で全結合
• 1ステップごとに各要素が入力に応じて更新される
– 「信号の流れが一方向ではない」だけ
– モデルとしてFFNNとは全く異なる
– 神経回路もループしてるところはありそう
• 内部状態を持つことになる
– 入力がなくても内部で信号を伝え続ける
• 自発的な行動が現れる
– 短期記憶、感情などに必要?
– 内部状態と入力によって次の自分の状態が決まる
• 多数の要素の相互作用の結果として現れる状態遷
移に関しては、複雑系や人工生命で研究されてき
た
• セルラーオートマトンやイジングモデル + 入力
in
out
LSTM
• Recurrent Neural Net (RNN)
– 入力信号がすぐに減衰してしまうことがわかった
• Long Short-Term Memory (LSTM)
– 長期的な記憶を保持するために、信号が減衰しないように調節し
たRNN (Hochreiter 97)
– 入力に応じて忘却もできるように拡張 (Gers 99)
わかるLSTM ~ 最近の動向と共に - Qiita :
http://qiita.com/t_Signull/items/21b82be280b46f467d1b
入力文字
LSTM1
文字IDから発火パターンへ変換
LSTM2
発火パターンから文字IDへ変換
出力文字
seq2seq
入力の処理と出力の生成
時間
入力
出力
V., Oriol and V. Le, Quoc, A Neural Conversational Model, 2015
実際に行ったこと
• python + chainer で文字単位の seq2seq モ
デルを作成して学習
– 参考:文字だけのRNNに自分の文章150万字を喰わ
せてみる - shi3zの長文日記
• https://shi3z.hateblo.jp/entry/2015/08/31/15443
4
• 自分のブログのデータから、自動的にブログを書くこ
とに挑戦している
• ほぼこのブログの通りで動く
– 文字コード周辺とバージョン違いの修整がある程度
• ブログが書けるなら歌も作れるのでは
seq2seq の実験
• 2種類のデータ
– ビジネスメール
• 標準的な文
• 論理的に一貫している
– 歌詞
• 新しい表現が多用される
• 論理は重視されない
ビジネスメールのテンプレート
• 動作確認と性能評価のために利用
• 通常の日本語で、意外な表現は少ない
• 利用した文例データ
– 社内メール文例一覧 - ビジネスメールの書き方~文例(社内メール・社
外メール・社交メール)~ : http://email.chottu.net/example/in-
office/index.html
– 118 件の文面を利用 (119 kB)
– 文字 1,214 種類
• LSTM 1層のニューロン数 = 1024, 512, 128
件名:健康診断実施のおしらせ
社員各位
総務部の山田太郎です。
この度、年度初めの異動に伴い一部担当者が変更となりますので、お知らせします。
4月1日付で、新たに斉藤加奈子さんが給与担当となります。
斉藤さんは資材部からの異動です。
当面、経理課長の鈴木さんとともに、業務にあたってもらうことになります。
給与担当だった今村たかこさんは、同日付で総務部に異動となります。
また、同日より勤怠管理表も斉藤さんが管理します。
勤怠管理・給与・等に関するお尋ねは斉藤さん、または課長の鈴木さんにお願いします。
なお、3月31日までは、今村さんが担当ですのでご承知おきください。
その他の変更はありません。ご質問などは、経理部(内線:123)にお問い合わせください。
以上よろしくご協力お願いいたします。
=============================
商品開発部 山田 太郎
内線 xxx
================================
件名:国内外留学派遣者の公募の案内
社員各位
お疲れ様です。人材開発室の山田です。
20××年度における国内外留学への派遣者を下記要領にて公募します。
有資格者の方はふるってご応募ください。
-------------------------------------------------------------------------------
株式会社 山田商事 営業部
山田 太郎(ヤマダ タロウ)
〒564-9999
大阪府○○市△△町11-9 2F
TEL:066-9999-9999(直通) 066-9999-9999 (代表)
FAX:066-9999-9999
------------------------------------------------------------------------------------
日時 :○月○日 午後○時~午後○時
場所 :本社3階第2会議室吹田工場製造部
議題 :「今後の商品開発について」、「今後の在庫管理について」
添付資料:お客様からのクレームについて、新製品パッケージデザイン
---------------------------------------------------------
=========================
総務部 山田 太郎
内線 xxx
=================================
N=1024
• 件名 → 内容 → 署名という構
造が再現されている
• 一つ一つの文は自然
• 件名は健康診断なのに内容が異
動関連になっているなど、内容
には一貫性がない
件名:2]例年ありませんのでご希望お申しくお願いいたします。
●調査対象及びレポート内容
・20~30代ファミリー(子ども有り世帯)
・キキャラクタを経験的を記入れます。
●実施期間
・○○年○○月○○日(○曜)~○○年○○月○○日(○曜)
<休暇日数>
・上記期間中にそれぞれ○○日間
<要項>
・ 休暇日数のうち、○○日間は有給休暇とする。
・ 各部・課ごとに適宜調整し、休暇予定一覧表を○○○課まで提出すること。
・ 調整の都合で連続休暇にしなくてもよい。
・ 各人は休暇届を所属長に提出すること。
以上
=============================
総務部 山田 太郎
内線 xxx
===============================
件名:11月業務連絡会のお知らせ
物産 各課ご担当者 各位
お仕事お疲れ様です。
総務部の山田太郎です。
新商品「ジェルクリームファンデーション」のターゲットは
30歳代の女性です。
つきましては、30歳代の女性社員全員に、
新年会の準レールを迎記しますので、
皆このようしあってたいたしまか?
2.この件に関し、参加していただきたくメールしました。
ご了解いただけるなら、上司の近藤課長宛に依頼書を正式にお出しします。
なお、取材は10月の中旬を予定していますが、日時は池田リーダのご都合に
合わせます。
お話しいただきたい内容は、ヒット商品○○○の開発物語です。
今週末までにご意向をお聞かせ願えれば幸いです。
お手数をかけますが、よろしくお願いします。
=============================
人事部 山田 太郎
内線 xxx
==============================
件名:夏期休暇に関する通知
社員各位
N=512
• 「キキャラクタ」「新年会の準
レール」などおかしな表現がで
てくる
件名:お世話にありとします人事業会調況
プットメ絡内容
総務部長 山田 太郎
お疲れ様です。
安疲時時までで、同社工領どきが丁材
斉例年場員(木)設(12年94時紙に行にないましたに、下記の通り方に期社内容のお軽を得りまた、物と見催いたします。
仕場を同じたそとなっていますが、
下決布いただけるでと、
ご事日者はは、虫担分、内公行メレーイトはメ労ルス→2分で対出待しています。
こに伺いが、、下記の明日間法に設承さ頭る予況について、、お客様について先○○○○○○○○○時。(より」23)全員によろし込下記の可日にくださいま。
「変添ブスグラーを性の紛罪完験が
住見先程、C内さるのメ師的を定えてかこ分ます。
不ひに招いて返切ました。
誠に迷定をどいただき。がは期受くついて、
ビント部を設アバンター組の発
の発理の半えで不村)容がありましたのでありと相省してお返れましたのでの
何こんにより設理展意の「成休ロルフ入で様の下心厳おこと添メテムをお祈すいします。
以上
==============================
営業部 山田 太郎
内線 xxx
=================================
件名:例社周例の秋事を動会議なお任休了記込行下この○○○X月○○年までに
お知びして件ません。
これれでで、関えかわ、身を開動してご目にだきました山田まです。
しに、竹の高吉年大智様には、金日課長出施に原やび束のみにします。
「変聞っ出けばいわら叱びを馳縮すると、
ございません。
なお、回者、竹月)1)かたの来行です。
男子間(○月○年変参戦ご連絡いたださいますした。
退業慰行との四ソー用をお止せるが、当務の説必い。
(例月中に配布を記入の説明の直問申してよさい。
京備事○○年○○日までに総7曜会の場に主印をみ申し込よきください。
■6. 5○長に、件でかか述めの総務部,当1前)に課内~午後1日(水)江と室○○2促)
32:1月時(/-以で確延はいばせていただくことですが、
ご迷惑の遣図についてよずお願いいたします。
==============================
人停告 山田 太郎
内線 xxx
==============================
件名:アミンテ変
N=128
• ほとんどが日本語として意味を
なさない文に
歌詞データ
• ボカロ関連の歌詞
– 約3 万曲
– トータルで約 260 万行(48MB)
– 文字 約 5,500 種
• 一部に英語、中国語、アラビア語などを含む
– htmlのタグはついたまま
– LSTM の要素数は N = 1024
• 特徴
– 元データの時点で一般的ではない表現が多い
• 面白い表現 ≒ 珍しい表現
– 日本語として一般的ではない表現があった場合の評価が難しい
• 教師データを忠実に再現したものか
• 学習不足によるものなのか
<br />
<div>
無機なった思いか度かープルチ玉
<br />
無魔も文細な夢機鹿
<br />
Nunged a beams lill aし
<br />
(unlacotief way luce.
<br />
無いけどそれはほだ理想車が入れるの
<br />
眠たわざめて夢と笑いだった&quot;
<br />
dok ゆっかけたいと)
</div>
<br />
<div>
my love uume.
<br />
My love it timl up byueaina. thapl
<br />
(</histast利933340仰万 (40原8(4落8鐘d構
/s..limodR↓冬」)ナイz))♪)ララマー)☆(">うご料ぶ
術を。―*底照щ)&quod
<br />
キミの真化路象主ソエロト)
<br />
消え去から、見慣りさえて
<br />
ものノマリわれひとか上げるよね
</div>
<br />
<div>
抜け雫は知らない
<br />
飛びること 忘れる波生
<br />
題んだとならそばな君の歌も 後に
<br />
歳記嫌って 在るから食識しない
<br />
あーかで ド浮常でさしい
</div>
<br />
<div>
ねえ PTlAOYリン…ルパイ?♪&lup ntes frubkur
tatud tou!)
0.10 epoch, 20min
<br />
最動議ぐ RAAd ねえ SlOCAPrONO
<br />
愛さぐほしいけどいっぱい(飲みねヒケル…」
</div>
<br />
<h2>リンチン猫</h2>
<div>
どうさで、今すり碧
<br />
<a hrep="http://wwTo3kistee/yw/wakw.astan'tion
gare a mining crak</s2></su>
<br />
☆Lallit beat
</div>
<br />
<div>
インテルボク視在探した足~と
<br />
アイツオリア♪
<br />
マルセハカの骗碧を覆って
<br />
たーたいぎ!!とる!
<br />
鼓動猫血を照らめ 生めて歪んでる
<br />
<br />
なぜ望間をチァー キュルのなんじゃ 送るたと償)
</div>
<br />
<div>
どうぞ 大切の歌
<br />
連やし 空白頼がのは 山ぽもかじでたしょ
</div>
<br />
<br />
<div>
どうして無いこと集め尽くしよ
<br />
ほんの景だろね くるって しますすき起して
<br />
僕は 其が然かえ 水彩窓がt
• 日本語が怪しいレベル
• htmlタグのように繰り
返し出てくるものは適切
に出力できている
<h2>おすつにほしいこいが</h2>
<div>
きっと心切った場所なら 君はまたたこにすぐにまだ
<br />
ァッショ、スタイムでのばかりのある 君が欲しくて
<br />
あなたの中を見るわけないのです
</div>
<br />
<div>
言ってみせるとてながら
<br />
もっと上げちゃんかになる
<br />
まるで女子話なんだから)って
<br />
嘆いてゆこうとしてると思えるから
</div>
<br />
<div>
照るぼくが 一つのゼイド
<br />
覚えている日の いたずらに
<br />
渡れや? いつの日も響かせるから
</div>
<br />
<div>
キスを繋ぐよ ほんとかやっぱいんだ
</div>
<br />
<div>
いるぶんの玉になる・・・
</div>
<br />
<br />
<div>
鳴り止んだ詩然 僕の言葉は
<br />
偶然僕らが 隠れたのは誰?
<br />
5!z丁35回利いて
<br />
遠く求めて…
<br />
真っ白な世界で 居続けた。
0.50 epoch, 2 hour
</div>
<br />
<div>
やっと気付いてよ
</div>
<br />
<div>
また 私のカフェロデ
<br />
キャンバスの音 見れない
<br />
来始めながら生まれていった
</div>
<br />
<h2>とーむころ</h2>
<br />
<div>
初めて言う声で理由したくはないけど
<br />
ぼくしたいは知らないほど、ずっと少い欲しくて
<br />
僕の難想が舞いしますんだあなたは
<br />
何だかんだ 視えてん明日が
<br />
秒針が調べよ それだけはゆったままで
<br />
あの頃と二人でかかるの
<br />
だけど君は言う 辛くて変わること
<br />
こんなに苦しくて、あたしだけが出来てる
</div>
<br />
<div>
失いは最後に、見える力にから
<br />
無数な私に 6端の僕を
</div>
<br />
<div>
本当に言い知っているだろうか
<br />
あいしていたんだよ
<br />
• 単語はある程度日本語ら
しくなってきた
• 文として成り立っていな
いことが多い
• 学習したモデルによる歌詞生成まとめ
– 「歌詞のようなもの」は生成できる
• 特に html タグのように何度も同じ表記で現れるものは安定
して出力される
• <h2>~</h2>, <div>~</div> のような表記も可能
– 歌詞全体での一貫性は無い
• Googleの論文では意味がありそうな対話が出力できている
ので、データ量やパラメータ、学習時間の問題かも
– ITヘルプデスクの例で N = 1,024
– 映画脚本の例で N = 4,096
• このままでは小説は難しそう
– 案
» 全体の構成を担当するNNと、詳細な表現を担当するNNを作成
する
» GANのように評価者を導入する
Webサービスとしての実装
システム構成
歌詞モデル
(LSTM)
歌詞データDB
(MySQL)
歌詞データ
歌詞生成プログラム:
python + chainer
Webサーバー:nginx
サーバーマシン: さくらのVPS
GPU: なし
学習用マシン: Ubuntu
GPU: NVIDIA GTX970
低コストの作品
• もともとは深層学習のテスト用として試作したもの
– LSTM 面白い
• python + Flask
• htmlファイル×3, css×1
• レンタル料安くするためにサーバーではGPU使ってない
– モデル学習時には使用
• 歌詞作成は Webサーバー上の CPU
– 20 秒に一曲程度
– 遅くても気にならないように、予め生成しておいたものを表示するように
– 「ずっと作り続ける」のを重視
– 真面目にGPU使ったりすれば 1 秒以内に一曲できるので、ユーザーからの
入力に応じた歌詞なども可能かも
公開後
http://www.itmedia.co.jp/news/articles/1709/01/news125.html
https://twitter.com/itohh/status/903204322632019968?re
f_src=twsrc%5Etfw&ref_url=http%3A%2F%2Fwww.itmedia.
co.jp%2Fnews%2Farticles%2F1709%2F01%2Fnews125.html
twitter の反応
• 好意的な反応
– 面白いwww
– まさに求めてた
– 意味はわからないけど雰囲気はそれっぽい
– 中国語での紹介
• 貴重なご意見も
– 歌詞の質が低い
– ランダムに表示しているだけでAIとは呼べ
ない
応用例
「Hey MIKU!」への応用
• Amazon Alexa のスキル
– 簡単な言葉でミクと話せる
• 2018年3月30日のバージョンアップ
– 人工知能(AI)作詞の楽曲を歌う機能が追加
– 紹介動画
• https://www.youtube.com/watch?v=hvlpoe0U-eg
https://www.crypton.co.jp/cfm/news/2018/03/30_heymiku
6月21日 Echo Spot にも対応
http://blog.piapro.net/2018/06/mon18062101.html
楽曲を自動生成したい
• 曲と歌詞の両方は、現状ではハードルが高い
• 曲を数種類に限定して、その曲に合うように歌詞を生成
• 歌詞の拍数を決めておく
– 俳句なら 5,7,5 拍
– 拍数 ≠ 文字数
• 「ゃ」「ゅ」「ょ」は0拍
– 「シャツ」2拍、「チョコ」2拍
• 「っ」は1拍
– 「コップ」3拍
• 漢字 1拍~、記号 0拍
– 拍数は 57577 に決定
• 短歌のリズムとして昔から親しまれている
• 問題設定: 欲しい拍数が予め決まっている歌詞生成
参考: 偶然短歌 bot
• 偶然短歌bot
– https://twitter.com/g57577
– Wikipediaから偶然に短歌の拍数になっている
部分を抽出して公開する bot
• 形態素解析エンジンMeCabにて文章中から短歌を
抽出 - inaniwa3's blog :
http://inaniwa3.hatenablog.com/entry/2015/
01/01/152927
– こちらのプログラムを参考にして特定の拍数の
歌詞を発見
HeyMIKU! の歌詞生成の手順
1.歌詞データから拍数が合う箇所を抽出
2.seq2seqで学習
3.チェック処理
– 拍数が合っているか
– 既存の歌詞と一致していないか
4.出力
生成された歌詞の例
• 幾千の星に願うよキミはまだ 信じていたい僕の手を取り
• 月の海ぶつかっていく巡りゆく みんな名前を付け見つめてた
• 生きていく聞きたいだけど気づいてる こっちにだってキミに会う
ため
• 君だけの音を流して紛れ込む 花この色を消して行くのさ
全体のまとめ
• ボカロっぽい歌詞を生成し続ける「むげんミクうた
」を作成した
– 文化的背景
• 初音ミク 10週年
– 技術的背景
• 深層学習による自然言語処理の発展
• 影響
– いくつか反応をいただけた
• その後
– HeyMIKU! への応用
– db analytics showcase 2018 で発表

Contenu connexe

En vedette

Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
Kurio // The Social Media Age(ncy)
 

En vedette (20)

PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 
More than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike RoutesMore than Just Lines on a Map: Best Practices for U.S Bike Routes
More than Just Lines on a Map: Best Practices for U.S Bike Routes
 
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
Ride the Storm: Navigating Through Unstable Periods / Katerina Rudko (Belka G...
 
Barbie - Brand Strategy Presentation
Barbie - Brand Strategy PresentationBarbie - Brand Strategy Presentation
Barbie - Brand Strategy Presentation
 

むげんミクうたと深層学習