SlideShare une entreprise Scribd logo
1  sur  42
Télécharger pour lire hors ligne
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ヤフー株式会社 上席研究員 鍜治伸裕 (@nobuhirokaji)
大規模発話ログデータを活用した
音声対話処理
情報処理学会 第232回自然言語処理研究会 招待講演資料
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
音声対話型インタフェースの時代
あらゆるデバイスに人工知能が搭載されるIoT時代の到来
ヒトとモノが音声対話でコミュニケーションできる世界が目前に
2
http://i.gzn.jp/img/2016/05/10/viv/s01.jpg
http://images.techhive.com/images/article/2017/01/echodothome-100704745-large.3x2.jpg
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
Yahoo! 音声アシスト
3
累計250万ダウンロード以上
音声対話でスマホを操作できるアプリ
https://www.amazon.co.jp/gp/product/B00OIWNED6
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
世の中の動向に反して
学会で音声対話は盛り上がっていない?
4
https://chairs-blog.acl2017.org/2017/02/15/statistics-on-submissions-and-status-update
ACL2017におけるエリアごとの論文投稿の状況
dialog and interactive
systems
(第9位)
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
5
新聞記事
ツイートブログ記事
医療系テキスト
近年のデータ駆動型NLPの進展は
大量のテキストデータの存在に支えられている
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
対話データは蓄積が進んでいない
6
独話データ量
対話データ量
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
我々のやり方:アプリを公開してデータ収集
7
累積250万以上のユーザ群
アプリサーバ
長年(5年)に渡って蓄積された
大規模な対話ログデータ
模擬ではない
リアルな対話のやりとり
世界的にも稀有な音声対話研究基盤を構築
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
発話のバリエーションと頻度が一目瞭然:
スマホの音量を上げる場合
8
頻度 発話
8791 聞こえない
7334 音大きく
3323 音量上げて
1910 もっと大きく
1756 音量を上げて
1745 声が小さい
1736 音を大きく
1040 音が小さい
893 声を大きく
843 音大きくして
頻度 発話
760 音量を大きく
707 音量大きくして
684 音量最大
641 音量大きく
546 音量を上げる
514 音量アップ
491 ボリュームアップ
407 ボリュームを上げて
394 音量を大きくして
… …
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
発話ログデータ収集と研究開発の
好循環を生み出す
9
発話ログを活用したデータ駆動型の対話研究の推進
大量の発話ログデータを収集 研究成果に基づくシステム改善
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
将来的ユーザエンゲージメントの予測
Shumpei Sano, Nobuhiro Kaji, and Manabu Sassano.
Prediction of Prospective User Engagement with Intelligent
Assistants. In Proc. of ACL16.
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
“将来的エンゲージメント=今後もシステムを
使い続けてもらえるかどうか”を予測
11
• ユーザの満足度(Jiang+ 15)を測る新しい指標になりうる
• 使わなくなりそうなユーザに集中的に働きかけることができる
?
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
エンゲージメントの研究に新しい視点を導入
12
従来研究におけるエンゲージメント(Wang and Hirschberg, 11):
今、システムとの対話に没頭しているか
本研究におけるエンゲージメント:
将来的に対話システムを継続して使うか
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
Yahoo! 音声アシストの対話例
• マルチドメインなタスク型対話、雑談やゲームなども行う
13
今日も勉強
頑張って下さい!
今日の東京の天気
は晴れでしょう…
東京11時10分発の
新幹線があります…
東京から新大阪まで
何時に到着?
13時40分到着です
今日の天気は?
今日は朝から授業
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
発話ログデータ
User
ID
時刻 発話 システム応答 応答型
(ドメイン)
A 3/1 23:50 明日8時に起こして アラームを8時にセットしま
した
アラーム
3/2 08:10 おはよう おはようございます 雑談
3/2 08:13 今日の天気調べて 今日の東京の天気は晴れ
でしょう
天気
B 3/1 08:00 東京駅から京都駅まで 9時30分発の新幹線があり
ます
路線案内
3/1 08:01 着くのは何時? 京都には11時50分に到着し
ます
路線案内
3/5 19:10 しりとりしよう いいですよ “りんご” しりとり
14
* 表はイメージです。実際のログとは一部異なっている場合があります。
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
2つのタスクを提案:
離脱予測とエンゲージメント度予測
• 16週間分のログから348,295のユーザを無作為抽出
• 対象ユーザの全7,472,915発話とそれに対する応答を抽出
15
観測期間の発話ログ
(最初8週間)
予測期間の発話ログ
(最後8週間)
……
……
……
……
……
……
……
……
発話があるかないかを予測
セッション数を予測
(4値に離散化)
ユーザごとに予測
離脱予測
エンゲージメント度予測
?
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
特徴量の設計(一部のみ抜粋)
種類 具体例
観測期間の最後n週間における発話数(n=1, 2,…, 8)
発話数 観測期間の最後n週間におけるセッション数(n=1, 2,…, 8)
k番目のクラスタに属する発話数(k=1, 2, …100)
ある応答型tの応答が返された回数(tは検索、アラームなど66種)
応答数 長い(50文字以上の)応答が返された回数
エラーメッセージが返された回数
発話間隔時間(日数)の最大値
発話間隔 発話間隔時間(日数)の最小値
発話間隔時間(日数)の平均値
ユーザ属性 ニックネームの登録の有無
年齢(20代未満, 20代、30代、40代、50代、60代以上)
16
*実数値素性は自然対数で正規化
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
実験結果
• 学習アルゴリズムは SVM と SVR を使用
• ユーザを訓練、開発、評価に分割して実験
• セッション数素性のみを用いたベースラインを大きく改善
17
分類精度 F値 MSE ρ
ベースライン 0.568 0.482 0.784 0.595
提案法 0.776 0.623 0.578 0.727
発話数素性 0.702 0.578 0.632 0.693
応答数素性 0.548 0.489 0.798 0.584
発話間隔素性 0.746 0.617 0.645 0.692
ユーザ属性素性 0.399 0.406 1.231 0.146
離脱予測 エンゲージメント度予測
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
観測期間の長さと予測精度の関係
• 基本的には観測期間が長いほど予測精度が向上
• 特に1週間から2週間に伸ばしたときの改善が顕著
18
観測期間の長さ 観測期間の長さ
離脱予測 エンゲージメント度予測
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
(Sano, Kaji, and Sassano, ACL16) のまとめ
• “将来的エンゲージメント”というエンゲージメントに対する
新しい視点を提案
• 大量の発話ログを活用することによって、将来のユーザ
行動(≒ 満足度)をある程度予測できることを示した
• 大規模なサービスを運用することによって、初めて見えて
くる/取り組むことのできる研究課題
19
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
修正発話の原因判定
Shumpei Sano, Nobuhiro Kaji, and Manabu Sassano.
Predicting Causes of Reformulation in Intelligent Assistants.
In Proc. of SIGDIAL17.
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ユーザとの対話を通じて自立的に学習する
システムの実現に向けて
21
ユーザがシステムを“普通に”利用
(明示的な教師信号や報酬は与えない)
ユーザとの対話の経験を通して
自立的に学習、成長
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ユーザの修正発話に着目
22
間違った応答
修正発話
“アラームの”ウェブ検索結果
はこちらです…
アラーム
アラームを起動して
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
本研究のゴール:
修正発話の原因となるエラー源の自動検出
23
音声認識
言語理解
言語生成
知識ベース
ユーザ発話
システム応答
ウェブAPI
対話システム
外部システム/資源
エラーの発生源が特定できれば(半)自動訂正につながる
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
ログから類似発話の繰り返しを抽出し
エラー原因をアノテーション
24
今日の東京の
天気は晴れ…
“アラーム”の
ウェブ検索結果は…
申し訳ありません
よく分かりません…
私の年齢は…
エラー無し(387発話) 音声認識エラー(317発話)
言語理解エラー(173発話) 言語生成エラー(51発話)
今日の天気は?
じゃあ明日の天気
今日の転勤
今日の天気は?
アラーム
アラームを起動
あなたの名前は
なんていうの?
あなたの名前は?
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
様々な特徴量を設計
25
“アラームの”ウェブ検索
結果はこちらです…
はい。アラームを起動します。
発話時間間隔
Domain: アラーム
ASR Conf.: 0.7
ASR Conf.: 0.9
修正タイプ(ADD, OMIT等)
…
編集距離
Domain: ウェブ検索
Intent: SEARCH(アラーム)
Intent: START
domain、intent(slot値など)などの一致
ASRの確信度
アラーム
アラームを起動して
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
原因判定実験の結果
• SVM を用いて10分割交差検定
• 発話の表層情報だけでなくエラー原因ごとに作りこまれた素
性を使うことでF1値が向上
26
エラー無し 音声認識
エラー
言語理解
エラー
言語生成
エラー
ベースライン 0.58 0.59 0.36 0.03
+音声認識素性 0.66†† 0.67†† 0.35 0.16
+言語理解素性 0.71†† 0.65 0.43 0.25†
+言語生成素性 0.55 0.57 0.32 0.08
提案法(+全素性) 0.75†† 0.72†† 0.49† 0.33††
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
混同行列の分析
27
エラー無し 音声認識
エラー
言語理解
エラー
言語生成
エラー
エラー無し 284 55 27 21
音声認識
エラー
38 230 37 12
言語理解
エラー
44 29 81 19
言語生成
エラー
8 12 11 20
正解
予測
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
(Sano, Kaji, and Sassano, SIGDIAL17) のまとめ
• ユーザとの対話の中で、システムが自立的に学習を行う
ことのできる枠組みの実現は、対話研究における大目標
の一つ
• 修正発話は、ユーザからの暗黙的フィードバックであり、こ
れを学習に活用することは非常に重要な課題
• 修正発話が行われたエラー原因を自動判定するという新
しい研究課題に取り組んだ
• エラーの自動訂正などが今後の課題
28
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
雑談発話の検出
Satoshi Akasaki and Nobuhiro Kaji.
Chat Detection in an Intelligent Assistant. In Proc. of ACL17.
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
これまでの音声対話システムは
タスク型と雑談型に分けて研究されてきた
• タスク型
30
• 雑談型
はい。豊田駅周辺の
イタリアンレストランは…
歩くといい運動になって
よいと思いますよ!
この近くにある
イタリアン料理の店調べて
駅から日野キャンパスまで
遠くない?
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
近年、アシスタント型システムの出現により
タスク型と雑談型の区別は曖昧に
31
A.L.I.C.E. (Wallace 09)
Eliza (Weizenbaum 66)SHRDLU (Winograd 72)
ATIS (Price 90)
Let’s GO (Raux+ 05)
しゃべってコンンシェル (吉村 12)
Siri (Bellegarda 14)
Cortana (Sarikaya 17)
Yahoo! 音声アシスト (磯+ 13)
雑談型タスク型
アシスタント型
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
雑談を意図したユーザ発話の検出が
新しい課題になる
32
気象情報 API の呼び出し
携帯端末の操作
雑談生成モデルの駆動
(seq2seqなど)
従来の雑談生成に関する研究では抜け落ちていたタスク
非雑談
雑談
今日の大阪の
天気は?
8時にアラーム
鳴らして
明日の仕事
休みたいなぁ
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
教師データを構築して分類器を学習
• 15160発話をクラウドソーシングを利用してラベル付与
• 各発話ごと7名の多数決(雑談/非雑談: 4833/10327)
• SVM と CNN の2つの分類器を学習、比較
33
ラベル 発話 得票数
雑談 お話ししよう 5
趣味はなんですか? 7
今月は休みがありません 5
非雑談 富士山の写真みせて 6
近くのおいしいレストラン 7
9時10分に起こして 7
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
一工夫する:ツイートとウェブ検索ログを活用
• リプライのついたツイート≒雑談発話
34
やっと仕事終わったよー!
USER1 @xxx
@USER1 お疲れ様!
USER2 @xxx
おはようございます〜
USER3 @xxx
@USER3 おはよ!
USER4 @xxx
東京の天気
オムライスの作り方
君の名は。
ヤフー知恵袋
• ウェブ検索ログ≒タスク要求発話
それぞれGRU言語モデルを学習し対数尤度を特徴量に
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
実験結果
• ベースライン(ツイートLM、内製)の精度を大きく改善
• 言語モデル(LM)素性の有効性を確認
35
手法 分類精度 適合率 再現率 F値
ツイート LM 72.07 54.54 74.48 62.94
内製の意図判定システム 78.31 62.57 79.51 70.03
SVM 91.35 87.62 84.88 86.21
SVM + ツイート/クエリ LM 92.15 88.61 86.50 87.53
CNN 90.84 87.03 83.80 85.36
CNN + ツイート/クエリ LM 91.48 87.78 85.18 86.56
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
発話長と分類精度の関係
• LM素性は極端に短いまたは長い発話に有効
36
分類精度
発話長(文字数)
SVM SVM+LM素性
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
(Akasaki and Kaji, ACL17) のまとめ
• タスク型と雑談型という音声対話システムの分類は過去の
ものになりつつあり、二つのシステムは融合し始めている
• タスク型と雑談型の切り替えが新しい技術課題になる
• 雑談をドメインの一つと捉えているという見方も
• ツイート等の外部資源の活用は、単純な教師有り学習から
の脱却に向けた有望なアプローチの一つ
37
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
Take Home Messages
• IoTの時代は必ずやって来る。音声対話はそのときに基盤を
担う可能性の高いNLP技術
• 大規模なサービスを運用することは、音声対話研究のため
のデータ収集に極めて有効な手段
• リアルな発話ログデータは面白いし、それを分析することに
よって新しい研究課題がどんどん見えてくる
38
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
We’re Hiring!
• ヤフー株式会社ではデータサイエンティスト(a.k.a., 機械
学習エンジニア)を新卒、経験者ともに通年募集中
• もちろんリサーチャー、エンジニア、デザイナーも
• 詳細は公式採用ページをご覧ください
http://hr.yahoo.co.jp
39
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
参考文献
• Price. 1990. Evaluation of spoken language systems: the ATIS Domain.
In Proc. DARPA Speech & Natural Language Workshop.
• Raux et al. 2005. Let's Go Public! Taking a spoken dialog system to
the real world. In Proc. InterSpeech.
• Weizenbaum. 1966. Eliza–a computer program for the study of natural
language communication between man and machine. Communications of
the ACM.
• Winograd. 1972. Understanding Natural Language. Academic Press.
• Wu et al. 2016. りんな: 女子高生人工知能. Proc. of NLP.
• 磯 et al. 2013. 「音声アシスト」の音声認識と自然言語処理の開発. 音声
言語情報処理研究会.
• 鹿野 et al. 2012. 音声情報案内システム「たけまるくん」の運用. 情報処
理学会全国大会
• 吉村. 2012. しゃべってコンシェルと言語処理. 音声言語情報処理研究会.
41
Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
参考文献
• Akasaki and Kaji. 2017. Chat Detection in an Intelligent Assistant,
Proc. of ACL.
• Ballegarda. 2014. Spoken Language Understanding for Natural
Interaction: The Siri Experience. Natural Interaction with Robots,
Knowbots and Smartphones.
• Sano et al. 2016. Prediction of Prospective User Engagement with
Intelligent Assistants. Proc. of ACL.
• Sano et al. 2017. Predicting Causes of Reformulation in Intelligent
Assistants. Proc. of SIGDIAL.
• Sarikaya. 2017. The Technology Behind Personal Digital Assistants.
IEEE Signal Processing Magazine.
• Wallace. 2009. The Anatomy of A.L.I.C.E.
42

Contenu connexe

Tendances

[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...
[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...
[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...Deep Learning JP
 
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​ARISE analytics
 
AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ Yasuhiro Matsuo
 
Python に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろはPython に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろはDaiyu Hatakeyama
 
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチgriddb
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介Recruit Technologies
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-Takahiro Kubo
 
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術実環境音響信号処理における収音技術
実環境音響信号処理における収音技術Yuma Koizumi
 
Data-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組みData-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組みTakeshi Suzuki
 
Challenges for machine learning systems toward continuous improvement
Challenges for machine learning systems toward continuous improvementChallenges for machine learning systems toward continuous improvement
Challenges for machine learning systems toward continuous improvementAki Ariga
 
クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法Hiroshi Nakagawa
 
人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考えるHiro Hamada
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Textharmonylab
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3までYahoo!デベロッパーネットワーク
 
Motpy ros rosjp
Motpy ros rosjpMotpy ros rosjp
Motpy ros rosjpRayAr3
 
PMBOKガイド7をアジャイル屋はどう迎え撃つか?
PMBOKガイド7をアジャイル屋はどう迎え撃つか?PMBOKガイド7をアジャイル屋はどう迎え撃つか?
PMBOKガイド7をアジャイル屋はどう迎え撃つか?豆寄席 (株式会社豆蔵)
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Fumihiko Takahashi
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...NTT DATA Technology & Innovation
 
LLMとプランニングの世界
LLMとプランニングの世界LLMとプランニングの世界
LLMとプランニングの世界Carnot Inc.
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...Google Cloud Platform - Japan
 

Tendances (20)

[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...
[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...
[DL輪読会]Memory-Augmented Attribute Manipulation Networks for Interactive Fashi...
 
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
【論文レベルで理解しよう!】​ 大規模言語モデル(LLM)編​
 
AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ AWSでGPUも安く大量に使い倒せ
AWSでGPUも安く大量に使い倒せ
 
Python に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろはPython に行く前に Excel で学ぶデータ分析のいろは
Python に行く前に Excel で学ぶデータ分析のいろは
 
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ
施設管理におけるエネルギーマネジメント・故障予兆検知を実現するデータ活用アプローチ
 
リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介リクルート式 自然言語処理技術の適応事例紹介
リクルート式 自然言語処理技術の適応事例紹介
 
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
文章を読み、理解する機能の獲得に向けて-Machine Comprehensionの研究動向-
 
実環境音響信号処理における収音技術
実環境音響信号処理における収音技術実環境音響信号処理における収音技術
実環境音響信号処理における収音技術
 
Data-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組みData-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組み
 
Challenges for machine learning systems toward continuous improvement
Challenges for machine learning systems toward continuous improvementChallenges for machine learning systems toward continuous improvement
Challenges for machine learning systems toward continuous improvement
 
クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法クラシックな機械学習の入門  11.評価方法
クラシックな機械学習の入門  11.評価方法
 
人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える人類のデータを使って学習する 人工主体の公共的役割を考える
人類のデータを使って学習する 人工主体の公共的役割を考える
 
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated TextAll That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
All That’s ‘Human’ Is Not Gold Evaluating Human Evaluation of Generated Text
 
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
深層学習による自然言語処理入門: word2vecからBERT, GPT-3まで
 
Motpy ros rosjp
Motpy ros rosjpMotpy ros rosjp
Motpy ros rosjp
 
PMBOKガイド7をアジャイル屋はどう迎え撃つか?
PMBOKガイド7をアジャイル屋はどう迎え撃つか?PMBOKガイド7をアジャイル屋はどう迎え撃つか?
PMBOKガイド7をアジャイル屋はどう迎え撃つか?
 
Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究Active Learning の基礎と最近の研究
Active Learning の基礎と最近の研究
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
LLMとプランニングの世界
LLMとプランニングの世界LLMとプランニングの世界
LLMとプランニングの世界
 
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
[Cloud OnAir] 事例紹介: 株式会社オープンハウス 〜Google サービスを活用したオープンハウスの AI の取り組み〜 2020年11月1...
 

En vedette

Big Data Analytics Tokyo講演資料
Big Data Analytics Tokyo講演資料Big Data Analytics Tokyo講演資料
Big Data Analytics Tokyo講演資料BrainPad Inc.
 
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料The Japan DataScientist Society
 
経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)Masashi Sekino
 
失敗から学ぶ データ分析グループの チームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶ データ分析グループの チームマネジメント変遷 (デブサミ2016) #devsumiTokoroten Nakayama
 
ニューラル機械翻訳の動向@IBIS2017
ニューラル機械翻訳の動向@IBIS2017ニューラル機械翻訳の動向@IBIS2017
ニューラル機械翻訳の動向@IBIS2017Toshiaki Nakazawa
 

En vedette (6)

Big Data Analytics Tokyo講演資料
Big Data Analytics Tokyo講演資料Big Data Analytics Tokyo講演資料
Big Data Analytics Tokyo講演資料
 
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
データサイエンティスト協会スキル委員会2ndシンポジウム講演資料
 
経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)経験ベイズ木(IBIS 2017)
経験ベイズ木(IBIS 2017)
 
失敗から学ぶ データ分析グループの チームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi失敗から学ぶデータ分析グループのチームマネジメント変遷 (デブサミ2016) #devsumi
失敗から学ぶ データ分析グループの チームマネジメント変遷 (デブサミ2016) #devsumi
 
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料#ibis2017 Description: IBIS2017の企画セッションでの発表資料
#ibis2017 Description: IBIS2017の企画セッションでの発表資料
 
ニューラル機械翻訳の動向@IBIS2017
ニューラル機械翻訳の動向@IBIS2017ニューラル機械翻訳の動向@IBIS2017
ニューラル機械翻訳の動向@IBIS2017
 

Similaire à 大規模発話ログデータを活用した音声対話処理

Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告Yuki Saito
 
Ibm watson api サービス
Ibm watson api サービスIbm watson api サービス
Ibm watson api サービスHiroaki Komine
 
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版GREE VR Studio Lab
 
Interop2017
Interop2017Interop2017
Interop2017tak9029
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例Yahoo!デベロッパーネットワーク
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Institute Japan
 
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演Hironori Washizaki
 
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)KIT Cognitive Interaction Design
 
生成AIが切り拓く新しいゲームの創り方・遊び方
生成AIが切り拓く新しいゲームの創り方・遊び方生成AIが切り拓く新しいゲームの創り方・遊び方
生成AIが切り拓く新しいゲームの創り方・遊び方KLab Inc. / Tech
 
音声感情認識の分野動向と実用化に向けたNTTの取り組み
音声感情認識の分野動向と実用化に向けたNTTの取り組み音声感情認識の分野動向と実用化に向けたNTTの取り組み
音声感情認識の分野動向と実用化に向けたNTTの取り組みAtsushi_Ando
 
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!Shingo Mori
 
Call Center Watsonのご紹介
Call Center Watsonのご紹介Call Center Watsonのご紹介
Call Center Watsonのご紹介Hiroshi Tomioka
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略NVIDIA Japan
 
Sig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_otaSig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_ota博三 太田
 
学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割Takuya Nishimoto
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムKomei Sugiura
 
2018aiexpo natural language_processing_group
2018aiexpo natural language_processing_group2018aiexpo natural language_processing_group
2018aiexpo natural language_processing_groupir-alt
 

Similaire à 大規模発話ログデータを活用した音声対話処理 (20)

対話システム, 南泰浩
対話システム, 南泰浩対話システム, 南泰浩
対話システム, 南泰浩
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告
 
Nishimoto110111twcu p2
Nishimoto110111twcu p2Nishimoto110111twcu p2
Nishimoto110111twcu p2
 
Ibm watson api サービス
Ibm watson api サービスIbm watson api サービス
Ibm watson api サービス
 
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
#VRSionUp!6 特集「先端ボイチェン研究」Slideshare公開版
 
Interop2017
Interop2017Interop2017
Interop2017
 
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例ヤフー音声認識サービスでのディープラーニングとGPU利用事例
ヤフー音声認識サービスでのディープラーニングとGPU利用事例
 
SAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AISAS Viya Deep Dive: 自然言語処理&AI
SAS Viya Deep Dive: 自然言語処理&AI
 
Jacet2014ykondo_final
Jacet2014ykondo_finalJacet2014ykondo_final
Jacet2014ykondo_final
 
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演
Pythonを含む多くのプログラミング言語を扱う処理フレームワークとパターン、鷲崎弘宜、PyConJP 2016 招待講演
 
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
対話システムにおけるインタラクション 技術のこれまでとこれから:携帯機器での音声情報検索案内システムを例として(南 泰浩)
 
生成AIが切り拓く新しいゲームの創り方・遊び方
生成AIが切り拓く新しいゲームの創り方・遊び方生成AIが切り拓く新しいゲームの創り方・遊び方
生成AIが切り拓く新しいゲームの創り方・遊び方
 
音声感情認識の分野動向と実用化に向けたNTTの取り組み
音声感情認識の分野動向と実用化に向けたNTTの取り組み音声感情認識の分野動向と実用化に向けたNTTの取り組み
音声感情認識の分野動向と実用化に向けたNTTの取り組み
 
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!
MixedRealityでUI/UXが変わる! SIer視点で考えるHoloLensの活用術!
 
Call Center Watsonのご紹介
Call Center Watsonのご紹介Call Center Watsonのご紹介
Call Center Watsonのご紹介
 
エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略エヌビディアのディープラーニング戦略
エヌビディアのディープラーニング戦略
 
Sig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_otaSig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_ota
 
学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割学会・研究会の情報保障におけるソーシャルネットワークの役割
学会・研究会の情報保障におけるソーシャルネットワークの役割
 
Japan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラムJapan Robot Week 2014けいはんなロボットフォーラム
Japan Robot Week 2014けいはんなロボットフォーラム
 
2018aiexpo natural language_processing_group
2018aiexpo natural language_processing_group2018aiexpo natural language_processing_group
2018aiexpo natural language_processing_group
 

Plus de Yahoo!デベロッパーネットワーク

ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかYahoo!デベロッパーネットワーク
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2Yahoo!デベロッパーネットワーク
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcYahoo!デベロッパーネットワーク
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo!デベロッパーネットワーク
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcYahoo!デベロッパーネットワーク
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtcYahoo!デベロッパーネットワーク
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcYahoo!デベロッパーネットワーク
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcYahoo!デベロッパーネットワーク
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcYahoo!デベロッパーネットワーク
 

Plus de Yahoo!デベロッパーネットワーク (20)

ゼロから始める転移学習
ゼロから始める転移学習ゼロから始める転移学習
ゼロから始める転移学習
 
継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator継続的なモデルモニタリングを実現するKubernetes Operator
継続的なモデルモニタリングを実現するKubernetes Operator
 
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるかヤフーでは開発迅速性と品質のバランスをどう取ってるか
ヤフーでは開発迅速性と品質のバランスをどう取ってるか
 
オンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッションオンプレML基盤on Kubernetes パネルディスカッション
オンプレML基盤on Kubernetes パネルディスカッション
 
LakeTahoe
LakeTahoeLakeTahoe
LakeTahoe
 
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
オンプレML基盤on Kubernetes 〜Yahoo! JAPAN AIPF〜
 
Persistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability FeaturePersistent-memory-native Database High-availability Feature
Persistent-memory-native Database High-availability Feature
 
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
データの価値を最大化させるためのデザイン~データビジュアライゼーションの方法~ #devsumi 17-E-2
 
eコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtceコマースと実店舗の相互利益を目指したデザイン #yjtc
eコマースと実店舗の相互利益を目指したデザイン #yjtc
 
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtcヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
ヤフーを支えるセキュリティ ~サイバー攻撃を防ぐエンジニアの仕事とは~ #yjtc
 
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtcYahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
Yahoo! JAPANのIaaSを支えるKubernetesクラスタ、アップデート自動化への挑戦 #yjtc
 
ビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtcビッグデータから人々のムードを捉える #yjtc
ビッグデータから人々のムードを捉える #yjtc
 
サイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtcサイエンス領域におけるMLOpsの取り組み #yjtc
サイエンス領域におけるMLOpsの取り組み #yjtc
 
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtcヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
ヤフーのAIプラットフォーム紹介 ~AIテックカンパニーを支えるデータ基盤~ #yjtc
 
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtcYahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
Yahoo! JAPAN Tech Conference 2022 Day2 Keynote #yjtc
 
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
新技術を使った次世代の商品の見せ方 ~ヤフオク!のマルチビュー機能~ #yjtc
 
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtcPC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
PC版Yahoo!メールリニューアル ~サービスのUI/UX統合と改善プロセス~ #yjtc
 
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtcモブデザインによる多職種チームのコミュニケーション改善 #yjtc
モブデザインによる多職種チームのコミュニケーション改善 #yjtc
 
「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc「新しいおうち探し」のためのAIアシスト検索 #yjtc
「新しいおうち探し」のためのAIアシスト検索 #yjtc
 
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtcユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
ユーザーの地域を考慮した検索入力補助機能の改善の試み #yjtc
 

Dernier

情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法ssuser370dd7
 
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfTaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfMatsushita Laboratory
 
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見Shumpei Kishi
 
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)ssuser539845
 
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~arts yokohama
 
2024 01 Virtual_Counselor
2024 01 Virtual_Counselor 2024 01 Virtual_Counselor
2024 01 Virtual_Counselor arts yokohama
 
20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdfAyachika Kitazaki
 
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦Sadao Tokuyama
 
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-LoopへTetsuya Nihonmatsu
 

Dernier (12)

情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
情報処理学会86回全国大会_Generic OAMをDeep Learning技術によって実現するための課題と解決方法
 
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdfTaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
TaketoFujikawa_台本中の動作表現に基づくアニメーション原画システムの提案_SIGEC71.pdf
 
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
持続可能なDrupal Meetupのコツ - Drupal Meetup Tokyoの知見
 
2024 04 minnanoito
2024 04 minnanoito2024 04 minnanoito
2024 04 minnanoito
 
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
IFIP IP3での資格制度を対象とする国際認定(IPSJ86全国大会シンポジウム)
 
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
2024 02 Nihon-Tanken ~Towards a More Inclusive Japan~
 
2024 01 Virtual_Counselor
2024 01 Virtual_Counselor 2024 01 Virtual_Counselor
2024 01 Virtual_Counselor
 
20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf20240326_IoTLT_vol109_kitazaki_v1___.pdf
20240326_IoTLT_vol109_kitazaki_v1___.pdf
 
What is the world where you can make your own semiconductors?
What is the world where you can make your own semiconductors?What is the world where you can make your own semiconductors?
What is the world where you can make your own semiconductors?
 
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
ARスタートアップOnePlanetの Apple Vision Proへの情熱と挑戦
 
2024 03 CTEA
2024 03 CTEA2024 03 CTEA
2024 03 CTEA
 
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
「今からでも間に合う」GPTsによる 活用LT会 - 人とAIが協調するHumani-in-the-Loopへ
 

大規模発話ログデータを活用した音声対話処理

  • 1. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ヤフー株式会社 上席研究員 鍜治伸裕 (@nobuhirokaji) 大規模発話ログデータを活用した 音声対話処理 情報処理学会 第232回自然言語処理研究会 招待講演資料
  • 2. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 音声対話型インタフェースの時代 あらゆるデバイスに人工知能が搭載されるIoT時代の到来 ヒトとモノが音声対話でコミュニケーションできる世界が目前に 2 http://i.gzn.jp/img/2016/05/10/viv/s01.jpg http://images.techhive.com/images/article/2017/01/echodothome-100704745-large.3x2.jpg
  • 3. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Yahoo! 音声アシスト 3 累計250万ダウンロード以上 音声対話でスマホを操作できるアプリ https://www.amazon.co.jp/gp/product/B00OIWNED6
  • 4. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 世の中の動向に反して 学会で音声対話は盛り上がっていない? 4 https://chairs-blog.acl2017.org/2017/02/15/statistics-on-submissions-and-status-update ACL2017におけるエリアごとの論文投稿の状況 dialog and interactive systems (第9位)
  • 5. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 5 新聞記事 ツイートブログ記事 医療系テキスト 近年のデータ駆動型NLPの進展は 大量のテキストデータの存在に支えられている
  • 6. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 対話データは蓄積が進んでいない 6 独話データ量 対話データ量
  • 7. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 我々のやり方:アプリを公開してデータ収集 7 累積250万以上のユーザ群 アプリサーバ 長年(5年)に渡って蓄積された 大規模な対話ログデータ 模擬ではない リアルな対話のやりとり 世界的にも稀有な音声対話研究基盤を構築
  • 8. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 発話のバリエーションと頻度が一目瞭然: スマホの音量を上げる場合 8 頻度 発話 8791 聞こえない 7334 音大きく 3323 音量上げて 1910 もっと大きく 1756 音量を上げて 1745 声が小さい 1736 音を大きく 1040 音が小さい 893 声を大きく 843 音大きくして 頻度 発話 760 音量を大きく 707 音量大きくして 684 音量最大 641 音量大きく 546 音量を上げる 514 音量アップ 491 ボリュームアップ 407 ボリュームを上げて 394 音量を大きくして … …
  • 9. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 発話ログデータ収集と研究開発の 好循環を生み出す 9 発話ログを活用したデータ駆動型の対話研究の推進 大量の発話ログデータを収集 研究成果に基づくシステム改善
  • 10. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 将来的ユーザエンゲージメントの予測 Shumpei Sano, Nobuhiro Kaji, and Manabu Sassano. Prediction of Prospective User Engagement with Intelligent Assistants. In Proc. of ACL16.
  • 11. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. “将来的エンゲージメント=今後もシステムを 使い続けてもらえるかどうか”を予測 11 • ユーザの満足度(Jiang+ 15)を測る新しい指標になりうる • 使わなくなりそうなユーザに集中的に働きかけることができる ?
  • 12. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. エンゲージメントの研究に新しい視点を導入 12 従来研究におけるエンゲージメント(Wang and Hirschberg, 11): 今、システムとの対話に没頭しているか 本研究におけるエンゲージメント: 将来的に対話システムを継続して使うか
  • 13. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Yahoo! 音声アシストの対話例 • マルチドメインなタスク型対話、雑談やゲームなども行う 13 今日も勉強 頑張って下さい! 今日の東京の天気 は晴れでしょう… 東京11時10分発の 新幹線があります… 東京から新大阪まで 何時に到着? 13時40分到着です 今日の天気は? 今日は朝から授業
  • 14. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 発話ログデータ User ID 時刻 発話 システム応答 応答型 (ドメイン) A 3/1 23:50 明日8時に起こして アラームを8時にセットしま した アラーム 3/2 08:10 おはよう おはようございます 雑談 3/2 08:13 今日の天気調べて 今日の東京の天気は晴れ でしょう 天気 B 3/1 08:00 東京駅から京都駅まで 9時30分発の新幹線があり ます 路線案内 3/1 08:01 着くのは何時? 京都には11時50分に到着し ます 路線案内 3/5 19:10 しりとりしよう いいですよ “りんご” しりとり 14 * 表はイメージです。実際のログとは一部異なっている場合があります。
  • 15. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 2つのタスクを提案: 離脱予測とエンゲージメント度予測 • 16週間分のログから348,295のユーザを無作為抽出 • 対象ユーザの全7,472,915発話とそれに対する応答を抽出 15 観測期間の発話ログ (最初8週間) 予測期間の発話ログ (最後8週間) …… …… …… …… …… …… …… …… 発話があるかないかを予測 セッション数を予測 (4値に離散化) ユーザごとに予測 離脱予測 エンゲージメント度予測 ?
  • 16. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 特徴量の設計(一部のみ抜粋) 種類 具体例 観測期間の最後n週間における発話数(n=1, 2,…, 8) 発話数 観測期間の最後n週間におけるセッション数(n=1, 2,…, 8) k番目のクラスタに属する発話数(k=1, 2, …100) ある応答型tの応答が返された回数(tは検索、アラームなど66種) 応答数 長い(50文字以上の)応答が返された回数 エラーメッセージが返された回数 発話間隔時間(日数)の最大値 発話間隔 発話間隔時間(日数)の最小値 発話間隔時間(日数)の平均値 ユーザ属性 ニックネームの登録の有無 年齢(20代未満, 20代、30代、40代、50代、60代以上) 16 *実数値素性は自然対数で正規化
  • 17. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 実験結果 • 学習アルゴリズムは SVM と SVR を使用 • ユーザを訓練、開発、評価に分割して実験 • セッション数素性のみを用いたベースラインを大きく改善 17 分類精度 F値 MSE ρ ベースライン 0.568 0.482 0.784 0.595 提案法 0.776 0.623 0.578 0.727 発話数素性 0.702 0.578 0.632 0.693 応答数素性 0.548 0.489 0.798 0.584 発話間隔素性 0.746 0.617 0.645 0.692 ユーザ属性素性 0.399 0.406 1.231 0.146 離脱予測 エンゲージメント度予測
  • 18. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 観測期間の長さと予測精度の関係 • 基本的には観測期間が長いほど予測精度が向上 • 特に1週間から2週間に伸ばしたときの改善が顕著 18 観測期間の長さ 観測期間の長さ 離脱予測 エンゲージメント度予測
  • 19. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. (Sano, Kaji, and Sassano, ACL16) のまとめ • “将来的エンゲージメント”というエンゲージメントに対する 新しい視点を提案 • 大量の発話ログを活用することによって、将来のユーザ 行動(≒ 満足度)をある程度予測できることを示した • 大規模なサービスを運用することによって、初めて見えて くる/取り組むことのできる研究課題 19
  • 20. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 修正発話の原因判定 Shumpei Sano, Nobuhiro Kaji, and Manabu Sassano. Predicting Causes of Reformulation in Intelligent Assistants. In Proc. of SIGDIAL17.
  • 21. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ユーザとの対話を通じて自立的に学習する システムの実現に向けて 21 ユーザがシステムを“普通に”利用 (明示的な教師信号や報酬は与えない) ユーザとの対話の経験を通して 自立的に学習、成長
  • 22. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ユーザの修正発話に着目 22 間違った応答 修正発話 “アラームの”ウェブ検索結果 はこちらです… アラーム アラームを起動して
  • 23. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 本研究のゴール: 修正発話の原因となるエラー源の自動検出 23 音声認識 言語理解 言語生成 知識ベース ユーザ発話 システム応答 ウェブAPI 対話システム 外部システム/資源 エラーの発生源が特定できれば(半)自動訂正につながる
  • 24. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. ログから類似発話の繰り返しを抽出し エラー原因をアノテーション 24 今日の東京の 天気は晴れ… “アラーム”の ウェブ検索結果は… 申し訳ありません よく分かりません… 私の年齢は… エラー無し(387発話) 音声認識エラー(317発話) 言語理解エラー(173発話) 言語生成エラー(51発話) 今日の天気は? じゃあ明日の天気 今日の転勤 今日の天気は? アラーム アラームを起動 あなたの名前は なんていうの? あなたの名前は?
  • 25. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 様々な特徴量を設計 25 “アラームの”ウェブ検索 結果はこちらです… はい。アラームを起動します。 発話時間間隔 Domain: アラーム ASR Conf.: 0.7 ASR Conf.: 0.9 修正タイプ(ADD, OMIT等) … 編集距離 Domain: ウェブ検索 Intent: SEARCH(アラーム) Intent: START domain、intent(slot値など)などの一致 ASRの確信度 アラーム アラームを起動して
  • 26. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 原因判定実験の結果 • SVM を用いて10分割交差検定 • 発話の表層情報だけでなくエラー原因ごとに作りこまれた素 性を使うことでF1値が向上 26 エラー無し 音声認識 エラー 言語理解 エラー 言語生成 エラー ベースライン 0.58 0.59 0.36 0.03 +音声認識素性 0.66†† 0.67†† 0.35 0.16 +言語理解素性 0.71†† 0.65 0.43 0.25† +言語生成素性 0.55 0.57 0.32 0.08 提案法(+全素性) 0.75†† 0.72†† 0.49† 0.33††
  • 27. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 混同行列の分析 27 エラー無し 音声認識 エラー 言語理解 エラー 言語生成 エラー エラー無し 284 55 27 21 音声認識 エラー 38 230 37 12 言語理解 エラー 44 29 81 19 言語生成 エラー 8 12 11 20 正解 予測
  • 28. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. (Sano, Kaji, and Sassano, SIGDIAL17) のまとめ • ユーザとの対話の中で、システムが自立的に学習を行う ことのできる枠組みの実現は、対話研究における大目標 の一つ • 修正発話は、ユーザからの暗黙的フィードバックであり、こ れを学習に活用することは非常に重要な課題 • 修正発話が行われたエラー原因を自動判定するという新 しい研究課題に取り組んだ • エラーの自動訂正などが今後の課題 28
  • 29. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 雑談発話の検出 Satoshi Akasaki and Nobuhiro Kaji. Chat Detection in an Intelligent Assistant. In Proc. of ACL17.
  • 30. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. これまでの音声対話システムは タスク型と雑談型に分けて研究されてきた • タスク型 30 • 雑談型 はい。豊田駅周辺の イタリアンレストランは… 歩くといい運動になって よいと思いますよ! この近くにある イタリアン料理の店調べて 駅から日野キャンパスまで 遠くない?
  • 31. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 近年、アシスタント型システムの出現により タスク型と雑談型の区別は曖昧に 31 A.L.I.C.E. (Wallace 09) Eliza (Weizenbaum 66)SHRDLU (Winograd 72) ATIS (Price 90) Let’s GO (Raux+ 05) しゃべってコンンシェル (吉村 12) Siri (Bellegarda 14) Cortana (Sarikaya 17) Yahoo! 音声アシスト (磯+ 13) 雑談型タスク型 アシスタント型
  • 32. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 雑談を意図したユーザ発話の検出が 新しい課題になる 32 気象情報 API の呼び出し 携帯端末の操作 雑談生成モデルの駆動 (seq2seqなど) 従来の雑談生成に関する研究では抜け落ちていたタスク 非雑談 雑談 今日の大阪の 天気は? 8時にアラーム 鳴らして 明日の仕事 休みたいなぁ
  • 33. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 教師データを構築して分類器を学習 • 15160発話をクラウドソーシングを利用してラベル付与 • 各発話ごと7名の多数決(雑談/非雑談: 4833/10327) • SVM と CNN の2つの分類器を学習、比較 33 ラベル 発話 得票数 雑談 お話ししよう 5 趣味はなんですか? 7 今月は休みがありません 5 非雑談 富士山の写真みせて 6 近くのおいしいレストラン 7 9時10分に起こして 7
  • 34. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 一工夫する:ツイートとウェブ検索ログを活用 • リプライのついたツイート≒雑談発話 34 やっと仕事終わったよー! USER1 @xxx @USER1 お疲れ様! USER2 @xxx おはようございます〜 USER3 @xxx @USER3 おはよ! USER4 @xxx 東京の天気 オムライスの作り方 君の名は。 ヤフー知恵袋 • ウェブ検索ログ≒タスク要求発話 それぞれGRU言語モデルを学習し対数尤度を特徴量に
  • 35. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 実験結果 • ベースライン(ツイートLM、内製)の精度を大きく改善 • 言語モデル(LM)素性の有効性を確認 35 手法 分類精度 適合率 再現率 F値 ツイート LM 72.07 54.54 74.48 62.94 内製の意図判定システム 78.31 62.57 79.51 70.03 SVM 91.35 87.62 84.88 86.21 SVM + ツイート/クエリ LM 92.15 88.61 86.50 87.53 CNN 90.84 87.03 83.80 85.36 CNN + ツイート/クエリ LM 91.48 87.78 85.18 86.56
  • 36. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 発話長と分類精度の関係 • LM素性は極端に短いまたは長い発話に有効 36 分類精度 発話長(文字数) SVM SVM+LM素性
  • 37. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. (Akasaki and Kaji, ACL17) のまとめ • タスク型と雑談型という音声対話システムの分類は過去の ものになりつつあり、二つのシステムは融合し始めている • タスク型と雑談型の切り替えが新しい技術課題になる • 雑談をドメインの一つと捉えているという見方も • ツイート等の外部資源の活用は、単純な教師有り学習から の脱却に向けた有望なアプローチの一つ 37
  • 38. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. Take Home Messages • IoTの時代は必ずやって来る。音声対話はそのときに基盤を 担う可能性の高いNLP技術 • 大規模なサービスを運用することは、音声対話研究のため のデータ収集に極めて有効な手段 • リアルな発話ログデータは面白いし、それを分析することに よって新しい研究課題がどんどん見えてくる 38
  • 39. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. We’re Hiring! • ヤフー株式会社ではデータサイエンティスト(a.k.a., 機械 学習エンジニア)を新卒、経験者ともに通年募集中 • もちろんリサーチャー、エンジニア、デザイナーも • 詳細は公式採用ページをご覧ください http://hr.yahoo.co.jp 39
  • 40. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved.
  • 41. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 参考文献 • Price. 1990. Evaluation of spoken language systems: the ATIS Domain. In Proc. DARPA Speech & Natural Language Workshop. • Raux et al. 2005. Let's Go Public! Taking a spoken dialog system to the real world. In Proc. InterSpeech. • Weizenbaum. 1966. Eliza–a computer program for the study of natural language communication between man and machine. Communications of the ACM. • Winograd. 1972. Understanding Natural Language. Academic Press. • Wu et al. 2016. りんな: 女子高生人工知能. Proc. of NLP. • 磯 et al. 2013. 「音声アシスト」の音声認識と自然言語処理の開発. 音声 言語情報処理研究会. • 鹿野 et al. 2012. 音声情報案内システム「たけまるくん」の運用. 情報処 理学会全国大会 • 吉村. 2012. しゃべってコンシェルと言語処理. 音声言語情報処理研究会. 41
  • 42. Copyright © 2017 Yahoo Japan Corporation. All Rights Reserved. 参考文献 • Akasaki and Kaji. 2017. Chat Detection in an Intelligent Assistant, Proc. of ACL. • Ballegarda. 2014. Spoken Language Understanding for Natural Interaction: The Siri Experience. Natural Interaction with Robots, Knowbots and Smartphones. • Sano et al. 2016. Prediction of Prospective User Engagement with Intelligent Assistants. Proc. of ACL. • Sano et al. 2017. Predicting Causes of Reformulation in Intelligent Assistants. Proc. of SIGDIAL. • Sarikaya. 2017. The Technology Behind Personal Digital Assistants. IEEE Signal Processing Magazine. • Wallace. 2009. The Anatomy of A.L.I.C.E. 42