Sig kbs slide-20181123_ota

日本語学習者の相互行為分析を通じた対話生成システ
ムの一考察
～隣接ペア・笑い・フィラー・あいづちを通じて～
A Consideration on a Dialogue Generation System through Interaction
Analysis of Japanese Learners
人工知能学会合同研究会2018
於慶應義塾大学矢上キャンパス # 12棟109
第115回人工知能学会知識ベースシステム研究会(SIG-KBS)
＜知識表現・知識獲得とその応用3＞ 16:55-17:20
2018年11月23日（金）
放送大学教養学部太田博三

目次
1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話分
析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
3. 基礎集計と分析による考察
3.1 インフォーマント属性間の比較
について
3.2 超級と中級のデータについて
3.3 隣接ペアとその計量化の検討
3.4 結果の考察
3.4.1 笑いとフィラーの比較検討
3.5 総括
4. データの増加の考察
4.1 国語研のデータとKYコーパスの
比較
4.2 コーパスを増やす前と後との品
詞の数量での比較考察
5. 突き上げ（Probes）と相互行為の
考察 cf. 項目反応理論
6. 今後の展望
2

目次
1. はじめに
て
2. 先行研究
2.1 エスノメソドロジー・会話分
析
ラーニング
3. 基礎集計と分析による考察
3.1 インフォーマント属性間の比較
について
3.3 隣接ペアとその計量化の検討
3.4 結果の考察
3.4.1 笑いとフィラーの比較検討
3.5 総括
4.1 国語研のデータとKYコーパスの
比較
4.2 コーパスを増やす前と後との品
詞の数量での比較考察
5. 突き上げ（Probes）と相互行為の
考察 cf. 項目反応理論
6. 今後の展望
3

目次: 1. はじめに
1. はじめに
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
ラーニング
１） Pepper, Chatbotの導入
２）ディープラーニング
３）エスノメソドロジーや会話分析
のセミナーに参加
定量分析 vs 定性分析から
↓
定量分析＋定性分析へ
対話システム vs 会話分析から
↓
対話システムと会話分析の融合
を図りたい！
エスノメソドロジーや
会話分析：
（対話システムは）
雑すぎて・・・
対話システム：
（会話分析は）細か
すぎて・・・
4

て
2. 先行研究
分析
ラーニング
・もっぱら，数量データによる
ディープラーニングに定性的な
要素を取り入れた（い）．
・誰もが入手可能なデータでを
用いることで，統計的な有意性
やサンプル数より，日常生活の
感覚でわかることを重視する．
5
ウェブサイトの改善
（定性分析＋定量分
析）

て
2. 先行研究
分析
ラーニング
１）探索的記述統計を中心に
考察する．
２-１）隣接ペアは本稿で定義
する種類のものに限定し計量
化する．
２-２）それらのペアが全体の
会話の促進になっているかを
考察する．
３）その隣接ペアの前後，もし
くは直後の発話が修復に向け
てのものか，完全に破綻して
いるが強引に会話を続けたも
のであるのかも検討する． 6

て
2. 先行研究
分析
ラーニング
「日本語学習者会話データ
ベース」を用いました．
１）国立国語研究所が公開し
ているコーパスの1つ
２）1990年の入管法の改正に
より，日本語学習を必要とす
る住民（言語生活者）の需要
に見合った言語教育の展開
が期待されていた．
３）ACTFL-OPI（全米外国語教
育協会認定の面接式口頭能
力テスト）を活用したもの． 7

て
2. 先行研究
分析
ラーニング
１）対話のスクリプトは，イン
フォーマント（日本語学習者/
データ提供者）とテスター（面
接者）と，2者の対話からなり，
30分ほどの対話形式で構成
されている．
２）上記の10段階のOPIレベル
や性別，年齢，出身国などを
選択することができる．検索
条件を設定してダウンロード
すると，文字化（一部，音声
化）されたスクリプトが入手で
きる．
8

目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析①
2.3 対話自動生成の
ディープラーニング
2.4 対話システムと会
話ユーザーインター
フェース
2.5 国内外での取り組
み
1) 坊農・高梨他(2009)では，隣接ペ
アとは，[質問]-[応答]の対をなす
発話の連鎖を指すもの，
2) 対話システムにおける対話モデ
ルに発話連鎖構造の土台として
いるとある．
3) フィラー(Filler)「あのー」や「まー」魏
(2015)など，
＝発話者が何らかの心的操作を行っ
ている最中に発するもの
＝場をつなぐ機能を持つ言葉と
＝多くは「感動詞」や「間投詞」
⇒「あいづち」や「{笑}」と同じく，会話
をつなぐ言葉として使われる． 9

ジー・会話分析②
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
会話データ分析の論文数の推移
「学会誌『社会言語科学』掲載の会話データ分析論文の年代別動向の調査」より引用
10
研究が
発祥
研究の
広がり
研究の
国外へ
広がり
研究の
国外で
定着

ジー・会話分析
ング
ターフェース
組み
徳永・乾・松本(2005)及び徳永(2014)
の論文では，対話システムに実装さ
れる可能性が示されている．
＝チャット対話の収集からコーパス作
成，そしてチャット対話の構造モデル
を提案している．このチャット対話の
質問や返答などの談話機能を担う構
成単位が交換行為である．交換単位
は「働きかけ」，「応答」，「補足」の3種
類に区分されている．
再現率は2人の場合でも3人の場合で
も，86%と高い．
11

ング
ターフェース
組み
徳永・乾・松本(2005)より
・説明変数（素性）一覧（SVMにより2値分類）
12

ング
ターフェース
組み
1)対話応答の自動生成に関して，
＝ICML Workshop(2015)でVinyals
et al(2015)のGoogleのチームが
NIPS2014で発表
＝Sequence to Sequence modelを
基としている．
＝多層のLong-Short term
memory(LSTM)を用いて文章をベク
トル化（エンコード）し，別の多層
LSTMを用いてベクトルをデコード
（復元）するもの
＝自然な会話を生成するように
なった．
2） Ghazvininejad et al(2018)は，上
記のモデルを拡張発展させたもの13

ング
ターフェース
組み
1)狩野(2017)は，現在に至るまでの
対話システムと将来の展望を簡
潔にまとめられている．
＝1960年代に開発されたELIZAや
人工無能から，現代の雑談対話
システムの１つである2016年に
発表された論文に基づく
Microsoft社の「りんな」まで網羅
している．
＝「りんな」では，発話ペアデータと
教師付き機械学習は統計的な
対話システムの多くに共通して
いることが少なくない．
14

ング
ターフェース
組み
１）対話破綻検出チャレンジ(2015-
2017)
２）DTFC7,
３）NTCIR-14
＝年次でハッカソンのような国際的
な大会として開催され，集合知
となっている．
15

目次: 3. 基礎集計による考察（超級と中級との属性比較）
１）全データは390個のスクリプト(=
音声を文字に書き起こしたもの)．
２）インフォーマント(日本語学習者)
の属性は，20代が圧倒的に多く，
女性が男性の2倍近くおり，大半
を占めている．日本語学校生や
大学・大学院生が半分を占めて
いる（図1）．
図3.1 インフォーマントの年代別分布
図3.2 インフォーマントの性別
図3.3 インフォーマントの日本滞在時間図3.4 インフォーマントの日本語学習期間
16

目次: 3. 基礎集計による考察
3.4 結果の考察
3.1 インフォーマント属性
間の比較について
・本考察では，超級と中級とで比
較考察しました．
→主な選択した要因は次の2つ
である．
1) 流暢さ
2) 語用論的能力
・超級では，「流暢さ」とは，会話全
体がなめらかであること，
・中級では，「流暢さ」とは，つかえ
ることが多く一人で話つづけるの
は難しい
・超級の「語用論的能力」とは，
ターンテイキングや間の取り方，
相づちなどが巧みにできる
・中級では，相づちや言い換えな
どに成功するのはまれとされてい
る． 17
定
義
定
義
定
義
定
義

3.4 結果の考察
3.1 インフォーマント属性間の比較に
ついて
3.2 超級と中級のデー
タについて
１）中級は年齢が20代半ばで
分布しているが，超級は23歳
から49歳とばらつきが大きい．
２）出身国と母国語は韓国．
３）滞在期間が大きく異なる．
超級は5-10年が大半だが，中
級は3か月から6か月の間に
分布している．
表3.1 中級のインフォーマント属性
表3.2 超級のインフォーマント属性表3.3 比較に用いたデータセット数
18

3.4 結果の考察
3.1 インフォーマント属性間の比較について
3.3 隣接ペアとその計量化
の検討
1. 隣接ペアの重要な特性に，第1
部分(First-Pair-Part: FPP)が産出
されると，それに対応する特定の
型の第2部分(Second-Part-Pair:
SPP)の産出が条件的に適切にな
る[前川・小磯他(2015)]
2. 本節では，試みの一環として，
形態素解析した後に，同じ語句
がでてきたら，その合計の半分と
して数量化した後に，目視で確認
をすることにした．
3. 隣接ペアが見出しやすい品詞
は，1)名詞，2)感動詞，3)間投詞，
4)応答詞
19

3.4 結果の考察
3.4.1 形態素解析後の中
級及び，超級の解釈
3.4.2 笑いとフィラー（「あー」）の比
較検討
超級も中級も，下記に示すように，
「名詞」，「感動詞-フィラー(「あー」)」，
「動詞」が大半を占めている．
→ フィラーも見落とせない頻出する
品詞といえる．
20

3.4.1 形態素解析後の中級及
び，超級の解釈
3.4.2 笑いとフィラー（「あー」）の比
較検討
21
中級データセット
フィラー
超級データセット
フィラー・超級と中級とを比較：
→フィラー(感動詞)では，超級が
12種類に対して，中級は30種類と
ばらつきがある．
・中級者と上級者とで，名詞では，「と
き」，「ほう」，「ほんと」など，
中級では，かなで表記されているが，
超級では漢字である．

3.4.2 笑いとフィラーの
比較検討
3.4.2 笑いとフィラー（「あー」）の比較検討
22
表3.4.1 {笑}の談話促進の例
対話の中の笑いは，{笑}で表
されています．
中級：笑 189個
超級：笑 422個
・笑いの機能：会話のターン
を維持・促進する働きがある
・大きく次の3つに分類される．
1) バランスを取るための笑い
2) 仲間づくりのための笑い
3) ごまかしのための笑い

3.4.2 笑いとフィラーの
比較検討
23
表3.4.3 言いよどみ/ 戸惑いのフィラーの例
・感動詞-フィラー(表3.4.2)
は，
中級では，あー 189個
超級では，あー 422個
→半分以下になっている．
・フィラーは言いよどみや
会話をつなぐ時間かせぎ
の機能もあり，超級の方
が多様されている．
・中級も超級も，会話をつ
なぐ言葉が多用されてい
る．
表3.4.2 感動詞―フィラーの例

中級の場合の発話機能の定義と種類（10-12種類）
24
01 Ｔ：
02 Ⅰ ：
03 Ｔ：
04 Ⅰ ：
05 Ｔ：
06 Ⅰ ：
07 Ｔ：
08 Ｉ：
09 Ｔ：
10 Ｉ：
11 Ｔ：
12 Ｉ：
はい
はい，はいじゃああの始めます，はじめまして
はじめましてー
ん私は【姓Ａ】と申しますー
あー【姓名Ｂ】申します
あ【姓Ｂ】さんですね
んはい【姓Ｂ】さんはえーっと日本にいつごろ来たんですか
ん，2か月ぐらい，前で
前，あーほんとう〈はい〉えーっとーん国はどちらですか
ん韓国人です
韓国〈はい〉あーそうですか韓国のどこーですか
釜山です
社交機能（呼びかけ）
社交機能（応答）
社交機能（自己提示）
情報提供機能（呼びかけ）
情報提供機能（応答）
聞く機能＋社交機能（呼びかけ）
聞く機能＋社交機能（応答）

超級の場合の発話機能の定義と種類（10-12種類）
25
01 Ｔ：
02 Ⅰ ：
03 Ｔ：
04 Ｉ：
05 Ｔ：
06 Ｉ：
07 Ｔ：
08 Ｉ：
09 Ｔ：
10 Ｉ：
11 Ｔ：
12 Ｉ：はいはい
こんにちは
こんにちは
はい私は【姓Ａ】と申します〈あ〉お名前お願いできますか
あ【姓Ｂ】と申しますよろしくお願いします
【姓Ｂ】さんですね〈はい〉はいどうも【姓Ｂ】さんはえあのーどちら
のどちらからいらっしゃいましたか
あ韓国から来ました
あーそうですか〈えー〉，で，えー今日本では〈はい〉何をしてらっ
しゃいますか
今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます
あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の
〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを
デザインしたりとかっということですか
えーとーおもにあのモバイルサイト〈ん〉，のプログラムーを作っ
たりしてます
あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ
ですね
社交機能（自己提示）
同意要求（呼びかけ）
同意要求（応答）

3.5 総括発話機能の定義と種類（10-12種類）
26
隣接対をザトラウスキー(1993)は，応答ペアと呼び，
1987年の国立国語研究所のをベースに，発話機能の定義と種類
を12種類に分けている．
①同意要求
②意思表示
③言い直し要求など…
10-12種類に区分．
表3.5.1では，中級の例であるが，社交辞令での呼びかけと応答
がしっかり成立している．一方で，「車」の話題で談話が破綻して
いるが，テスターが「建築」の話題に話を戻し，修復している．対話
システムで，この修復の機能をいかに実装するかは，今後の課題
としたい．

3.5 総括
27
Ｔ：聞く機能＋社交機能（呼びかけ）
Ｉ：聞く機能＋社交機能（応答）
Ｔ：社交機能（呼びかけ）
Ｉ：社交機能（応答）
Ｔ：修復
Ｉ：応答
んーあーそうですかー〈はい〉あじゃ建築の勉強してるーん
はい
あーそうですかー建物や車〈はい〉，はーそれは建物のデ
はいけいじ〈けいじ〉，けいじゃいとか，大学で〈ん〉，建物
あ造る〈はい〉，あ造る勉強をしていたんですか〈はいは
あ建築はいはい｛笑｝
あーそうですかー〈はい〉え車もですか
｛息を吸う音｝車，も，好きですけど，まだ考え中です｛笑｝
釜山〈はい〉あーそうですかー〈はい〉，んー日本に2か月
はい
んあそうですかんどうして日本に来たんですか
日本語勉強，する，つもりですけど〈んん〉，ん，ちょっと，
あ，そうですかー〈はい〉あーじゃあ文化も知りたい〈はい〉
建物とか私が関心，関心で〈ん〉，関心，持って，いた持っ
んはい【姓Ｂ】さんはえーっと日本にいつごろ来たんですか
ん，2か月ぐらい，前で
前，あーほんとう〈はい〉えーっとーん国はどちらですか
ん韓国人です
韓国〈はい〉あーそうですか韓国のどこーですか
釜山です
・中級の発話機能のラベリングの例右図では，
まず，社交機能
（呼びかけ）- 社交
機能（応答）があ
り，
次に，情報提供
機能（呼びかけ）-
がなされ，理解機
能（呼びかけ）や
同意要求（呼びか
け）とそれに対応
して，理解機能
（応答）や同意要
求（応答）が成立
しており，高度な
対話がなされてい
る．

3.5 総括
28
Ⅰ ：社交機能（応答）
Ｔ：社交機能（自己提示）
Ｔ：情報提供機能（呼びかけ）
Ｉ：情報提供機能（応答）
Ｔ：同意要求（呼びかけ）
Ｉ：同意要求（応答）はいはい
こんにちは
こんにちは
はい私は【姓Ａ】と申します〈あ〉お名前お願いできますか
あ【姓Ｂ】と申しますよろしくお願いします
【姓Ｂ】さんですね〈はい〉はいどうも【姓Ｂ】さんはえあのーどちら
のどちらからいらっしゃいましたか
あ韓国から来ました
あーそうですか〈えー〉，で，えー今日本では〈はい〉何をしてらっ
しゃいますか
今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます
あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の
〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを
デザインしたりとかっということですか
えーとーおもにあのモバイルサイト〈ん〉，のプログラムーを作っ
たりしてます
あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ
ですね
・超級の発話機能のラベリングの例

3.5 総括
29
表3.5.2 基本的な
発話機能連鎖の
超級の例
最
初
の
５
タ
ー
ン
目
ま
で
は
「
隣
接
対
」で
対
話
が
成
立
し
て
い
る
．

3.5 総括
30
「2番目の発話が保留である連鎖組織」の例を表3.5.4～表
3.5.7に示す．いずれも隣接対が多く見受けられ，またフィラー
のような，つなぎ言葉も相手への同意を示すなど，発話促進
の機能を果たしていると言える．

31
4.1 国語研のデータとKYコーパスの比較
スクリプト数:
国語研（339個）
KYコーパス（44個）
KYコーパスを追加すると，全体で383個となり，13%の
増加となる。
KYコーパスは、超級と上級の上のデータの追加が大き
い．
出身国や年齢等の属性を加味しなければ，データの増
加はマイナスにはならないと言える．

32
4.1 国語研のデータとKYコーパスの比較

33
4.1 国語研のデータとKYコーパス増加分の可視化

4.2 コーパスを増やす前と後との品詞の数量での比
較考察
34
国語研の上級者のスクリプトを形態素解析した後の品
詞上位30個

較考察
35
次に，KYコーパスの上級者のスクリプトを形態素解析し
た後の品詞上位30個を示す．

較考察
36
最後に，国語研にKYコーパスを追加した後の上級者の
スクリプトを形態素解析した後の品詞上位30個
示す．

5. 突き上げ（Thrust up）と相互行為の考察 1
37
突き上げ（Probes）とは，テスター(受験者)の能力以上
の質問をわざとして，上段を見極める行為のこと．
相互行為とは，社会学の一分野で「エスノメソドロ
ジー」と呼びます。
牧野（1991）「ACTFLの外国語能力の基準より表2 P25より引用」

38
エスノメソドロジスト（エスノメソドロジーに依拠する研究
者たち）は、会話であるとか仕事、勉強、喧嘩、散歩と
いった、社会生活をおくる上で日常生活者が経験する
様々な事柄が、どうやって当たり前のこととして成り立
たっているのかを調べます。
例: 「列に並ぶ」という活動について考えてみると，
映画の切符を買うために列に並ぶ際には、
他の人と同じくらいの間隔を空けて前の人の後ろに立
つ、前方を向く等々の、細かな決まり事があります．

39
＜突き上げ＞
テスター(受験者)の能力の上と下を判断する．
Cf. 「項目反応理論」: TOFEL/ TOEIC等で用いられている．
引用元: Rで項目反応理論
http://www.okadajp.org/RWiki/?R%E3%81
%A7%E9%A0%85%E7%9B%AE%E5%8F%8D
%E5%BF%9C%E7%90%86%E8%AB%96

6. 今後の展望
40
１つは，データの増加の影響とサンプルサイズについ
て，
２つは，条件付き相互行為について
eg. TOEICやTOEFLなどの同じ形式の対話では，１回目
に比べて２回目が，２回目に比べて３回目が試験監の
突き上げ（Probes）の効果が対数関数のような現象を示
すということである．
この効用関数はコールセンター等でも同じく確認できる
ものと考えられる．

参考文献&参照URL(1/2)
参考文献：
1. 坊農・高梨他(2009)「知の科学多人数インタラクションの分析手法」3
章, 人工知能学会編集, オーム社
2. 徳永・乾・松本(2005)「チャット対話における発言間の継続関係と応
答関係の同定」自然言語処理言語処理学会
3. 徳永(2004)「チャット対話における発言の継続関係と応答関係の同
定」修士論文奈良先端科学技術大学院大学情報科学研究科情報
処理学専攻
4. 牧野成一他(2001)「ACTFL-OPI 入門」アルク
5. Vinyals,et al(2015) Quoc Le. A Neural Conversational Model, arXiv
6. Ghazvininejad(2018) A Knowledge-Grounded Neural Conversation
Model. Microsoft
7. 喜連川他(2017) 「暗黙の発話状況を考慮したニューラル対話モデ
ル」. 言語処理学会第 23 回年次大会発表論文集
8. 串田, 平本, 林(2017) 「会話分析入門」勁草書房
41

参考文献&関連URL(2/2)
1. 関連 URL 国立国語研究所(2009) 「日本語教育ネットワーク」
https://nknet.ninjal.ac.jp/nknet/ndata/opi/
2. 国立国語研究所(2010)「日本語学習者会話データベースの
利用手引き」鎌田･山内「タグ付きKY コーパス」
http://jhlee.sakura.ne.jp/kyc/corpus/
3. 対話破綻検出チャレンジ2015
https://sites.google.com/site/dialoguebreakdowndetection/
4. DSTC7(2017) Dialog System Technology Challenges
http://workshop.colips.org/dstc7/index.html
5. NTCIR-14(2018-19) - 国立情報学研究所
http://research.nii.ac.jp/ntcir/ntcir-14/index-ja.html
6. EMCA 研究会エスノメソドロジー・会話分析とはなにか-
http://emca.jp/learn 藤田自然言語表現の言い換え
http://paraphrasing.org/~fujita/paraphrasing-ja.html
7. 言語資源活用ワークショップ2018発表論文集国立国語研究
所
42

ご清聴ありがとうございます．
参考文献は論文集を参照
してください．
9924658973@campus.ouj
.ac.jp
43

Sig kbs slide-20181123_ota

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (9)

Similaire à Sig kbs slide-20181123_ota

Similaire à Sig kbs slide-20181123_ota (20)

Plus de 博三太田

Plus de 博三太田 (20)