SlideShare une entreprise Scribd logo
1  sur  43
Télécharger pour lire hors ligne
日本語学習者の相互行為分析を通じた対話生成システ
ムの一考察
~隣接ペア・笑い・フィラー・あいづちを通じて~
A Consideration on a Dialogue Generation System through Interaction
Analysis of Japanese Learners
人工知能学会 合同研究会2018
於 慶應義塾大学 矢上キャンパス # 12棟109
第115回人工知能学会 知識ベースシステム研究会(SIG-KBS)
<知識表現・知識獲得とその応用3> 16:55-17:20
2018年11月23日(金)
放送大学 教養学部 太田 博三
目次
1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話分
析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
3. 基礎集計と分析による考察
3.1 インフォーマント属性間の比較
について
3.2 超級と中級のデータについて
3.3 隣接ペアとその計量化の検討
3.4 結果の考察
3.4.1 笑いとフィラーの比較検討
3.5 総括
4. データの増加の考察
4.1 国語研のデータとKYコーパスの
比較
4.2 コーパスを増やす前と後との品
詞の数量での比較考察
5. 突き上げ(Probes)と相互行為の
考察 cf. 項目反応理論
6. 今後の展望
2
目次
1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話分
析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
3. 基礎集計と分析による考察
3.1 インフォーマント属性間の比較
について
3.2 超級と中級のデータについて
3.3 隣接ペアとその計量化の検討
3.4 結果の考察
3.4.1 笑いとフィラーの比較検討
3.5 総括
4. データの増加の考察
4.1 国語研のデータとKYコーパスの
比較
4.2 コーパスを増やす前と後との品
詞の数量での比較考察
5. 突き上げ(Probes)と相互行為の
考察 cf. 項目反応理論
6. 今後の展望
3
目次: 1. はじめに
1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
1) Pepper, Chatbotの導入
2) ディープラーニング
3) エスノメソドロジーや会話分析
のセミナーに参加
定量分析 vs 定性分析 から
↓
定量分析 + 定性分析 へ
対話システム vs 会話分析 から
↓
対話システム と 会話分析の融合
を図りたい!
エスノメソドロジーや
会話分析:
(対話システムは)
雑すぎて・・・
対話システム:
(会話分析は)細か
すぎて・・・
4
目次: 1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
・もっぱら,数量データによる
ディープラーニングに定性的な
要素を取り入れた(い).
・誰もが入手可能なデータでを
用いることで,統計的な有意性
やサンプル数より,日常生活の
感覚でわかることを重視する.
5
ウェブサイトの改善
(定性分析+定量分
析)
目次: 1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
1) 探索的記述統計を中心に
考察する.
2-1) 隣接ペアは本稿で定義
する種類のものに限定し計量
化する.
2-2) それらのペアが全体の
会話の促進になっているかを
考察する.
3) その隣接ペアの前後,もし
くは直後の発話が修復に向け
てのものか,完全に破綻して
いるが強引に会話を続けたも
のであるのかも検討する. 6
目次: 1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
「日本語学習者会話データ
ベース」を用いました.
1)国立国語研究所が公開し
ているコーパスの1つ
2)1990年の入管法の改正に
より,日本語学習を必要とす
る住民(言語生活者)の需要
に見合った言語教育の展開
が期待されていた.
3)ACTFL-OPI(全米外国語教
育協会認定の面接式口頭能
力テスト)を活用したもの. 7
目次: 1. はじめに
1.1 研究の背景と目的
1.2 研究の新規性
1.3 研究の主な手法
1.4 用いたデータセットについ
て
2. 先行研究
2.1 エスノメソドロジー・会話
分析
2.2 自然言語処理
2.3 対話自動生成のディープ
ラーニング
2.4 対話システムと会話ユー
ザーインターフェース
2.5 国内外での取り組み
1)対話のスクリプトは,イン
フォーマント(日本語学習者/
データ提供者)とテスター(面
接者)と,2者の対話からなり,
30分ほどの対話形式で構成
されている.
2)上記の10段階のOPIレベル
や性別,年齢,出身国などを
選択することができる.検索
条件を設定してダウンロード
すると,文字化(一部,音声
化)されたスクリプトが入手で
きる.
8
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析①
2.2 自然言語処理
2.3 対話自動生成の
ディープラーニング
2.4 対話システムと会
話ユーザーインター
フェース
2.5 国内外での取り組
み
1) 坊農・高梨他(2009)では,隣接ペ
アとは,[質問]-[応答]の対をなす
発話の連鎖を指すもの,
2) 対話システムにおける対話モデ
ルに発話連鎖構造の土台として
いるとある.
3) フィラー(Filler)「あのー」や「まー」魏
(2015)など,
=発話者が何らかの心的操作を行っ
ている最中に発するもの
=場をつなぐ機能を持つ言葉と
=多くは「感動詞」や「間投詞」
⇒「あいづち」や「{笑}」と同じく,会話
をつなぐ言葉として使われる. 9
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析②
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
会話データ分析の論文数の推移
「学会誌『社会言語科学』掲載の会話データ分析論文の年代別動向の調査」より引用
10
研究が
発祥
研究の
広がり
研究の
国外へ
広がり
研究の
国外で
定着
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
徳永・乾・松本(2005)及び徳永(2014)
の論文では,対話システムに実装さ
れる可能性が示されている.
=チャット対話の収集からコーパス作
成,そしてチャット対話の構造モデル
を提案している.このチャット対話の
質問や返答などの談話機能を担う構
成単位が交換行為である.交換単位
は「働きかけ」,「応答」,「補足」の3種
類に区分されている.
再現率は2人の場合でも3人の場合で
も,86%と高い.
11
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
徳永・乾・松本(2005)より
・説明変数(素性)一覧(SVMにより2値分類)
12
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
1)対話応答の自動生成に関して,
=ICML Workshop(2015)でVinyals
et al(2015)のGoogleのチームが
NIPS2014で発表
=Sequence to Sequence modelを
基としている.
=多層のLong-Short term
memory(LSTM)を用いて文章をベク
トル化(エンコード)し,別の多層
LSTMを用いてベクトルをデコード
(復元)するもの
=自然な会話を生成するように
なった.
2) Ghazvininejad et al(2018)は,上
記のモデルを拡張発展させたもの13
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
1)狩野(2017)は,現在に至るまでの
対話システムと将来の展望を簡
潔にまとめられている.
=1960年代に開発されたELIZAや
人工無能から,現代の雑談対話
システムの1つである2016年に
発表された論文に基づく
Microsoft社の「りんな」まで網羅
している.
=「りんな」では,発話ペアデータと
教師付き機械学習は統計的な
対話システムの多くに共通して
いることが少なくない.
14
目次: 2. 先行研究
2.1 エスノメソドロ
ジー・会話分析
2.2 自然言語処理
2.3 対話自動生成
のディープラーニ
ング
2.4 対話システムと
会話ユーザーイン
ターフェース
2.5 国内外での取り
組み
1)対話破綻検出チャレンジ(2015-
2017)
2)DTFC7,
3)NTCIR-14
=年次でハッカソンのような国際的
な大会として開催され,集合知
となっている.
15
目次: 3. 基礎集計による考察(超級と中級との属性比較)
1)全データは390個のスクリプト(=
音声を文字に書き起こしたもの).
2)インフォーマント(日本語学習者)
の属性は,20代が圧倒的に多く,
女性が男性の2倍近くおり,大半
を占めている.日本語学校生や
大学・大学院生が半分を占めて
いる(図1).
図3.1 インフォーマントの年代別分布
図3.2 インフォーマントの性別
図3.3 インフォーマントの日本滞在時間 図3.4 インフォーマントの日本語学習期間
16
目次: 3. 基礎集計による考察
3.4 結果の考察
3.1 インフォーマント属性
間の比較について
・本考察では,超級と中級とで比
較考察しました.
→主な選択した要因は次の2つ
である.
1) 流暢さ
2) 語用論的能力
・超級では,「流暢さ」とは,会話全
体がなめらかであること,
・中級では,「流暢さ」とは,つかえ
ることが多く一人で話つづけるの
は難しい
・超級の「語用論的能力」とは,
ターンテイキングや間の取り方,
相づちなどが巧みにできる
・中級では,相づちや言い換えな
どに成功するのはまれとされてい
る. 17
定
義
定
義
定
義
定
義
目次: 3. 基礎集計による考察
3.4 結果の考察
3.1 インフォーマント属性間の比較に
ついて
3.2 超級と中級のデー
タについて
1)中級は年齢が20代半ばで
分布しているが,超級は23歳
から49歳とばらつきが大きい.
2)出身国と母国語は韓国.
3)滞在期間が大きく異なる.
超級は5-10年が大半だが,中
級は3か月から6か月の間に
分布している.
表3.1 中級のインフォーマント属性
表3.2 超級のインフォーマント属性 表3.3 比較に用いたデータセット数
18
目次: 3. 基礎集計による考察
3.4 結果の考察
3.1 インフォーマント属性間の比較について
3.2 超級と中級のデータについて
3.3 隣接ペアとその計量化
の検討
1. 隣接ペアの重要な特性に,第1
部分(First-Pair-Part: FPP)が産出
されると,それに対応する特定の
型の第2部分(Second-Part-Pair:
SPP)の産出が条件的に適切にな
る[前川・小磯他(2015)]
2. 本節では,試みの一環として,
形態素解析した後に,同じ語句
がでてきたら,その合計の半分と
して数量化した後に,目視で確認
をすることにした.
3. 隣接ペアが見出しやすい品詞
は,1)名詞,2)感動詞,3)間投詞,
4)応答詞
19
目次: 3. 基礎集計による考察
3.4 結果の考察
3.4.1 形態素解析後の中
級及び,超級の解釈
3.4.2 笑いとフィラー(「あー」)の比
較検討
超級も中級も,下記に示すように,
「名詞」,「感動詞-フィラー(「あー」)」,
「動詞」が大半を占めている.
→ フィラーも見落とせない頻出する
品詞といえる.
20
目次: 3. 基礎集計による考察
3.4.1 形態素解析後の中級及
び,超級の解釈
3.4.2 笑いとフィラー(「あー」)の比
較検討
21
中級データセット
フィラー
超級データセット
フィラー ・超級と中級とを比較:
→フィラー(感動詞)では,超級が
12種類に対して,中級は30種類と
ばらつきがある.
・中級者と上級者とで,名詞では,「と
き」,「ほう」,「ほんと」など,
中級では,かなで表記されているが,
超級では漢字である.
目次: 3. 基礎集計による考察
3.4.2 笑いとフィラーの
比較検討
3.4.2 笑いとフィラー(「あー」)の比較検討
22
表3.4.1 {笑}の談話促進の例
対話の中の笑いは,{笑}で表
されています.
中級:笑 189個
超級:笑 422個
・笑いの機能:会話のターン
を維持・促進する働きがある
・大きく次の3つに分類される.
1) バランスを取るための笑い
2) 仲間づくりのための笑い
3) ごまかしのための笑い
目次: 3. 基礎集計による考察
3.4.2 笑いとフィラーの
比較検討
3.4.2 笑いとフィラー(「あー」)の比較検討
23
表3.4.3 言いよどみ/ 戸惑いのフィラーの例
・感動詞-フィラー(表3.4.2)
は,
中級では,あー 189個
超級では,あー 422個
→半分以下になっている.
・フィラーは言いよどみや
会話をつなぐ時間かせぎ
の機能もあり,超級の方
が多様されている.
・中級も超級も,会話をつ
なぐ言葉が多用されてい
る.
表3.4.2 感動詞―フィラーの例
目次: 3. 基礎集計による考察
中級の場合の発話機能の定義と種類(10-12種類)
24
01 T :
02 Ⅰ :
03 T :
04 Ⅰ :
05 T :
06 Ⅰ :
07 T :
08 I :
09 T :
10 I :
11 T :
12 I :
はい
はい,はいじゃああの始めます,はじめまして
はじめましてー
ん私は【姓A】と申しますー
あー【姓名B】申します
あ【姓B】さんですね
んはい【姓B】さんはえーっと日本にいつごろ来たんですか
ん,2か月ぐらい,前で
前,あーほんとう〈はい〉えーっとーん国はどちらですか
ん韓国人です
韓国〈はい〉あーそうですか韓国のどこーですか
釜山です
社交機能(呼びかけ)
社交機能(応答)
社交機能(自己提示)
社交機能(応答)
情報提供機能(呼びかけ)
情報提供機能(応答)
聞く機能+社交機能(呼びかけ)
聞く機能+社交機能(応答)
社交機能(呼びかけ)
社交機能(応答)
社交機能(呼びかけ)
社交機能(応答)
目次: 3. 基礎集計による考察
超級の場合の発話機能の定義と種類(10-12種類)
25
01 T :
02 Ⅰ :
03 T :
04 I :
05 T :
06 I :
07 T :
08 I :
09 T :
10 I :
11 T :
12 I : はいはい
こんにちは
こんにちは
はい私は【姓A】と申します〈あ〉お名前お願いできますか
あ【姓B】と申しますよろしくお願いします
【姓B】さんですね〈はい〉はいどうも【姓B】さんはえあのーどちら
のどちらからいらっしゃいましたか
あ韓国から来ました
あーそうですか〈えー〉,で,えー今日本では〈はい〉何をしてらっ
しゃいますか
今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます
あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の
〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを
デザインしたりとかっということですか
えーとーおもにあのモバイルサイト〈ん〉,のプログラムーを作っ
たりしてます
あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ
ですね
社交機能(呼びかけ)
社交機能(応答)
社交機能(自己提示)
社交機能(応答)
情報提供機能(呼びかけ)
情報提供機能(応答)
情報提供機能(呼びかけ)
情報提供機能(応答)
情報提供機能(呼びかけ)
情報提供機能(応答)
同意要求(呼びかけ)
同意要求(応答)
目次: 3. 基礎集計による考察
3.5 総括 発話機能の定義と種類(10-12種類)
3.4.2 笑いとフィラー(「あー」)の比較検討
26
隣接対をザトラウスキー(1993)は,応答ペアと呼び,
1987年の国立国語研究所のをベースに,発話機能の定義と種類
を12種類に分けている.
①同意要求
②意思表示
③言い直し要求など…
10-12種類に区分.
表3.5.1では,中級の例であるが,社交辞令での呼びかけと応答
がしっかり成立している.一方で,「車」の話題で談話が破綻して
いるが,テスターが「建築」の話題に話を戻し,修復している.対話
システムで,この修復の機能をいかに実装するかは,今後の課題
としたい.
目次: 3. 基礎集計による考察
3.5 総括
3.4.2 笑いとフィラー(「あー」)の比較検討
27
T : 聞く機能+社交機能(呼びかけ)
I : 聞く機能+社交機能(応答)
T : 社交機能(呼びかけ)
I : 社交機能(応答)
T : 社交機能(呼びかけ)
I : 社交機能(応答)
T : 社交機能(呼びかけ)
I : 社交機能(応答)
T : 社交機能(呼びかけ)
I : 社交機能(応答)
T : 聞く機能+社交機能(呼びかけ)
I : 聞く機能+社交機能(応答)
T : 聞く機能+社交機能(呼びかけ)
I : 聞く機能+社交機能(応答)
T : 聞く機能+社交機能(呼びかけ)
I : 聞く機能+社交機能(応答)
T : 聞く機能+社交機能(呼びかけ)
I : 社交機能(応答)
T : 修復
I : 応答
んーあーそうですかー〈はい〉あじゃ建築の勉強してるーん
はい
あーそうですかー建物や車〈はい〉,はーそれは建物のデ
はいけいじ〈けいじ〉,けいじゃいとか,大学で〈ん〉,建物
あ造る〈はい〉,あ造る勉強をしていたんですか〈はいは
あ建築はいはい{笑}
あーそうですかー〈はい〉え車もですか
{息を吸う音}車,も,好きですけど,まだ考え中です{笑}
釜山〈はい〉あーそうですかー〈はい〉,んー日本に2か月
はい
んあそうですかんどうして日本に来たんですか
日本語勉強,する,つもりですけど〈んん〉,ん,ちょっと,
あ,そうですかー〈はい〉あーじゃあ文化も知りたい〈はい〉
建物とか私が関心,関心で〈ん〉,関心,持って,いた持っ
んはい【姓B】さんはえーっと日本にいつごろ来たんですか
ん,2か月ぐらい,前で
前,あーほんとう〈はい〉えーっとーん国はどちらですか
ん韓国人です
韓国〈はい〉あーそうですか韓国のどこーですか
釜山です
・中級の発話機能のラベリングの例右図では,
まず,社交機能
(呼びかけ)- 社交
機能(応答)があ
り,
次に,情報提供
機能(呼びかけ)-
社交機能(応答)
がなされ,理解機
能(呼びかけ)や
同意要求(呼びか
け)とそれに対応
して,理解機能
(応答)や同意要
求(応答)が成立
しており,高度な
対話がなされてい
る.
目次: 3. 基礎集計による考察
3.5 総括
3.4.2 笑いとフィラー(「あー」)の比較検討
28
T : 社交機能(呼びかけ)
Ⅰ : 社交機能(応答)
T : 社交機能(自己提示)
I : 社交機能(応答)
T : 情報提供機能(呼びかけ)
I : 情報提供機能(応答)
T : 情報提供機能(呼びかけ)
I : 情報提供機能(応答)
T : 情報提供機能(呼びかけ)
I : 情報提供機能(応答)
T : 同意要求(呼びかけ)
I : 同意要求(応答)はいはい
こんにちは
こんにちは
はい私は【姓A】と申します〈あ〉お名前お願いできますか
あ【姓B】と申しますよろしくお願いします
【姓B】さんですね〈はい〉はいどうも【姓B】さんはえあのーどちら
のどちらからいらっしゃいましたか
あ韓国から来ました
あーそうですか〈えー〉,で,えー今日本では〈はい〉何をしてらっ
しゃいますか
今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます
あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の
〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを
デザインしたりとかっということですか
えーとーおもにあのモバイルサイト〈ん〉,のプログラムーを作っ
たりしてます
あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ
ですね
・超級の発話機能のラベリングの例
目次: 3. 基礎集計による考察
3.5 総括
3.4.2 笑いとフィラー(「あー」)の比較検討
29
表3.5.2 基本的な
発話機能連鎖の
超級の例
最
初
の
5
タ
ー
ン
目
ま
で
は
「
隣
接
対
」で
対
話
が
成
立
し
て
い
る
.
目次: 3. 基礎集計による考察
3.5 総括
3.4.2 笑いとフィラー(「あー」)の比較検討
30
「2番目の発話が保留である連鎖組織」の例を表3.5.4~表
3.5.7に示す.いずれも隣接対が多く見受けられ,またフィラー
のような,つなぎ言葉も相手への同意を示すなど,発話促進
の機能を果たしていると言える.
4. データの増加の考察
31
4.1 国語研のデータとKYコーパスの比較
スクリプト数:
国語研(339個)
KYコーパス(44個)
KYコーパスを追加すると,全体で383個となり,13%の
増加となる。
KYコーパスは、超級と上級の上のデータの追加が大き
い.
出身国や年齢等の属性を加味しなければ,データの増
加はマイナスにはならないと言える.
4. データの増加の考察
32
4.1 国語研のデータとKYコーパスの比較
4. データの増加の考察
33
4.1 国語研のデータとKYコーパス増加分の可視化
4.2 コーパスを増やす前と後との品詞の数量での比
較考察
34
国語研の上級者のスクリプトを形態素解析した後の品
詞上位30個
4.2 コーパスを増やす前と後との品詞の数量での比
較考察
35
次に,KYコーパスの上級者のスクリプトを形態素解析し
た後の品詞上位30個を示す.
4.2 コーパスを増やす前と後との品詞の数量での比
較考察
36
最後に,国語研にKYコーパスを追加した後の上級者の
スクリプトを形態素解析した後の品詞上位30個
示す.
5. 突き上げ(Thrust up)と相互行為の考察 1
37
突き上げ(Probes)とは,テスター(受験者)の能力以上
の質問をわざとして,上段を見極める行為のこと.
相互行為とは, 社会学の一分野で「エスノメソドロ
ジー」と呼びます。
牧野(1991)「ACTFLの外国語能力の基準より 表2 P25より 引用」
5. 突き上げ(Thrust up)と相互行為の考察 2
38
エスノメソドロジスト(エスノメソドロジーに依拠する研究
者たち)は、会話であるとか仕事、勉強、喧嘩、散歩と
いった、社会生活をおくる上で日常生活者が経験する
様々な事柄が、どうやって当たり前のこととして成り立
たっているのかを調べます。
例: 「列に並ぶ」という活動について考えてみると,
映画の切符を買うために列に並ぶ際には、
他の人と同じくらいの間隔を空けて前の人の後ろに立
つ、前方を向く等々の、細かな決まり事があります.
5. 突き上げ(Thrust up)と相互行為の考察 3
39
<突き上げ>
テスター(受験者)の能力の上と下を判断する.
Cf. 「項目反応理論」: TOFEL/ TOEIC等で用いられている.
引用元: Rで項目反応理論
http://www.okadajp.org/RWiki/?R%E3%81
%A7%E9%A0%85%E7%9B%AE%E5%8F%8D
%E5%BF%9C%E7%90%86%E8%AB%96
6. 今後の展望
40
1つは,データの増加の影響とサンプルサイズについ
て,
2つは,条件付き相互行為について
eg. TOEICやTOEFLなどの同じ形式の対話では,1回目
に比べて2回目が,2回目に比べて3回目が試験監の
突き上げ(Probes)の効果が対数関数のような現象を示
すということである.
この効用関数はコールセンター等でも同じく確認できる
ものと考えられる.
参考文献&参照URL(1/2)
参考文献:
1. 坊農・高梨他(2009)「知の科学多人数インタラクションの分析手法」3
章, 人工知能学会編集, オーム社
2. 徳永・乾・松本(2005)「チャット対話における発言間の継続関係と応
答関係の同定」自然言語処理言語処理学会
3. 徳永(2004)「チャット対話における発言の継続関係と応答関係の同
定」修士論文奈 良先端科学技術大学院大学情報科学研究科情報
処理学専攻
4. 牧野成一他(2001)「ACTFL-OPI 入門」アルク
5. Vinyals,et al(2015) Quoc Le. A Neural Conversational Model, arXiv
6. Ghazvininejad(2018) A Knowledge-Grounded Neural Conversation
Model. Microsoft
7. 喜連川他(2017) 「暗黙の発話状況を考慮したニューラル対話モデ
ル」. 言語処理学会第 23 回年次大会発表論文集
8. 串田, 平本, 林(2017) 「会話分析入門」勁草書房
41
参考文献&関連URL(2/2)
1. 関連 URL 国立国語研究所(2009) 「日本語教育ネットワーク」
https://nknet.ninjal.ac.jp/nknet/ndata/opi/
2. 国立国語研究所(2010)「日本語学習者会話データベースの
利用手引き」鎌田・山内「タグ付きKY コーパス」
http://jhlee.sakura.ne.jp/kyc/corpus/
3. 対話破綻検出チャレンジ2015
https://sites.google.com/site/dialoguebreakdowndetection/
4. DSTC7(2017) Dialog System Technology Challenges
http://workshop.colips.org/dstc7/index.html
5. NTCIR-14(2018-19) - 国立情報学研究所
http://research.nii.ac.jp/ntcir/ntcir-14/index-ja.html
6. EMCA 研究会エスノメソドロジー・会話分析とはなにか-
http://emca.jp/learn 藤田 自然言語表現の言い換え
http://paraphrasing.org/~fujita/paraphrasing-ja.html
7. 言語資源活用ワークショップ2018発表論文集 国立国語研究
所
42
ご清聴ありがとうございます.
参考文献は論文集を参照
してください.
9924658973@campus.ouj
.ac.jp
43

Contenu connexe

Tendances

子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得Yuya Unno
 
ハイフレックス授業のススメ
ハイフレックス授業のススメハイフレックス授業のススメ
ハイフレックス授業のススメkthrlab
 
全脳アーキテクチャ若手の会20170131
全脳アーキテクチャ若手の会20170131全脳アーキテクチャ若手の会20170131
全脳アーキテクチャ若手の会20170131Hangyo Masatsugu
 
自然言語処理における意味解析と意味理解
自然言語処理における意味解析と意味理解自然言語処理における意味解析と意味理解
自然言語処理における意味解析と意味理解Kanji Takahashi
 
Acoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief NetworksAcoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief NetworksJunya Saito
 
AI GIRLS COLLECTION_0929
AI GIRLS COLLECTION_0929AI GIRLS COLLECTION_0929
AI GIRLS COLLECTION_0929EikoHoshino
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングYuya Unno
 

Tendances (9)

子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得子供の言語獲得と機械の言語獲得
子供の言語獲得と機械の言語獲得
 
ハイフレックス授業のススメ
ハイフレックス授業のススメハイフレックス授業のススメ
ハイフレックス授業のススメ
 
全脳アーキテクチャ若手の会20170131
全脳アーキテクチャ若手の会20170131全脳アーキテクチャ若手の会20170131
全脳アーキテクチャ若手の会20170131
 
自然言語処理における意味解析と意味理解
自然言語処理における意味解析と意味理解自然言語処理における意味解析と意味理解
自然言語処理における意味解析と意味理解
 
Emnlp読み会資料
Emnlp読み会資料Emnlp読み会資料
Emnlp読み会資料
 
Py conkyushu2018
Py conkyushu2018Py conkyushu2018
Py conkyushu2018
 
Acoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief NetworksAcoustic Modeling using Deep Belief Networks
Acoustic Modeling using Deep Belief Networks
 
AI GIRLS COLLECTION_0929
AI GIRLS COLLECTION_0929AI GIRLS COLLECTION_0929
AI GIRLS COLLECTION_0929
 
Jubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニングJubatusの紹介@第6回さくさくテキストマイニング
Jubatusの紹介@第6回さくさくテキストマイニング
 

Similaire à Sig kbs slide-20181123_ota

Sig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_otaSig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_ota博三 太田
 
Lab visit research
Lab visit researchLab visit research
Lab visit researchJunta Mizuno
 
Daisy conference(prof.nagashima)20180528
Daisy conference(prof.nagashima)20180528Daisy conference(prof.nagashima)20180528
Daisy conference(prof.nagashima)20180528Yoshitake Misaki
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合うYuya Unno
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクールYuya Unno
 
NECTJ JHL Annual Conference Namiai Internatinal Camp
NECTJ JHL Annual Conference Namiai Internatinal CampNECTJ JHL Annual Conference Namiai Internatinal Camp
NECTJ JHL Annual Conference Namiai Internatinal CampNECTJ
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告Yuki Saito
 
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料Yasuhisa Kondo
 
2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについてWritingMaetriX
 
専門演習_河野ゼミ説明会20191120
専門演習_河野ゼミ説明会20191120専門演習_河野ゼミ説明会20191120
専門演習_河野ゼミ説明会20191120義広 河野
 
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦Kof2005 Presentation - OSSの教育効果と人材育成への挑戦
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦Hiroshi Miura
 
hirai23slp03.pdf
hirai23slp03.pdfhirai23slp03.pdf
hirai23slp03.pdfYuki Saito
 
プレゼン研修会20121018
プレゼン研修会20121018プレゼン研修会20121018
プレゼン研修会20121018義広 河野
 
Statistical Machine Translation Overview
Statistical Machine Translation OverviewStatistical Machine Translation Overview
Statistical Machine Translation OverviewHiroki Kawano
 
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency PathsClassifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths浩気 西山
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012Hiroyuki Mishima
 
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目【Schoo web campus】「相手に伝わる」文章を書く技術 2限目
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目schoowebcampus
 

Similaire à Sig kbs slide-20181123_ota (20)

Sig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_otaSig kst 34th-1_20180802_ota
Sig kst 34th-1_20180802_ota
 
Lab visit research
Lab visit researchLab visit research
Lab visit research
 
Daisy conference(prof.nagashima)20180528
Daisy conference(prof.nagashima)20180528Daisy conference(prof.nagashima)20180528
Daisy conference(prof.nagashima)20180528
 
言語資源と付き合う
言語資源と付き合う言語資源と付き合う
言語資源と付き合う
 
言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール言語と知識の深層学習@認知科学会サマースクール
言語と知識の深層学習@認知科学会サマースクール
 
NECTJ JHL Annual Conference Namiai Internatinal Camp
NECTJ JHL Annual Conference Namiai Internatinal CampNECTJ JHL Annual Conference Namiai Internatinal Camp
NECTJ JHL Annual Conference Namiai Internatinal Camp
 
Interspeech2022 参加報告
Interspeech2022 参加報告Interspeech2022 参加報告
Interspeech2022 参加報告
 
地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料地球研「知の橋かけ」コアFS説明資料
地球研「知の橋かけ」コアFS説明資料
 
2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて2014LETシンポジウム WritingMaetriXについて
2014LETシンポジウム WritingMaetriXについて
 
専門演習_河野ゼミ説明会20191120
専門演習_河野ゼミ説明会20191120専門演習_河野ゼミ説明会20191120
専門演習_河野ゼミ説明会20191120
 
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦Kof2005 Presentation - OSSの教育効果と人材育成への挑戦
Kof2005 Presentation - OSSの教育効果と人材育成への挑戦
 
hirai23slp03.pdf
hirai23slp03.pdfhirai23slp03.pdf
hirai23slp03.pdf
 
Sakai 20120414
Sakai 20120414Sakai 20120414
Sakai 20120414
 
Kof2005 Presen
Kof2005 PresenKof2005 Presen
Kof2005 Presen
 
プレゼン研修会20121018
プレゼン研修会20121018プレゼン研修会20121018
プレゼン研修会20121018
 
Statistical Machine Translation Overview
Statistical Machine Translation OverviewStatistical Machine Translation Overview
Statistical Machine Translation Overview
 
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency PathsClassifying Temporal Relations by Bidirectional LSTM over Dependency Paths
Classifying Temporal Relations by Bidirectional LSTM over Dependency Paths
 
集合知言語処理の研究動向(第3回集合知シンポジウム)
集合知言語処理の研究動向(第3回集合知シンポジウム)集合知言語処理の研究動向(第3回集合知シンポジウム)
集合知言語処理の研究動向(第3回集合知シンポジウム)
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
 
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目【Schoo web campus】「相手に伝わる」文章を書く技術 2限目
【Schoo web campus】「相手に伝わる」文章を書く技術 2限目
 

Plus de 博三 太田

「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」博三 太田
 
slide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdfslide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdf博三 太田
 
LT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdfLT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdf博三 太田
 
LanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdfLanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdf博三 太田
 
image_video_instagram_202212.pdf
image_video_instagram_202212.pdfimage_video_instagram_202212.pdf
image_video_instagram_202212.pdf博三 太田
 
EC_intro_ota_202212.pdf
EC_intro_ota_202212.pdfEC_intro_ota_202212.pdf
EC_intro_ota_202212.pdf博三 太田
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf博三 太田
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf博三 太田
 
Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5博三 太田
 
LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355博三 太田
 
Logics 18th ota_20211201
Logics 18th ota_20211201Logics 18th ota_20211201
Logics 18th ota_20211201博三 太田
 
Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127博三 太田
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota博三 太田
 
Seattle consultion 20200822
Seattle consultion 20200822Seattle consultion 20200822
Seattle consultion 20200822博三 太田
 
Syumai lt_mokumoku__20200807_ota
Syumai  lt_mokumoku__20200807_otaSyumai  lt_mokumoku__20200807_ota
Syumai lt_mokumoku__20200807_ota博三 太田
 
Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613博三 太田
 
Online python data_analysis19th_20200516
Online python data_analysis19th_20200516Online python data_analysis19th_20200516
Online python data_analysis19th_20200516博三 太田
 
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -博三 太田
 
Thesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.otaThesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.ota博三 太田
 
Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123博三 太田
 

Plus de 博三 太田 (20)

「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
「Fooocus(Stable DiffusionXL)で アニメ画像生成の仕方」
 
slide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdfslide_LT_Chatgpt部_太田_20231118.pdf
slide_LT_Chatgpt部_太田_20231118.pdf
 
LT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdfLT_Visual_Entailment_GPT-4V_20231021.pdf
LT_Visual_Entailment_GPT-4V_20231021.pdf
 
LanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdfLanguChain_summarization_LT_20230415.pdf
LanguChain_summarization_LT_20230415.pdf
 
image_video_instagram_202212.pdf
image_video_instagram_202212.pdfimage_video_instagram_202212.pdf
image_video_instagram_202212.pdf
 
EC_intro_ota_202212.pdf
EC_intro_ota_202212.pdfEC_intro_ota_202212.pdf
EC_intro_ota_202212.pdf
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf
 
EC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdfEC_attribute_exstraction_20221122.pdf
EC_attribute_exstraction_20221122.pdf
 
Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5
 
LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355LT_hannari python45th_20220121_2355
LT_hannari python45th_20220121_2355
 
Logics 18th ota_20211201
Logics 18th ota_20211201Logics 18th ota_20211201
Logics 18th ota_20211201
 
Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127Jsai2021 winter ppt_ota_20211127
Jsai2021 winter ppt_ota_20211127
 
Lt conehito 20210225_ota
Lt conehito 20210225_otaLt conehito 20210225_ota
Lt conehito 20210225_ota
 
Seattle consultion 20200822
Seattle consultion 20200822Seattle consultion 20200822
Seattle consultion 20200822
 
Syumai lt_mokumoku__20200807_ota
Syumai  lt_mokumoku__20200807_otaSyumai  lt_mokumoku__20200807_ota
Syumai lt_mokumoku__20200807_ota
 
Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613Lt syumai moku_mokukai_20200613
Lt syumai moku_mokukai_20200613
 
Online python data_analysis19th_20200516
Online python data_analysis19th_20200516Online python data_analysis19th_20200516
Online python data_analysis19th_20200516
 
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -本当に言いたい事をくみ取って応答する対話システムの構築に向けて- 昨年(2019年度)の取り組み -
本当に言いたい事をくみ取って応答する対話システムの構築に向けて - 昨年(2019年度)の取り組み -
 
Thesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.otaThesis sigconf2019 1123_hiromitsu.ota
Thesis sigconf2019 1123_hiromitsu.ota
 
Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123Sigconf 2019 slide_ota_20191123
Sigconf 2019 slide_ota_20191123
 

Sig kbs slide-20181123_ota

  • 1. 日本語学習者の相互行為分析を通じた対話生成システ ムの一考察 ~隣接ペア・笑い・フィラー・あいづちを通じて~ A Consideration on a Dialogue Generation System through Interaction Analysis of Japanese Learners 人工知能学会 合同研究会2018 於 慶應義塾大学 矢上キャンパス # 12棟109 第115回人工知能学会 知識ベースシステム研究会(SIG-KBS) <知識表現・知識獲得とその応用3> 16:55-17:20 2018年11月23日(金) 放送大学 教養学部 太田 博三
  • 2. 目次 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話分 析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 3. 基礎集計と分析による考察 3.1 インフォーマント属性間の比較 について 3.2 超級と中級のデータについて 3.3 隣接ペアとその計量化の検討 3.4 結果の考察 3.4.1 笑いとフィラーの比較検討 3.5 総括 4. データの増加の考察 4.1 国語研のデータとKYコーパスの 比較 4.2 コーパスを増やす前と後との品 詞の数量での比較考察 5. 突き上げ(Probes)と相互行為の 考察 cf. 項目反応理論 6. 今後の展望 2
  • 3. 目次 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話分 析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 3. 基礎集計と分析による考察 3.1 インフォーマント属性間の比較 について 3.2 超級と中級のデータについて 3.3 隣接ペアとその計量化の検討 3.4 結果の考察 3.4.1 笑いとフィラーの比較検討 3.5 総括 4. データの増加の考察 4.1 国語研のデータとKYコーパスの 比較 4.2 コーパスを増やす前と後との品 詞の数量での比較考察 5. 突き上げ(Probes)と相互行為の 考察 cf. 項目反応理論 6. 今後の展望 3
  • 4. 目次: 1. はじめに 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話 分析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 1) Pepper, Chatbotの導入 2) ディープラーニング 3) エスノメソドロジーや会話分析 のセミナーに参加 定量分析 vs 定性分析 から ↓ 定量分析 + 定性分析 へ 対話システム vs 会話分析 から ↓ 対話システム と 会話分析の融合 を図りたい! エスノメソドロジーや 会話分析: (対話システムは) 雑すぎて・・・ 対話システム: (会話分析は)細か すぎて・・・ 4
  • 5. 目次: 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話 分析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み ・もっぱら,数量データによる ディープラーニングに定性的な 要素を取り入れた(い). ・誰もが入手可能なデータでを 用いることで,統計的な有意性 やサンプル数より,日常生活の 感覚でわかることを重視する. 5 ウェブサイトの改善 (定性分析+定量分 析)
  • 6. 目次: 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話 分析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 1) 探索的記述統計を中心に 考察する. 2-1) 隣接ペアは本稿で定義 する種類のものに限定し計量 化する. 2-2) それらのペアが全体の 会話の促進になっているかを 考察する. 3) その隣接ペアの前後,もし くは直後の発話が修復に向け てのものか,完全に破綻して いるが強引に会話を続けたも のであるのかも検討する. 6
  • 7. 目次: 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話 分析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 「日本語学習者会話データ ベース」を用いました. 1)国立国語研究所が公開し ているコーパスの1つ 2)1990年の入管法の改正に より,日本語学習を必要とす る住民(言語生活者)の需要 に見合った言語教育の展開 が期待されていた. 3)ACTFL-OPI(全米外国語教 育協会認定の面接式口頭能 力テスト)を活用したもの. 7
  • 8. 目次: 1. はじめに 1.1 研究の背景と目的 1.2 研究の新規性 1.3 研究の主な手法 1.4 用いたデータセットについ て 2. 先行研究 2.1 エスノメソドロジー・会話 分析 2.2 自然言語処理 2.3 対話自動生成のディープ ラーニング 2.4 対話システムと会話ユー ザーインターフェース 2.5 国内外での取り組み 1)対話のスクリプトは,イン フォーマント(日本語学習者/ データ提供者)とテスター(面 接者)と,2者の対話からなり, 30分ほどの対話形式で構成 されている. 2)上記の10段階のOPIレベル や性別,年齢,出身国などを 選択することができる.検索 条件を設定してダウンロード すると,文字化(一部,音声 化)されたスクリプトが入手で きる. 8
  • 9. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析① 2.2 自然言語処理 2.3 対話自動生成の ディープラーニング 2.4 対話システムと会 話ユーザーインター フェース 2.5 国内外での取り組 み 1) 坊農・高梨他(2009)では,隣接ペ アとは,[質問]-[応答]の対をなす 発話の連鎖を指すもの, 2) 対話システムにおける対話モデ ルに発話連鎖構造の土台として いるとある. 3) フィラー(Filler)「あのー」や「まー」魏 (2015)など, =発話者が何らかの心的操作を行っ ている最中に発するもの =場をつなぐ機能を持つ言葉と =多くは「感動詞」や「間投詞」 ⇒「あいづち」や「{笑}」と同じく,会話 をつなぐ言葉として使われる. 9
  • 10. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析② 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 会話データ分析の論文数の推移 「学会誌『社会言語科学』掲載の会話データ分析論文の年代別動向の調査」より引用 10 研究が 発祥 研究の 広がり 研究の 国外へ 広がり 研究の 国外で 定着
  • 11. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 徳永・乾・松本(2005)及び徳永(2014) の論文では,対話システムに実装さ れる可能性が示されている. =チャット対話の収集からコーパス作 成,そしてチャット対話の構造モデル を提案している.このチャット対話の 質問や返答などの談話機能を担う構 成単位が交換行為である.交換単位 は「働きかけ」,「応答」,「補足」の3種 類に区分されている. 再現率は2人の場合でも3人の場合で も,86%と高い. 11
  • 12. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 徳永・乾・松本(2005)より ・説明変数(素性)一覧(SVMにより2値分類) 12
  • 13. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 1)対話応答の自動生成に関して, =ICML Workshop(2015)でVinyals et al(2015)のGoogleのチームが NIPS2014で発表 =Sequence to Sequence modelを 基としている. =多層のLong-Short term memory(LSTM)を用いて文章をベク トル化(エンコード)し,別の多層 LSTMを用いてベクトルをデコード (復元)するもの =自然な会話を生成するように なった. 2) Ghazvininejad et al(2018)は,上 記のモデルを拡張発展させたもの13
  • 14. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 1)狩野(2017)は,現在に至るまでの 対話システムと将来の展望を簡 潔にまとめられている. =1960年代に開発されたELIZAや 人工無能から,現代の雑談対話 システムの1つである2016年に 発表された論文に基づく Microsoft社の「りんな」まで網羅 している. =「りんな」では,発話ペアデータと 教師付き機械学習は統計的な 対話システムの多くに共通して いることが少なくない. 14
  • 15. 目次: 2. 先行研究 2.1 エスノメソドロ ジー・会話分析 2.2 自然言語処理 2.3 対話自動生成 のディープラーニ ング 2.4 対話システムと 会話ユーザーイン ターフェース 2.5 国内外での取り 組み 1)対話破綻検出チャレンジ(2015- 2017) 2)DTFC7, 3)NTCIR-14 =年次でハッカソンのような国際的 な大会として開催され,集合知 となっている. 15
  • 17. 目次: 3. 基礎集計による考察 3.4 結果の考察 3.1 インフォーマント属性 間の比較について ・本考察では,超級と中級とで比 較考察しました. →主な選択した要因は次の2つ である. 1) 流暢さ 2) 語用論的能力 ・超級では,「流暢さ」とは,会話全 体がなめらかであること, ・中級では,「流暢さ」とは,つかえ ることが多く一人で話つづけるの は難しい ・超級の「語用論的能力」とは, ターンテイキングや間の取り方, 相づちなどが巧みにできる ・中級では,相づちや言い換えな どに成功するのはまれとされてい る. 17 定 義 定 義 定 義 定 義
  • 18. 目次: 3. 基礎集計による考察 3.4 結果の考察 3.1 インフォーマント属性間の比較に ついて 3.2 超級と中級のデー タについて 1)中級は年齢が20代半ばで 分布しているが,超級は23歳 から49歳とばらつきが大きい. 2)出身国と母国語は韓国. 3)滞在期間が大きく異なる. 超級は5-10年が大半だが,中 級は3か月から6か月の間に 分布している. 表3.1 中級のインフォーマント属性 表3.2 超級のインフォーマント属性 表3.3 比較に用いたデータセット数 18
  • 19. 目次: 3. 基礎集計による考察 3.4 結果の考察 3.1 インフォーマント属性間の比較について 3.2 超級と中級のデータについて 3.3 隣接ペアとその計量化 の検討 1. 隣接ペアの重要な特性に,第1 部分(First-Pair-Part: FPP)が産出 されると,それに対応する特定の 型の第2部分(Second-Part-Pair: SPP)の産出が条件的に適切にな る[前川・小磯他(2015)] 2. 本節では,試みの一環として, 形態素解析した後に,同じ語句 がでてきたら,その合計の半分と して数量化した後に,目視で確認 をすることにした. 3. 隣接ペアが見出しやすい品詞 は,1)名詞,2)感動詞,3)間投詞, 4)応答詞 19
  • 20. 目次: 3. 基礎集計による考察 3.4 結果の考察 3.4.1 形態素解析後の中 級及び,超級の解釈 3.4.2 笑いとフィラー(「あー」)の比 較検討 超級も中級も,下記に示すように, 「名詞」,「感動詞-フィラー(「あー」)」, 「動詞」が大半を占めている. → フィラーも見落とせない頻出する 品詞といえる. 20
  • 21. 目次: 3. 基礎集計による考察 3.4.1 形態素解析後の中級及 び,超級の解釈 3.4.2 笑いとフィラー(「あー」)の比 較検討 21 中級データセット フィラー 超級データセット フィラー ・超級と中級とを比較: →フィラー(感動詞)では,超級が 12種類に対して,中級は30種類と ばらつきがある. ・中級者と上級者とで,名詞では,「と き」,「ほう」,「ほんと」など, 中級では,かなで表記されているが, 超級では漢字である.
  • 22. 目次: 3. 基礎集計による考察 3.4.2 笑いとフィラーの 比較検討 3.4.2 笑いとフィラー(「あー」)の比較検討 22 表3.4.1 {笑}の談話促進の例 対話の中の笑いは,{笑}で表 されています. 中級:笑 189個 超級:笑 422個 ・笑いの機能:会話のターン を維持・促進する働きがある ・大きく次の3つに分類される. 1) バランスを取るための笑い 2) 仲間づくりのための笑い 3) ごまかしのための笑い
  • 23. 目次: 3. 基礎集計による考察 3.4.2 笑いとフィラーの 比較検討 3.4.2 笑いとフィラー(「あー」)の比較検討 23 表3.4.3 言いよどみ/ 戸惑いのフィラーの例 ・感動詞-フィラー(表3.4.2) は, 中級では,あー 189個 超級では,あー 422個 →半分以下になっている. ・フィラーは言いよどみや 会話をつなぐ時間かせぎ の機能もあり,超級の方 が多様されている. ・中級も超級も,会話をつ なぐ言葉が多用されてい る. 表3.4.2 感動詞―フィラーの例
  • 24. 目次: 3. 基礎集計による考察 中級の場合の発話機能の定義と種類(10-12種類) 24 01 T : 02 Ⅰ : 03 T : 04 Ⅰ : 05 T : 06 Ⅰ : 07 T : 08 I : 09 T : 10 I : 11 T : 12 I : はい はい,はいじゃああの始めます,はじめまして はじめましてー ん私は【姓A】と申しますー あー【姓名B】申します あ【姓B】さんですね んはい【姓B】さんはえーっと日本にいつごろ来たんですか ん,2か月ぐらい,前で 前,あーほんとう〈はい〉えーっとーん国はどちらですか ん韓国人です 韓国〈はい〉あーそうですか韓国のどこーですか 釜山です 社交機能(呼びかけ) 社交機能(応答) 社交機能(自己提示) 社交機能(応答) 情報提供機能(呼びかけ) 情報提供機能(応答) 聞く機能+社交機能(呼びかけ) 聞く機能+社交機能(応答) 社交機能(呼びかけ) 社交機能(応答) 社交機能(呼びかけ) 社交機能(応答)
  • 25. 目次: 3. 基礎集計による考察 超級の場合の発話機能の定義と種類(10-12種類) 25 01 T : 02 Ⅰ : 03 T : 04 I : 05 T : 06 I : 07 T : 08 I : 09 T : 10 I : 11 T : 12 I : はいはい こんにちは こんにちは はい私は【姓A】と申します〈あ〉お名前お願いできますか あ【姓B】と申しますよろしくお願いします 【姓B】さんですね〈はい〉はいどうも【姓B】さんはえあのーどちら のどちらからいらっしゃいましたか あ韓国から来ました あーそうですか〈えー〉,で,えー今日本では〈はい〉何をしてらっ しゃいますか 今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の 〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを デザインしたりとかっということですか えーとーおもにあのモバイルサイト〈ん〉,のプログラムーを作っ たりしてます あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ ですね 社交機能(呼びかけ) 社交機能(応答) 社交機能(自己提示) 社交機能(応答) 情報提供機能(呼びかけ) 情報提供機能(応答) 情報提供機能(呼びかけ) 情報提供機能(応答) 情報提供機能(呼びかけ) 情報提供機能(応答) 同意要求(呼びかけ) 同意要求(応答)
  • 26. 目次: 3. 基礎集計による考察 3.5 総括 発話機能の定義と種類(10-12種類) 3.4.2 笑いとフィラー(「あー」)の比較検討 26 隣接対をザトラウスキー(1993)は,応答ペアと呼び, 1987年の国立国語研究所のをベースに,発話機能の定義と種類 を12種類に分けている. ①同意要求 ②意思表示 ③言い直し要求など… 10-12種類に区分. 表3.5.1では,中級の例であるが,社交辞令での呼びかけと応答 がしっかり成立している.一方で,「車」の話題で談話が破綻して いるが,テスターが「建築」の話題に話を戻し,修復している.対話 システムで,この修復の機能をいかに実装するかは,今後の課題 としたい.
  • 27. 目次: 3. 基礎集計による考察 3.5 総括 3.4.2 笑いとフィラー(「あー」)の比較検討 27 T : 聞く機能+社交機能(呼びかけ) I : 聞く機能+社交機能(応答) T : 社交機能(呼びかけ) I : 社交機能(応答) T : 社交機能(呼びかけ) I : 社交機能(応答) T : 社交機能(呼びかけ) I : 社交機能(応答) T : 社交機能(呼びかけ) I : 社交機能(応答) T : 聞く機能+社交機能(呼びかけ) I : 聞く機能+社交機能(応答) T : 聞く機能+社交機能(呼びかけ) I : 聞く機能+社交機能(応答) T : 聞く機能+社交機能(呼びかけ) I : 聞く機能+社交機能(応答) T : 聞く機能+社交機能(呼びかけ) I : 社交機能(応答) T : 修復 I : 応答 んーあーそうですかー〈はい〉あじゃ建築の勉強してるーん はい あーそうですかー建物や車〈はい〉,はーそれは建物のデ はいけいじ〈けいじ〉,けいじゃいとか,大学で〈ん〉,建物 あ造る〈はい〉,あ造る勉強をしていたんですか〈はいは あ建築はいはい{笑} あーそうですかー〈はい〉え車もですか {息を吸う音}車,も,好きですけど,まだ考え中です{笑} 釜山〈はい〉あーそうですかー〈はい〉,んー日本に2か月 はい んあそうですかんどうして日本に来たんですか 日本語勉強,する,つもりですけど〈んん〉,ん,ちょっと, あ,そうですかー〈はい〉あーじゃあ文化も知りたい〈はい〉 建物とか私が関心,関心で〈ん〉,関心,持って,いた持っ んはい【姓B】さんはえーっと日本にいつごろ来たんですか ん,2か月ぐらい,前で 前,あーほんとう〈はい〉えーっとーん国はどちらですか ん韓国人です 韓国〈はい〉あーそうですか韓国のどこーですか 釜山です ・中級の発話機能のラベリングの例右図では, まず,社交機能 (呼びかけ)- 社交 機能(応答)があ り, 次に,情報提供 機能(呼びかけ)- 社交機能(応答) がなされ,理解機 能(呼びかけ)や 同意要求(呼びか け)とそれに対応 して,理解機能 (応答)や同意要 求(応答)が成立 しており,高度な 対話がなされてい る.
  • 28. 目次: 3. 基礎集計による考察 3.5 総括 3.4.2 笑いとフィラー(「あー」)の比較検討 28 T : 社交機能(呼びかけ) Ⅰ : 社交機能(応答) T : 社交機能(自己提示) I : 社交機能(応答) T : 情報提供機能(呼びかけ) I : 情報提供機能(応答) T : 情報提供機能(呼びかけ) I : 情報提供機能(応答) T : 情報提供機能(呼びかけ) I : 情報提供機能(応答) T : 同意要求(呼びかけ) I : 同意要求(応答)はいはい こんにちは こんにちは はい私は【姓A】と申します〈あ〉お名前お願いできますか あ【姓B】と申しますよろしくお願いします 【姓B】さんですね〈はい〉はいどうも【姓B】さんはえあのーどちら のどちらからいらっしゃいましたか あ韓国から来ました あーそうですか〈えー〉,で,えー今日本では〈はい〉何をしてらっ しゃいますか 今はえーとーパソコン関係の〈ん〉ウェブ関係のお仕事をしてます あーそうですか〈はい〉ウェブ関係の仕事というとほんとに今の 〈えー〉現代の仕事という気がしますけれども〈はい〉じゃウェブを デザインしたりとかっということですか えーとーおもにあのモバイルサイト〈ん〉,のプログラムーを作っ たりしてます あーそうですか〈はい〉モバイル用の〈えー〉あのサイトということ ですね ・超級の発話機能のラベリングの例
  • 29. 目次: 3. 基礎集計による考察 3.5 総括 3.4.2 笑いとフィラー(「あー」)の比較検討 29 表3.5.2 基本的な 発話機能連鎖の 超級の例 最 初 の 5 タ ー ン 目 ま で は 「 隣 接 対 」で 対 話 が 成 立 し て い る .
  • 30. 目次: 3. 基礎集計による考察 3.5 総括 3.4.2 笑いとフィラー(「あー」)の比較検討 30 「2番目の発話が保留である連鎖組織」の例を表3.5.4~表 3.5.7に示す.いずれも隣接対が多く見受けられ,またフィラー のような,つなぎ言葉も相手への同意を示すなど,発話促進 の機能を果たしていると言える.
  • 37. 5. 突き上げ(Thrust up)と相互行為の考察 1 37 突き上げ(Probes)とは,テスター(受験者)の能力以上 の質問をわざとして,上段を見極める行為のこと. 相互行為とは, 社会学の一分野で「エスノメソドロ ジー」と呼びます。 牧野(1991)「ACTFLの外国語能力の基準より 表2 P25より 引用」
  • 38. 5. 突き上げ(Thrust up)と相互行為の考察 2 38 エスノメソドロジスト(エスノメソドロジーに依拠する研究 者たち)は、会話であるとか仕事、勉強、喧嘩、散歩と いった、社会生活をおくる上で日常生活者が経験する 様々な事柄が、どうやって当たり前のこととして成り立 たっているのかを調べます。 例: 「列に並ぶ」という活動について考えてみると, 映画の切符を買うために列に並ぶ際には、 他の人と同じくらいの間隔を空けて前の人の後ろに立 つ、前方を向く等々の、細かな決まり事があります.
  • 39. 5. 突き上げ(Thrust up)と相互行為の考察 3 39 <突き上げ> テスター(受験者)の能力の上と下を判断する. Cf. 「項目反応理論」: TOFEL/ TOEIC等で用いられている. 引用元: Rで項目反応理論 http://www.okadajp.org/RWiki/?R%E3%81 %A7%E9%A0%85%E7%9B%AE%E5%8F%8D %E5%BF%9C%E7%90%86%E8%AB%96
  • 41. 参考文献&参照URL(1/2) 参考文献: 1. 坊農・高梨他(2009)「知の科学多人数インタラクションの分析手法」3 章, 人工知能学会編集, オーム社 2. 徳永・乾・松本(2005)「チャット対話における発言間の継続関係と応 答関係の同定」自然言語処理言語処理学会 3. 徳永(2004)「チャット対話における発言の継続関係と応答関係の同 定」修士論文奈 良先端科学技術大学院大学情報科学研究科情報 処理学専攻 4. 牧野成一他(2001)「ACTFL-OPI 入門」アルク 5. Vinyals,et al(2015) Quoc Le. A Neural Conversational Model, arXiv 6. Ghazvininejad(2018) A Knowledge-Grounded Neural Conversation Model. Microsoft 7. 喜連川他(2017) 「暗黙の発話状況を考慮したニューラル対話モデ ル」. 言語処理学会第 23 回年次大会発表論文集 8. 串田, 平本, 林(2017) 「会話分析入門」勁草書房 41
  • 42. 参考文献&関連URL(2/2) 1. 関連 URL 国立国語研究所(2009) 「日本語教育ネットワーク」 https://nknet.ninjal.ac.jp/nknet/ndata/opi/ 2. 国立国語研究所(2010)「日本語学習者会話データベースの 利用手引き」鎌田・山内「タグ付きKY コーパス」 http://jhlee.sakura.ne.jp/kyc/corpus/ 3. 対話破綻検出チャレンジ2015 https://sites.google.com/site/dialoguebreakdowndetection/ 4. DSTC7(2017) Dialog System Technology Challenges http://workshop.colips.org/dstc7/index.html 5. NTCIR-14(2018-19) - 国立情報学研究所 http://research.nii.ac.jp/ntcir/ntcir-14/index-ja.html 6. EMCA 研究会エスノメソドロジー・会話分析とはなにか- http://emca.jp/learn 藤田 自然言語表現の言い換え http://paraphrasing.org/~fujita/paraphrasing-ja.html 7. 言語資源活用ワークショップ2018発表論文集 国立国語研究 所 42