SlideShare une entreprise Scribd logo
1  sur  15
Télécharger pour lire hors ligne
公的文書に対する
「やさしい日本語」換言辞書
作成のための調査
長岡技術科学大学 電気系
杢 真奈見  山本 和英
1
研究背景 2
現在、日本には十分な日本語能力を
持たない外国人が数十万人いる。
現支援策 … 多言語での情報提供
 ⇒ 全情報を多言語化することは 
  難しく、時間・コスト的に負担
支援策として最善ではない
研究背景 3
 日本語母語話者(日本人)
 文法、語彙に制限をかけて日本語
から「やさしい日本語」へ換言
 日本語初学者(外国人)
 最低限の文法と語彙を習得
「やさしい日本語」
「やさしい日本語」 4
 対象者:日本語初学者
   →留学生や外国人労働者等の
日本語能力の低い人々
 「やさしい」と難しいの定義
 →最低限の文法、語彙を習得した 
 日本語初学者の判断
 (使用コーパス:日本語教師の主観による判断)
既存研究
5
 本研究と同じコーパスを用いて   
統計的機械翻訳       (松田ら・2010)
 ⇒ 変換の精度が低かった
➔原因:コーパスのフォーマット・質が
機械翻訳に適していない
人手による「やさしい日本語」
        換言辞書の有効性を調査
研究目的
コーパス 6
 公的文書を日本語教師が3段階の     
「やさしい日本語」に訳したもの
➢逐語訳
 難しい表現 ⇒ 「やさしい」表現
   (逐語的に訳したもの)
➢意訳
 文意等を損なわないように可能な限り   
 「やさしい日本語」に換言
➢要約
 可能な限り文を簡約化
辞書の作成方法 7
 原文と逐語訳を使用
コーパス例)
 原文 …世界的に新型(豚)インフルエンザ
     の流行が危惧されています。
 逐語訳…世界中で新型インフルエンザ   
     の流行が心配されています。
「世界的に」が「世界中で」に換言…等
換言辞書の内容(1/3) 8
換言例)
 単語: 接種 ⇒ 注射
 複合名詞: 任意接種 ⇒ 任意の注射
 年号: 平成21年 ⇒ 2009年
 補助動詞:
お読みいただき ⇒ 読んで
 敬語等:
たまわりまして ⇒ いただき
換言辞書の内容(2/3) 9
換言例)
 省略: ~等、~を対象、各~
 補完: (月) ⇒ (月曜日)
 (カッコ)の情報:
  新型(豚)インフルエンザ
  ⇒ 新型インフルエンザ
  低学年(3年生まで)
  ⇒ 3年生まで
換言辞書の内容(3/3) 10
逐語的ではない換言例)
助成措置が講じられておりますので
⇒ 少し安くなりますから
保護者の皆様のご理解とご協力を
⇒ 皆さん、どうか理解と協力を
お願いします。
評価実験 11
 換言辞書の内容から20文の評価データを 
作成し、評価のための小規模実験を行った。
➢被験者:留学生2名
➢評価方法:4種類
①元の文の方がやさしく感じる       
②換言後の方がやさしく感じる      
③どちらもやさしく感じる          
④どちらも難しく感じる
評価実験 12
評価データ例)
換言前:平成22年8月16日(月)~20日(金)     
      に市立病院にて予防接種を行います。
換言後:2010年8月16日(月曜日)~20日(金曜日) 
      に市立病院で予防注射を行います。
 ⇒ 結果:換言後がやさしいと判断
…平均15.5文 / 20文
考察 13
 複合名詞の分割
 予定人数→ 予定の人数
 必要書類→ 必要な書類
 地区住民→ 地区に住んでいる人
 敬語…尊敬語・謙譲語
   ⇒ これらを解消することで   
     やさしくなった。
結論 14
 人手で作成した換言辞書の評価
→20文中15.5文がやさしいと判断
 ⇒辞書の有効性が確認できた。
 複合名詞と敬語の問題を解消すると
日本語はやさしくなり、日本語初学者
の理解を助ける。
今後の課題 15
 換言辞書の完成
 換言辞書を用いた換言システムの作成

Contenu connexe

Tendances

論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource LanguagesShinnosuke Takamichi
 
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech CorpusShinnosuke Takamichi
 
正規表現入門
正規表現入門正規表現入門
正規表現入門thinca
 
第1回한국어勉強会(スライド)
第1回한국어勉強会(スライド)第1回한국어勉強会(スライド)
第1回한국어勉強会(スライド)Yuma Akado
 
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス Shinnosuke Takamichi
 
日本語の語彙特性について
日本語の語彙特性について日本語の語彙特性について
日本語の語彙特性についてAsakuraYasunobu
 

Tendances (8)

論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
論文紹介 SANTLR: Speech Annotation Toolkit for Low Resource Languages
 
論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus論文紹介 Building the Singapore English National Speech Corpus
論文紹介 Building the Singapore English National Speech Corpus
 
正規表現入門
正規表現入門正規表現入門
正規表現入門
 
第1回한국어勉強会(スライド)
第1回한국어勉強会(スライド)第1回한국어勉強会(スライド)
第1回한국어勉強会(スライド)
 
2 6
2 62 6
2 6
 
2 6
2 62 6
2 6
 
JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス JVS:フリーの日本語多数話者音声コーパス
JVS:フリーの日本語多数話者音声コーパス
 
日本語の語彙特性について
日本語の語彙特性について日本語の語彙特性について
日本語の語彙特性について
 

En vedette

Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)
Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)
Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)Nieve11
 
Publicidades impactantes
Publicidades impactantesPublicidades impactantes
Publicidades impactantesNieve11
 
El arte de Steve hanks
El arte de Steve hanksEl arte de Steve hanks
El arte de Steve hanksNieve11
 
Templo de oro Darbar Sahib, India
Templo de oro Darbar Sahib, IndiaTemplo de oro Darbar Sahib, India
Templo de oro Darbar Sahib, IndiaNieve11
 
Aceleracindeltiempoteoradecalleman
AceleracindeltiempoteoradecallemanAceleracindeltiempoteoradecalleman
AceleracindeltiempoteoradecallemanNieve11
 
Curioso y colorista cementerio mexicano
Curioso y colorista cementerio mexicanoCurioso y colorista cementerio mexicano
Curioso y colorista cementerio mexicanoNieve11
 
Jerusalen
Jerusalen Jerusalen
Jerusalen Nieve11
 
Me desbordaba
Me desbordabaMe desbordaba
Me desbordabaNieve11
 

En vedette (9)

2010
20102010
2010
 
Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)
Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)
Agua-de-mar-un-plasma-marino-al-alcance-de-todos+(1)
 
Publicidades impactantes
Publicidades impactantesPublicidades impactantes
Publicidades impactantes
 
El arte de Steve hanks
El arte de Steve hanksEl arte de Steve hanks
El arte de Steve hanks
 
Templo de oro Darbar Sahib, India
Templo de oro Darbar Sahib, IndiaTemplo de oro Darbar Sahib, India
Templo de oro Darbar Sahib, India
 
Aceleracindeltiempoteoradecalleman
AceleracindeltiempoteoradecallemanAceleracindeltiempoteoradecalleman
Aceleracindeltiempoteoradecalleman
 
Curioso y colorista cementerio mexicano
Curioso y colorista cementerio mexicanoCurioso y colorista cementerio mexicano
Curioso y colorista cementerio mexicano
 
Jerusalen
Jerusalen Jerusalen
Jerusalen
 
Me desbordaba
Me desbordabaMe desbordaba
Me desbordaba
 

Similaire à 公的文書に対する「やさしい日本語」換言辞書作成のための調査

小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言Tomoyuki Kajiwara
 
国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化Kodaira Tomonori
 
Introduction to linguaphone 2013 mar
Introduction to linguaphone 2013 marIntroduction to linguaphone 2013 mar
Introduction to linguaphone 2013 marYoko Morisawa
 
Sophia University CALL Seminar - CLIL & CALL
Sophia University CALL Seminar - CLIL & CALLSophia University CALL Seminar - CLIL & CALL
Sophia University CALL Seminar - CLIL & CALLRichard Pinner
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12keyyouwatari
 
自然言語処理概要
自然言語処理概要自然言語処理概要
自然言語処理概要ratchiratchi
 
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—Atsushi Nakanishi
 
日本語学習者の学習意識における 学習者本人と日本語教育者・一般日本人の認識の差
日本語学習者の学習意識における学習者本人と日本語教育者・一般日本人の認識の差日本語学習者の学習意識における学習者本人と日本語教育者・一般日本人の認識の差
日本語学習者の学習意識における 学習者本人と日本語教育者・一般日本人の認識の差 Akira Yoshikai
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会Tomoyuki Kajiwara
 
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房Takehiko Ito
 
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房Takehiko Ito
 
演習での発表について
演習での発表について演習での発表について
演習での発表についてMunenoriNAGAO
 
把構文の教え方
把構文の教え方把構文の教え方
把構文の教え方ch4station
 
日本語教育にとって必要な遠隔教育
日本語教育にとって必要な遠隔教育日本語教育にとって必要な遠隔教育
日本語教育にとって必要な遠隔教育Jae-ho Lee
 
20120731 ALC Eijiro User Meeting
20120731 ALC Eijiro User Meeting20120731 ALC Eijiro User Meeting
20120731 ALC Eijiro User Meetingakikom0819
 
日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築Tomoyuki Kajiwara
 
2015 yef matsui_presentation公開版
2015 yef matsui_presentation公開版2015 yef matsui_presentation公開版
2015 yef matsui_presentation公開版Takashi Matsui
 

Similaire à 公的文書に対する「やさしい日本語」換言辞書作成のための調査 (19)

小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言小学生の読解支援に向けた語釈文による換言
小学生の読解支援に向けた語釈文による換言
 
国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化国語辞典を使った放送ニュースの名詞の平易化
国語辞典を使った放送ニュースの名詞の平易化
 
Introduction to linguaphone 2013 mar
Introduction to linguaphone 2013 marIntroduction to linguaphone 2013 mar
Introduction to linguaphone 2013 mar
 
JASELE 20140809 Terasawa
JASELE 20140809 TerasawaJASELE 20140809 Terasawa
JASELE 20140809 Terasawa
 
Sophia University CALL Seminar - CLIL & CALL
Sophia University CALL Seminar - CLIL & CALLSophia University CALL Seminar - CLIL & CALL
Sophia University CALL Seminar - CLIL & CALL
 
Mel20140709 12key
Mel20140709 12keyMel20140709 12key
Mel20140709 12key
 
自然言語処理概要
自然言語処理概要自然言語処理概要
自然言語処理概要
 
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—
日本人英語学習者の前置詞使用の問題点の解明 —頻度・共起語・用法の 3 つの観点から—
 
日本語学習者の学習意識における 学習者本人と日本語教育者・一般日本人の認識の差
日本語学習者の学習意識における学習者本人と日本語教育者・一般日本人の認識の差日本語学習者の学習意識における学習者本人と日本語教育者・一般日本人の認識の差
日本語学習者の学習意識における 学習者本人と日本語教育者・一般日本人の認識の差
 
文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会文章読解支援のための語彙平易化@第1回NLP東京Dの会
文章読解支援のための語彙平易化@第1回NLP東京Dの会
 
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
 
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
R034 伊藤武彦・田原俊司・朴 媛淑 (1993). 文の理解にはたす助詞の働き:日本語と韓国語を中心に 風間書房
 
演習での発表について
演習での発表について演習での発表について
演習での発表について
 
把構文の教え方
把構文の教え方把構文の教え方
把構文の教え方
 
Tc2013.6.15
Tc2013.6.15Tc2013.6.15
Tc2013.6.15
 
日本語教育にとって必要な遠隔教育
日本語教育にとって必要な遠隔教育日本語教育にとって必要な遠隔教育
日本語教育にとって必要な遠隔教育
 
20120731 ALC Eijiro User Meeting
20120731 ALC Eijiro User Meeting20120731 ALC Eijiro User Meeting
20120731 ALC Eijiro User Meeting
 
日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築日本語の語彙平易化評価セットの構築
日本語の語彙平易化評価セットの構築
 
2015 yef matsui_presentation公開版
2015 yef matsui_presentation公開版2015 yef matsui_presentation公開版
2015 yef matsui_presentation公開版
 

Plus de 長岡技術科学大学 自然言語処理研究室

Plus de 長岡技術科学大学 自然言語処理研究室 (20)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
用言等換言辞書の構築
用言等換言辞書の構築用言等換言辞書の構築
用言等換言辞書の構築
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 

公的文書に対する「やさしい日本語」換言辞書作成のための調査