SlideShare une entreprise Scribd logo
1  sur  13
Télécharger pour lire hors ligne
電気系 山本研究室 
09319689 吉倉 孝太郎
換言:ある言語表現を別の言語表現に変換する処理 
犬と散歩する → 犬と歩く 
散歩すると歩くは換言可能な対である 
このような換言可能な対を集めることで 
・文章の平易化 
・語彙の制限による処理精度の向上
・シソーラス(上位下位関係を使って換言) 
・国語辞書の語釈文 
などを用いて換言処理を行なっている 
→これらの換言が人間の感覚に沿った換言 
となっているかどうか検討されていない
人間の感覚に沿った平易な換言を行いたい 
→現状、人間の感覚に沿った換言を行うための 
→言語資源は存在しない 
→本研究では人間の感覚に沿って平易に 
→換言することの出来る言語資源を構築する
・換言対象語は形態素解析器JUMANから抽出 
・換言対象語の品詞は動詞、サ変名詞、形容詞、副詞 
・なるべく平易な表現に換言する 
・換言にはシソーラスや国語辞書等は利用しない
換言の流れ:例として動詞”和える”を利用 
①”和える”を使った例文を考える 
ごまと和える 
②”和える”と置き換えて意味の通じる語を考えて換言 
ごまと和える → ごまと混ぜる 
③”和える”と”混ぜる”は換言可能として辞書に追加 
和える-混ぜる の対を取得
効率良く構築するため以下の場合換言しない 
・より平易な表現が思いつかない 
→投げる、言う、話す など 
・換言するときの必要語数が多い 
→一進一退する など 
・意味が明確に分からない 
→笑み割れる、かがる など
品詞 
換言対象語数 
換言対作成数 
無記入数 
動詞 
3,608語 
3,206語 
481語 
サ変名詞 
5,627語 
4,494語 
1,141語 
形容詞 
2,335語 
1,851語 
496語 
副詞 
1,243語 
785語 
463語 
合計 
12,813語 
10,336語 
2,585語 
→およそ13,000語の単語を換言して 
約10,000語の換言対を得られた
・無記入としたものについて 
換言困難と判断したものがおおよそ3分の1 
理解できない換言対象語がおおよそ3分の2となった 
→無記入の妥当性や理解できないものへの対策 
今回構築した辞書を用いて換言出来るようになった 
→実際に換言を行った結果を考察し、 
→辞書に反映させることで辞書の質を向上させる
ご清聴ありがとうございました。
・多義性がある語の換言 
複数文脈に使われる可能性のある語を換言する場合 
それぞれについて換言を行う。 
例:仰ぐの場合 
空を仰ぐ → 空を見る 
師匠を仰ぐ → 師匠を尊敬する 
指示を仰ぐ → 指示を求める 
この場合、仰ぐの候補は3つ全て追加することになる
・格変化を伴う換言 
換言する際に格関係を修正する必要がある場合がある 
例:背く 
上司に背く → 上司に裏切る →不適切 
上司に背く → 上司を裏切る →適切 
この場合「に背く」を「を裏切る」へと換言することになる
・慣用的表現 
複数形態素の一部に換言する語が含まれている 
例:入れる 
ギターを手に入れる →入れる単体での換言は不可 
→ギターを得るへの換言は可 
この場合、手に入れるはまとめて得ると換言する

Contenu connexe

En vedette

5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any NegotiationManisha Dorawala
 
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The FutureBernard Moon
 
Local SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitorsLocal SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitorsGreg Gifford
 
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOWBALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOWJon Burkhart
 
AIM-OPP for clearbook
AIM-OPP for clearbookAIM-OPP for clearbook
AIM-OPP for clearbookJinky Quizon
 
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)НАЕК «Енергоатом»
 
кратко
краткократко
краткоkulibin
 
Consumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer AcquisitionConsumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer AcquisitionDave McClure
 
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan North Texas Chapter of the ISSA
 
10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your OwnWishpond
 

En vedette (20)

Cannes insights mma
Cannes insights mmaCannes insights mma
Cannes insights mma
 
5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation5 Questions That You Should Ask in Any Negotiation
5 Questions That You Should Ask in Any Negotiation
 
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future넥스트 컨퍼런스 2013: Conference on Innovation and The Future
넥스트 컨퍼런스 2013: Conference on Innovation and The Future
 
Automatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge ExpressionAutomatic Selection of Predicates for Common Sense Knowledge Expression
Automatic Selection of Predicates for Common Sense Knowledge Expression
 
Local SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitorsLocal SEO - How to beat your clueless competitors
Local SEO - How to beat your clueless competitors
 
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOWBALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
BALLSY Guide To The SXSW 2016 Talks You Should Vote For NOW
 
対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳対訳コーパスから生成したワードグラフによる部分的機械翻訳
対訳コーパスから生成したワードグラフによる部分的機械翻訳
 
Selecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for ChildrenSelecting Proper Lexical Paraphrase for Children
Selecting Proper Lexical Paraphrase for Children
 
AIM-OPP for clearbook
AIM-OPP for clearbookAIM-OPP for clearbook
AIM-OPP for clearbook
 
Ordem trt2
Ordem trt2Ordem trt2
Ordem trt2
 
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
Підсумки роботи ДП «НАЕК «Енергоатом» за 8 місяців 2015 року (оперативні)
 
Dicas presentes de natal 2014
Dicas presentes de natal 2014Dicas presentes de natal 2014
Dicas presentes de natal 2014
 
кратко
краткократко
кратко
 
Consumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer AcquisitionConsumer Web Platforms & Customer Acquisition
Consumer Web Platforms & Customer Acquisition
 
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
NTXISSACSC3 - How Threat Modeling Can Improve Your IAM Solution by John Fehan
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
Socialmedianew
SocialmedianewSocialmedianew
Socialmedianew
 
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
 
10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own10 Landing Page Case Studies to Help you Optimize your Own
10 Landing Page Case Studies to Help you Optimize your Own
 
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築役所からの公的文書に対する「やさしい日本語」への変換システムの構築
役所からの公的文書に対する「やさしい日本語」への変換システムの構築
 

Similaire à 用言等換言辞書の構築

Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5博三 太田
 
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...Takehiko Ito
 
はじめての生成文法 《後編》
はじめての生成文法 《後編》はじめての生成文法 《後編》
はじめての生成文法 《後編》Shuyo Nakatani
 
FSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic EssentialsFSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic EssentialsHitoshi Nishikawa
 

Similaire à 用言等換言辞書の構築 (6)

Python nlp handson_20220225_v5
Python nlp handson_20220225_v5Python nlp handson_20220225_v5
Python nlp handson_20220225_v5
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察用言等換言辞書を用いた換言結果の考察
用言等換言辞書を用いた換言結果の考察
 
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
 
はじめての生成文法 《後編》
はじめての生成文法 《後編》はじめての生成文法 《後編》
はじめての生成文法 《後編》
 
FSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic EssentialsFSNLP Ch.3 Linguistic Essentials
FSNLP Ch.3 Linguistic Essentials
 

Plus de 長岡技術科学大学 自然言語処理研究室

説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~長岡技術科学大学 自然言語処理研究室
 

Plus de 長岡技術科学大学 自然言語処理研究室 (20)

小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
 
質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類質問意図によるQAサイト質問文の自動分類
質問意図によるQAサイト質問文の自動分類
 
用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました用言等換言辞書を人手で作りました
用言等換言辞書を人手で作りました
 
文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得文字列の出現頻度情報を用いた分かち書き単位の自動取得
文字列の出現頻度情報を用いた分かち書き単位の自動取得
 
「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作「やさしい日本語」変換システムの試作
「やさしい日本語」変換システムの試作
 
常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討常識表現となり得る用言の自動選定の検討
常識表現となり得る用言の自動選定の検討
 
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
動詞意味類型の曖昧性解消に向けた格フレーム情報との関連調査
 
二格深層格の定量的分析
二格深層格の定量的分析二格深層格の定量的分析
二格深層格の定量的分析
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案文脈の多様性に基づく名詞換言の提案
文脈の多様性に基づく名詞換言の提案
 
保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出保険関連文書を対象とした文章校正支援のための変換誤り検出
保険関連文書を対象とした文章校正支援のための変換誤り検出
 
Developing User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text AnalyzerDeveloping User-friendly and Customizable Text Analyzer
Developing User-friendly and Customizable Text Analyzer
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得大規模常識知識ベース構築のための常識表現の自動獲得
大規模常識知識ベース構築のための常識表現の自動獲得
 
普通名詞換言辞書の構築
普通名詞換言辞書の構築普通名詞換言辞書の構築
普通名詞換言辞書の構築
 
機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討機械学習を用いたニ格深層格の自動付与の検討
機械学習を用いたニ格深層格の自動付与の検討
 
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
A Comparison of Unsuperviesed Bilingual Term Extraction Methods Using Phrase ...
 
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
説明文と記述要素の関係要因の調査~そこにクエリの「何」が書かれているのか~
 
QAサイトにおける専門用語を用いた最適な回答者提示
QAサイトにおける専門用語を用いた最適な回答者提示QAサイトにおける専門用語を用いた最適な回答者提示
QAサイトにおける専門用語を用いた最適な回答者提示
 
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
フレーズテーブルを用いた教師なし用語対訳抽出手法の比較
 

用言等換言辞書の構築