SlideShare une entreprise Scribd logo
1  sur  16
Télécharger pour lire hors ligne
How Far are We from Fully
Automatic High Quality
Grammatical Error Correction?
文献紹介2015年9月16日
髙橋寛治
文献について
• Christopher Bryant, Hwee Tou Ng
• Proceedings of the 53rd Annual Meeting of the
Association for Computational Linguistics and the 7th
International Joint Conference on Natural Language
Processing, pages 697–707, Beijing, China, July 26-31,
2015.
概要
• 文法誤り訂正においてアノテータ間での一致がどれくらいか調
査
• 複数の正解があるタスクではあまり有益ではない
• 学生50人のエッセイのデータセットを構築
• 10人のアノテータによる正解データを付与
• 新しい評価手法を提案
• 人とシステムのパフォーマンスの比に基づいて
はじめに
• 近年文法誤り訂正の関心は増加している
• CoNLLのShared Task
• 複数の研究(Dale and Kilgariff 2011; Ng et al., 2013)
• しかしながら、様々な手法の比較が難しい
• 一般的にはゴールドデータとの比較
• 母語話者一人によるアノテーション
• 何人かによって作られたデータと比較
• クラウドソーシングを利用(Madnani et al.,2011; Pavlick et
al.,2014)
はじめに
• データセットを作成して簡単に実験
• 1対9の人対人で評価すると最大70%のスコア(F0.5)
• 予想に反したので、より効果的な評価手法を検討
文法誤り訂正におけるアノテータ間での
同意(IAA)
• Cohenのκ係数がよく使われる
• 判断結果の信頼性を問うもの。偶然による一致を考慮
• 0.61~0.80:実質的に一致
• 200個の前置詞を補う問題を母語話者に問う
• Κ係数は0.7だった
• 母語話者の書いた文から前置詞を復元するタスクだったが、実際の学
習者の文の前置詞の復元はノイズがある
• 200文が正しいかどうかを問う(Rozovskaya and Roth 2010)
• 3人の評価者で行った結果、κ値は0.16, 0.4, 0.23
• 評価は慎重に行わなければいけない
SMTにおけるアノテータ間の同意
• アノテータによる偏りを最小化する取り組み(Snover et al.,
2006; Madnani et al ., 2008)
• 言語を横断すると、κ値は0.4より大きくならない(Bojar et
al.,2014)
• なぜ、SMTでは値が低いか?
• 例:”had go”
• “go”->”gone”か、”had go”->”had gone”のエラーと見るか
• 間違いの分類の曖昧性が問題を引き起こす
• 自分自身と比較してもκ値は0.6
アノテータの偏り
• はじめに小規模の実験を行う
• 10人のアノテータによる、少数の文の訂正
• 人によって全く異なる
• 一番大きな変化は能動態から受動態に変化させたこと
文法誤り訂正のタスクにおいて、別の評価手法が必要
データの収集
• 英語非母語話者の大学生25人のエッセイ
• 2つのトピックについて記述してもらう(エッセイ50本)
• 大体同じ内容、同じ品質のものが集まる
• アノテート
• CoNLL2014の形式に揃える
• 10人のアノテータ(イギリス英語ネイティブ)
• 2人:CoNLL-2014のオフィシャルアノテータ
• 7人:クラウドソーシング
• 1人:著者の1人
アノテータ数の与える影響の調査
• CoNLL-2014のShared taskで確認
• 文レベルで評価する
• 誤り、提案、正例
• F0.5を使用
• 適合率が再現率の2倍として計算される
• システムとそれぞれのアノテータとペアワイズ法で比較する
• 組み合わせ技法の一つ
CoNLLトップのシステムと比較
すべての組み合わせ
• 人対人の比較
• Aはすべてのアノテータ、XはAに属するアノテータ
• Fはスコア(アノテータを3:7に分けて計算)
• 一般化して利用。F0.5の平均スコアを導出
アノテータ数とシステムの比較
CoNLL-­‐2014トップは73%の精度を叩きだした
エッセイで部分的に見てみると
AMUとCUUIの結果が逆転する
結論
• 10人でアノテートした結果、従来のアノテータ間の同意の指
標は文法誤り訂正には向いていないことがわかった
• アノテータの増加は評価に影響を与える
• 今後の研究ではこれを参考にすることができる
• 人 vs 人でも、100%にはならない
• データセットをつくりました

Contenu connexe

Plus de Kanji Takahashi

20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words
Kanji Takahashi
 
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
Kanji Takahashi
 

Plus de Kanji Takahashi (20)

論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
論文読み会 Data Augmentation for Low-Resource Neural Machine Translation
 
言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告言語処理学会第23回年次大会参加報告
言語処理学会第23回年次大会参加報告
 
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...20170203The Effects of Data Size and Frequency Range on Distributional Semant...
20170203The Effects of Data Size and Frequency Range on Distributional Semant...
 
20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units20161215Neural Machine Translation of Rare Words with Subword Units
20161215Neural Machine Translation of Rare Words with Subword Units
 
Enriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine TranslationEnriching Morphologically Poor Languages for Statistical Machine Translation
Enriching Morphologically Poor Languages for Statistical Machine Translation
 
A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...A Beam-Search Decoder for Normalization of Social Media Text with Application...
A Beam-Search Decoder for Normalization of Social Media Text with Application...
 
Reducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine TranslationReducing the Impact of Data Sparsity in Statistical Machine Translation
Reducing the Impact of Data Sparsity in Statistical Machine Translation
 
文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation文献紹介:Morphological analysis for Statistical Machine Translation
文献紹介:Morphological analysis for Statistical Machine Translation
 
Distributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their CompositionallyDistributed Representations of Words and Phrases and their Compositionally
Distributed Representations of Words and Phrases and their Compositionally
 
Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)Nlp2016参加報告(高橋)
Nlp2016参加報告(高橋)
 
Domain-spesific Paraphrase Extraction
Domain-spesific Paraphrase ExtractionDomain-spesific Paraphrase Extraction
Domain-spesific Paraphrase Extraction
 
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An InvestigationVietnamese Word Segmentation with CRFs and SVMs: An Investigation
Vietnamese Word Segmentation with CRFs and SVMs: An Investigation
 
Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...Improving vietnamese word segmentation and pos tagging using MEM with various...
Improving vietnamese word segmentation and pos tagging using MEM with various...
 
日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用日本語機能表現の自動検出と統計的係り受け解析への応用
日本語機能表現の自動検出と統計的係り受け解析への応用
 
20150728So similar and yet incompatible: Toward automated identification of s...
20150728So similar and yet incompatible:Toward automated identification of s...20150728So similar and yet incompatible:Toward automated identification of s...
20150728So similar and yet incompatible: Toward automated identification of s...
 
20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis20150701 Improving SMT quality with morpho-syntactic analysis
20150701 Improving SMT quality with morpho-syntactic analysis
 
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
文献紹介20150508 Paraphrasing Adaptation for Web Search Ranking
 
20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words20150415 automatic retirieval_and_clustering_of_similar_words
20150415 automatic retirieval_and_clustering_of_similar_words
 
A baseline system for chinese near synonym choice
A baseline system for chinese near synonym choiceA baseline system for chinese near synonym choice
A baseline system for chinese near synonym choice
 
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
20150225文献紹介 On WordNet Semantic Classes and Dependency Parsing
 

Dernier

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
 

Dernier (7)

The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
 
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentationTokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
 
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
 
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScriptUniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
 
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
 
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
 
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
 

20150916How Far are We from Fully Automatic High Quality Grammatical Error Correction?