Accueil
Explorer
Soumettre la recherche
Mettre en ligne
S’identifier
S’inscrire
Publicité
Check these out next
深層学習の非常に簡単な説明
Seiichi Uchida
ブラックボックス最適化とその応用
gree_tech
子供の言語獲得と機械の言語獲得
Yuya Unno
Transformerを雰囲気で理解する
AtsukiYamaguchi1
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
Tomoyuki Hioki
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
ベータ分布の謎に迫る
Ken'ichi Matsui
全力解説!Transformer
Arithmer Inc.
1
sur
20
Top clipped slide
文章読解支援のための語彙平易化
24 Mar 2015
•
0 j'aime
1 j'aime
×
Soyez le premier à aimer ceci
afficher plus
•
1,094 vues
vues
×
Nombre de vues
0
Sur Slideshare
0
À partir des intégrations
0
Nombre d'intégrations
0
Télécharger maintenant
Télécharger pour lire hors ligne
Signaler
Sciences
梶原智之. 文章読解支援のための語彙平易化. 長岡技術科学大学修士論文, March 2015.
Tomoyuki Kajiwara
Suivre
Publicité
Publicité
Publicité
Recommandé
言語資源と付き合う
Yuya Unno
10.4K vues
•
48 diapositives
機械学習モデルの判断根拠の説明
Satoshi Hara
95.3K vues
•
110 diapositives
質問応答システム入門
Hiroyoshi Komatsu
15.4K vues
•
52 diapositives
Jubatus Casual Talks #2 異常検知入門
Shohei Hido
35.2K vues
•
36 diapositives
Group normalization
Ryutaro Yamauchi
3.7K vues
•
18 diapositives
研究室における研究・実装ノウハウの共有
Naoaki Okazaki
11K vues
•
32 diapositives
Contenu connexe
Présentations pour vous
(20)
深層学習の非常に簡単な説明
Seiichi Uchida
•
45.2K vues
ブラックボックス最適化とその応用
gree_tech
•
5.6K vues
子供の言語獲得と機械の言語獲得
Yuya Unno
•
35.4K vues
Transformerを雰囲気で理解する
AtsukiYamaguchi1
•
4.5K vues
[論文紹介] LSTM (LONG SHORT-TERM MEMORY)
Tomoyuki Hioki
•
1.2K vues
深層学習の不確実性 - Uncertainty in Deep Neural Networks -
tmtm otm
•
9.8K vues
ベータ分布の謎に迫る
Ken'ichi Matsui
•
3K vues
全力解説!Transformer
Arithmer Inc.
•
7.5K vues
多様な強化学習の概念と課題認識
佑 甲野
•
57.6K vues
トップカンファレンスへの論文採択に向けて(AI研究分野版)/ Toward paper acceptance at top conferences (AI...
JunSuzuki21
•
13.9K vues
Surveyから始まる研究者への道 - Stand on the shoulders of giants -
諒介 荒木
•
4.4K vues
メタスタディ (Vision and Language)
Shintaro Yamamoto
•
1.4K vues
[DL輪読会]BERT: Pre-training of Deep Bidirectional Transformers for Language Und...
Deep Learning JP
•
20.3K vues
社会人博士という選択肢
Hiroki Toyokawa
•
25.5K vues
密度比推定による時系列データの異常検知
- Core Concept Technologies
•
3.9K vues
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
Satoshi Hara
•
4.9K vues
Active Learning の基礎と最近の研究
Fumihiko Takahashi
•
657 vues
抽出型要約と言い換えによる生成型要約の訓練データ拡張
MENGSAYLOEM1
•
1.2K vues
BlackBox モデルの説明性・解釈性技術の実装
Deep Learning Lab(ディープラーニング・ラボ)
•
21.1K vues
scikit-learnを用いた機械学習チュートリアル
敦志 金谷
•
211.6K vues
En vedette
(9)
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
Tomoyuki Kajiwara
•
2K vues
Noun Paraphrasing Based on a Variety of Contexts
Tomoyuki Kajiwara
•
960 vues
joint_seminar
Tomoyuki Kajiwara
•
697 vues
Evaluation Dataset and System for Japanese Lexical Simplification
Tomoyuki Kajiwara
•
908 vues
文献紹介:Simple English Wikipedia: A New Text Simplification Task
Tomoyuki Kajiwara
•
781 vues
文章読解支援のための語彙平易化@第1回NLP東京Dの会
Tomoyuki Kajiwara
•
779 vues
tmu_science_cafe02
Tomoyuki Kajiwara
•
5.7K vues
高頻度語は平易なのか?
Tomoyuki Kajiwara
•
2.5K vues
Incorporating word reordering knowledge into attention-based neural machine t...
sekizawayuuki
•
300 vues
Publicité
Similaire à 文章読解支援のための語彙平易化
(12)
日本語の語彙平易化システムの構築
Tomoyuki Kajiwara
•
1.4K vues
日本語の語彙平易化システムおよび評価セットの構築
Tomoyuki Kajiwara
•
6.4K vues
論文紹介:WWWからの大規模動詞含意知識の獲得
swenbe
•
552 vues
日本語の語彙平易化評価セットの構築
Tomoyuki Kajiwara
•
468 vues
1 3-2
englishteacher_net
•
307 vues
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
•
5.7K vues
論文紹介 A Bayesian framework for word segmentation: Exploring the effects of con...
Akira Taniguchi
•
251 vues
20190324 第6章 テキストデータのための素性
Kazuki Motohashi
•
139 vues
Efficient estimation of word representations in vector space
tetsuo ishigaki
•
2.2K vues
Semi supervised sequence tagging with bidirectional language models
浩気 西山
•
393 vues
人間とのインタラクションにより言葉と行動を学習するロボット, 岩橋直人
KIT Cognitive Interaction Design
•
1.6K vues
iYES オンラインプログラム
iYES Corporation
•
218 vues
Plus de Tomoyuki Kajiwara
(17)
20190315 nlp
Tomoyuki Kajiwara
•
1.3K vues
20180208公聴会
Tomoyuki Kajiwara
•
9.7K vues
20150702文章読解支援のための日本語の語彙平易化システム
Tomoyuki Kajiwara
•
1.7K vues
文献紹介:SemEval-2012 Task 1: English Lexical Simplification
Tomoyuki Kajiwara
•
632 vues
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
Tomoyuki Kajiwara
•
772 vues
文献紹介:格フレームの対応付けに基づく用言の言い換え
Tomoyuki Kajiwara
•
604 vues
文献紹介:言い換え技術に関する研究動向
Tomoyuki Kajiwara
•
2.4K vues
日本語の語彙的換言知識の質的評価
Tomoyuki Kajiwara
•
1K vues
文脈の多様性に基づく名詞換言の評価
Tomoyuki Kajiwara
•
496 vues
文脈の多様性に基づく名詞換言の提案
Tomoyuki Kajiwara
•
487 vues
機械学習を用いたニ格深層格の自動付与の検討
Tomoyuki Kajiwara
•
597 vues
Selecting Proper Lexical Paraphrase for Children
Tomoyuki Kajiwara
•
270 vues
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
Tomoyuki Kajiwara
•
282 vues
小学生の読解支援に向けた複数の換言知識を併用した語彙平易化と評価
Tomoyuki Kajiwara
•
304 vues
小学生の読解支援に向けた語釈文による換言
Tomoyuki Kajiwara
•
458 vues
対話型自動作曲システムに関する研究 -Aメロ, Bメロ, サビで異なる印象を感じさせる楽曲生成-
Tomoyuki Kajiwara
•
826 vues
IGAを用いた個人の感性を反映した楽曲作成に関する研究 -Aメロ, Bメロ, サビに異なる感性的印象を感じさせる楽曲生成手法-
Tomoyuki Kajiwara
•
487 vues
Publicité
Dernier
(20)
留信网认证可查【麻省大学波士顿分校文凭证书毕业证购买】
hh123hh1
•
2 vues
《林肯大学毕业证|学位证书校内仿真版本》
w124dsa
•
2 vues
留学生案例《利兹大学学位毕业证书和学士文凭》
36dsahj
•
2 vues
在哪里可以做《西雅图大学文凭证书|毕业证》
20das12
•
2 vues
留学生案例《圣地亚哥大学学位毕业证书和学士文凭》
uijn12a
•
2 vues
国外学历【萨德伯里大学研究生文凭毕业证留学生首选】
ewq15a
•
2 vues
在哪里可以做《田纳西大学文凭证书|毕业证》
20das12
•
2 vues
留学生案例《西伊利诺伊大学学位毕业证书和学士文凭》
uijn12a
•
2 vues
☀️【威得恩大学毕业证成绩单留学生首选】
25mjhd12
•
2 vues
☀️【杜克大学毕业证成绩单留学生首选】
25kihn123
•
2 vues
makoto shing (stability ai) - image model fine-tuning - wandb_event_230525.pdf
Akira Shibata
•
305 vues
☀️【圣地亚哥大学毕业证成绩单留学生首选】
25kihn123
•
3 vues
在哪里可以做《堪萨斯大学文凭证书|毕业证》
lobd15
•
2 vues
在哪里可以做《利兹贝克特大学文凭证书|毕业证》
25ds12d
•
3 vues
☀️《USD毕业证仿真》
hjhgg
•
2 vues
留学生案例《田纳西大学学位毕业证书和学士文凭》
uijn12a
•
2 vues
Sound.pptx
Ryuji Dohaku
•
45 vues
《科罗拉多大学斯普林司分校毕业证|学位证书校内仿真版本》
w124dsa
•
2 vues
☀️《Middlesex U毕业证仿真》
fggg13
•
2 vues
在哪里可以做《帝国理工学院文凭证书|毕业证》
1232hdjk
•
2 vues
文章読解支援のための語彙平易化
文章読解支援のための 語彙平易化 自然言語処理研究室 11313388 梶原智之
研究の背景 2 大量・多様なテキストデータ アクセスは容易 理解は容易? 子供 大人
外国人 高齢者
研究の背景 3 大量・多様なテキストデータ アクセスは容易 理解は容易? 子供 大人
外国人 高齢者 効率的な情報収集・知識獲得のため 言語能力の差を埋める技術が必要 文章読解支援のための語彙平易化
語彙平易化 4 入力文 未来は若者が担う 語彙的換言の生成 担う:伝承する,引継ぐ,支える,受け継ぐ 難解語の検出 担う 出力文 未来は若者が支える 語義曖昧性の解消 引継ぐ,支える,受け継ぐ 難易度に基づく並び替え 1:支える 2:受け継ぐ 3:引継ぐ 文中の難解な語をより平易な同義語に置換 語彙平易化の基本的な流れ
目次 ① 語彙平易化のための語彙的換言の生成 • 知識に基づく語彙的換言手法の提案 • 用例に基づく語彙的換言手法の提案 ② 語彙平易化のための研究資源の構築 •
語彙平易化のベースラインシステムの公開 • 語彙平易化の評価セットの公開 5 入力文 未来は若者が担う 語彙的換言の生成 担う:伝承する,引継ぐ,支える,受け継ぐ 難解語の検出 担う 出力文 未来は若者が支える 語義曖昧性の解消 引継ぐ,支える,受け継ぐ 難易度に基づく並び替え 1:支える 2:受け継ぐ 3:引継ぐ
目次 ① 語彙平易化のための語彙的換言の生成 • 知識に基づく語彙的換言手法の提案 • 用例に基づく語彙的換言手法の提案 ② 語彙平易化のための研究資源の構築 •
語彙平易化のベースラインシステムの公開 • 語彙平易化の評価セットの公開 6 入力文 未来は若者が担う 語彙的換言の生成 担う:伝承する,引継ぐ,支える,受け継ぐ 難解語の検出 担う 出力文 未来は若者が支える 語義曖昧性の解消 引継ぐ,支える,受け継ぐ 難易度に基づく並び替え 1:支える 2:受け継ぐ 3:引継ぐ
① 語彙的換言の生成:研究目的 • 語彙平易化の候補を列挙するために 高精度に網羅性高く語彙的換言を収集する必要がある •
知識に基づく語彙的換言手法 • 特徴:辞書から規則的に語彙的換言を抽出する • 長所:高精度に抽出できる • 短所:網羅的に収集することはできない 7 研究目的 ・網羅性を向上させる ・語彙平易化への応用のため、 平易な語彙的換言を抽出する
知識に基づく語彙的換言:関連研究 • 日本語WordNet(シソーラス)の概念ID:平原ら(2010) • 語釈文の類似度計算:藤田ら(2000),
美野ら(2010) • 元の単語よりも平易な換言が得られる保証はない • 語釈文の主辞:鍜治ら(2003), 美野ら(2010) • 国語辞典の語釈文は見出し語を平易に説明している ため、主辞の抽出により平易な換言が得られる • 網羅性の課題 e.g. 美野ら(2010) 精度:69%, 網羅性:49% • 単一の国語辞典から語釈文の主辞を抽出 • 品詞を限定(鍜治ら:動詞, 美野ら:名詞) • ヒューリスティクス:語釈文の文末が主辞 8
ヒューリスティクスの限界 主要部終端型言語 先行研究の ヒューリスティクス 知識に基づく語彙的換言:提案手法 9 語釈文全体から広く 換言候補を収集する
知識に基づく語彙的換言:網羅性の評価 10 49 38 45 67 76 84 0 20 40 60 80 100 先行研究 ベースライン1 ベースライン2
ベースライン3 提案手法1 提案手法2 網羅性[%] 美野ら (2010) シソーラス 一般向け 国語辞典 小学国語辞典 換言知識 の併用 語釈文全体 から獲得
知識に基づく語彙的換言:精度の評価 11 69 67 42 48 62 58
58 70 0 20 40 60 80 100 先行研究 ベースライン 1 ベースライン 2 ベースライン 3 ベースライン 4 ベースライン 5 ベースライン 6 提案手法 精度[%] 美野ら (2010) WordNet 類似度 出現頻度 共起頻度 自己相互 情報量 単語 3-gram 頻度 文脈 ベクトル 類似度 6指標の 組合せ 投票
知識に基づく語彙的換言を用いた語彙平易化 100語 被験者:小学高学年5人 換言前の難解語 換言後の平易語 被験者の1人も理解できない語
25語 1語 被験者の過半数が理解できる語 55語 97語 被 験 者 の 全 員 が 理 解 で き る 語 33語 83語 100文 被験者:小学高学年5人 換言前の難解文 換言後の平易文 被験者の1人も理解できない文 6文 0文 被験者の過半数が理解できる文 71文 88文 被 験 者 の 全 員 が 理 解 で き る 文 24文 38文 被験者の過半数が***の方が 理 解 し や す い と 回 答 し た 文 35文 65文 被 験 者 の 全 員 が * * * の 方 が 理 解 し や す い と 回 答 し た 文 4文 22文 12
② 研究資源の構築:研究目的 13 • 読解支援を必要とする読者のためにも、研究を加速させるためにも、 語彙平易化システム・語彙平易化評価セットの公開が必要である •
語彙平易化のベースラインシステムの公開 • 典型的な4つの機構を備えた標準的なシステムを構築する • システムをWebで公開することにより、読者に技術を届ける • 標準的なベースラインとして提供し、研究の議論を深化させる • 語彙平易化の評価セットの公開 • 自然言語処理アルゴリズムの一般的な評価尺度である 精度および再現率の自動評価の枠組みを提供する • 共通の評価セットを提供し、性能の直接の比較を可能にする • 従来の人手評価の課題を解決し、研究を加速させる • 人手評価の課題:コスト、再現性
語彙平易化のベースラインシステムの公開 公開されているツールや言語 資源を組み合わせ、標準的な アルゴリズムでシステムを構築 入力文 未来は若者が担う 語彙的換言の生成 担う:伝承する,引継ぐ,支える,受け継ぐ 難解語の検出 担う 出力文 未来は若者が支える 語義曖昧性の解消 引継ぐ,支える,受け継ぐ 難易度に基づく並び替え 1:支える 2:受け継ぐ 3:引継ぐ 形態素解析:MeCab 平易語:学習基本語彙 語彙的換言知識: •
基本的意味関係の事例ベース • 内容語換言辞書(SNOW D2) • 動詞含意関係DB • 日本語WordNet同義語DB 難易度:単語親密度DB 述語項構造解析:SynCha 格フレーム辞書:京都大学格フレーム 14
語彙平易化の評価セットの公開 入力文 未来は若者が担う 語彙的換言の生成 担う:伝承する,引継ぐ,支える,受け継ぐ 難解語の検出 担う 出力文 未来は若者が支える 語義曖昧性の解消 引継ぐ,支える,受け継ぐ 難易度に基づく並び替え 1:支える 2:受け継ぐ 3:引継ぐ 1.
語彙的換言データセットの構築 1. 対象語の選定 2. クラウドソーシングを用いた語彙的換言の列挙 3. 複数の作業者による作業結果の統合 (クラウドソーシングを用いた語彙的換言の評価) 2. 語彙平易化データセットへの変換 1. クラウドソーシングを用いた平易化候補の難易度による並び替え 2. 複数の作業者による作業結果の統合 15
語彙平易化の評価セットの公開 • データセットの規模(クラウドソーシング:のべ500人が作業) • 233語
10文脈 • 名詞:63語、動詞:72語、形容詞:50語、副詞:48語 • 語彙的換言と語彙平易化の評価のためのデータセット • 二つの位置がピッタリ合ったところを【検出する】か、 差を【検出する】かという部分だけが異なる。 • 【検出する】発見する 1;検知する 4;見つける 1; • 【平易】(見つける) (発見する・検出する) (検知する)【難解】 • 構築した語彙平易化システムの自動評価 Precision Recall F-measure 名詞 動詞 形容詞 副詞 89% 8% 15% 62文 65文 3文 0文 16
まとめ http://www.jnlp.org/SNOW 語彙平易化のための語彙的換言手法を提案 精度:70% 網羅性:84% 1. 知識に基づく手法:国語辞典を利用したアプローチ(12:研究会奨励賞) 小学生の読解支援への有効性を確認 2. 知識に基づく手法:手法1の網羅性を改善(13:査読付国際会議,
15:査読付学術論文) 3. 用例に基づく手法:文脈の種類数に着目したアプローチ(14:査読付国際会議) 語彙平易化のための研究資源を公開 精度:89% 再現率:8% 1. シ ス テ ム:日本語で公開された初の語彙平易化システム(2/18 日経新聞) 典型的な4つの機構を備えた標準的なベースライン 2. 評価セット:日本語で公開された初の語彙平易化評価セット 精度と再現率の自動評価の枠組みを提供 従来の人手評価のコストと再現性の課題を克服 17
研究業績 1/3 18 査読付き 学術論文 1 査読付き 国際会議 2 査読無し 国内学会 9 受賞 1 新聞掲載
1
研究業績 2/3 • 知識に基づく換言手法 •
梶原智之, 山本和英. 小学生の読解支援に向けた語釈文による換言. NLP若手の会第7回シンポジウム, 発表1. 2012年9月.【奨励賞受賞】 • 梶原智之, 山本和英. 小学生の読解支援に向けた複数の換言知識を 併用した語彙平易化と評価. 言語処理学会第19回年次大会, pp.272-275. 2013年3月. • 梶原智之, 山本和英. 小学生の読解支援に向けた語釈文から語彙的 換言を選択する手法. ALAGIN&NLP若手の会合同シンポジウム, 発表23. 2013年9月. • Tomoyuki Kajiwara, Hiroshi Matsumoto, Kazuhide Yamamoto. Selecting Proper Lexical Paraphrase for Children. Proc. of ROCLING-2013, pp.769-772. October 2013. • 梶原智之, 山本和英. 語釈文を用いた小学生のための語彙平易化. 情報処理学会論文誌. Vol.56, No.3. 2015年3月掲載予定. 19
研究業績 3/3 • 用例に基づく換言手法 •
梶原智之, 山本和英. 文脈の多様性に基づく名詞換言の提案. 言語処理学会第20回年次大会, pp.769-772. 2014年3月. • 梶原智之, 山本和英. 文脈の多様性に基づく名詞換言の評価. 人工知能学会第28回全国大会, 3I4-2. 2014年5月. • 梶原智之, 山本和英. 高頻度語は平易語なのか?. NLP若手の会第9回シンポジウム, 発表P02. 2014年9月. • Tomoyuki Kajiwara, Kazuhide Yamamoto. Noun Paraphrasing Based on a Variety of Contexts. Proc. of PACLIC-2014. December 2014. • 語彙平易化のための研究資源の構築 • 梶原智之, 山本和英. 日本語の語彙的換言知識の質的評価. 信学技報, Vol.114, No.366, pp.43-48. 2014年12月. • 梶原智之, 山本和英. 日本語の語彙平易化システムの構築. 情報処理学会第77回全国大会. 2015年3月発表予定. • 梶原智之, 山本和英. 日本語の語彙平易化評価セットの構築. 言語処理学会第21回年次大会. 2015年3月発表予定. 20
Publicité