Accueil
Explorer
Soumettre la recherche
Mettre en ligne
S’identifier
S’inscrire
Publicité
文脈の多様性に基づく名詞換言の評価
Signaler
Tomoyuki Kajiwara
Suivre
24 Mar 2015
•
0 j'aime
0 j'aime
×
Soyez le premier à aimer ceci
afficher plus
•
496 vues
vues
×
Nombre de vues
0
Sur Slideshare
0
À partir des intégrations
0
Nombre d'intégrations
0
Check these out next
NLTK Book Chapter 2
torithetorick
文献紹介:言い換え技術に関する研究動向
Tomoyuki Kajiwara
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
Asahiko Matsuda
統語的曖昧性・普遍性判定問題の決定可能性
Ryoma Sin'ya
読解支援6 26
kentshioda
文献紹介:格フレームの対応付けに基づく用言の言い換え
Tomoyuki Kajiwara
Python nlp handson_20220225_v5
博三 太田
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
1
sur
18
Top clipped slide
文脈の多様性に基づく名詞換言の評価
24 Mar 2015
•
0 j'aime
0 j'aime
×
Soyez le premier à aimer ceci
afficher plus
•
496 vues
vues
×
Nombre de vues
0
Sur Slideshare
0
À partir des intégrations
0
Nombre d'intégrations
0
Télécharger maintenant
Télécharger pour lire hors ligne
Signaler
Sciences
梶原智之, 山本和英. 文脈の多様性に基づく名詞換言の評価. 人工知能学会第28回全国大会, 3I4-2. May 2014.
Tomoyuki Kajiwara
Suivre
Publicité
Publicité
Publicité
Recommandé
文脈の多様性に基づく名詞換言の提案
長岡技術科学大学 自然言語処理研究室
325 vues
•
17 diapositives
Nl220 Pitman-Yor Hidden Semi Markov Model
Kei Uchiumi
8.9K vues
•
34 diapositives
深層学習による自然言語処理1章
Tada Yuuki
382 vues
•
12 diapositives
Signl213
Kei Uchiumi
8.7K vues
•
34 diapositives
小林敏:ルビの配置方法 1 2_2
Japan Electronic Publishing Association
3.8K vues
•
152 diapositives
読解支援7 10
kentshioda
533 vues
•
12 diapositives
Contenu connexe
Présentations pour vous
(20)
NLTK Book Chapter 2
torithetorick
•
974 vues
文献紹介:言い換え技術に関する研究動向
Tomoyuki Kajiwara
•
2.4K vues
科学技術英語の考え方と学習ツール Mindset and Learning Tools for Scientific English Proficiency
Asahiko Matsuda
•
39 vues
統語的曖昧性・普遍性判定問題の決定可能性
Ryoma Sin'ya
•
2.6K vues
読解支援6 26
kentshioda
•
268 vues
文献紹介:格フレームの対応付けに基づく用言の言い換え
Tomoyuki Kajiwara
•
604 vues
Python nlp handson_20220225_v5
博三 太田
•
1K vues
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
•
687 vues
Logics 18th ota_20211201
博三 太田
•
239 vues
Jsai2021 winter ppt_ota_20211127
博三 太田
•
272 vues
読解支援6 5
kentshioda
•
250 vues
固有表現抽出について
Syo Kyojin
•
1.5K vues
読解支援@2015 06-05
sekizawayuuki
•
149 vues
Wikipedia のエントリーリダイレクト関係を対象にした同義関係抽出
長岡技術科学大学 自然言語処理研究室
•
440 vues
読解支援@2015 06-12
sekizawayuuki
•
272 vues
自由回答の簡易分析-テキストデータの可視化の一例-
博三 太田
•
1.3K vues
R015 田原俊司・朴媛叔・伊藤武彦 (1987). 韓国語単文理解における主題助詞と主格助詞の動作主性とその発達:日本語の助詞ハとガとの比較 教育心理学...
Takehiko Ito
•
352 vues
黒い目の大きな女の子:構文から意味へ
Hiroshi Nakagawa
•
14.5K vues
Acl読み会2014
tempra28
•
3.7K vues
常識表現となり得る用言の自動選定の検討
長岡技術科学大学 自然言語処理研究室
•
325 vues
Plus de Tomoyuki Kajiwara
(20)
20190315 nlp
Tomoyuki Kajiwara
•
1.3K vues
20180208公聴会
Tomoyuki Kajiwara
•
9.7K vues
単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築
Tomoyuki Kajiwara
•
2K vues
tmu_science_cafe02
Tomoyuki Kajiwara
•
5.7K vues
joint_seminar
Tomoyuki Kajiwara
•
697 vues
Evaluation Dataset and System for Japanese Lexical Simplification
Tomoyuki Kajiwara
•
908 vues
20150702文章読解支援のための日本語の語彙平易化システム
Tomoyuki Kajiwara
•
1.7K vues
文献紹介:SemEval-2012 Task 1: English Lexical Simplification
Tomoyuki Kajiwara
•
632 vues
文献紹介:Simple English Wikipedia: A New Text Simplification Task
Tomoyuki Kajiwara
•
781 vues
文献紹介:新聞記事中の難解語を平易な表現へ変換する手法の提案
Tomoyuki Kajiwara
•
772 vues
日本語の語彙平易化システムおよび評価セットの構築
Tomoyuki Kajiwara
•
6.4K vues
文章読解支援のための語彙平易化@第1回NLP東京Dの会
Tomoyuki Kajiwara
•
779 vues
文章読解支援のための語彙平易化
Tomoyuki Kajiwara
•
1.1K vues
日本語の語彙平易化システムの構築
Tomoyuki Kajiwara
•
1.4K vues
Noun Paraphrasing Based on a Variety of Contexts
Tomoyuki Kajiwara
•
960 vues
高頻度語は平易なのか?
Tomoyuki Kajiwara
•
2.5K vues
文脈の多様性に基づく名詞換言の提案
Tomoyuki Kajiwara
•
487 vues
機械学習を用いたニ格深層格の自動付与の検討
Tomoyuki Kajiwara
•
597 vues
Selecting Proper Lexical Paraphrase for Children
Tomoyuki Kajiwara
•
270 vues
小学生の読解支援に向けた語釈文から語彙的換言を選択する手法
Tomoyuki Kajiwara
•
282 vues
Publicité
Dernier
(20)
留学生案例《利兹大学学位毕业证书和学士文凭》
36dsahj
•
2 vues
★可查可存档〖制作东伦敦大学文凭证书毕业证〗
mmmm282537
•
3 vues
在哪里可以做《斯旺西大学文凭证书|毕业证》
1232hdjk
•
2 vues
《威斯康星大学绿湾分校毕业证|学位证书校内仿真版本》
d520dasw12
•
2 vues
本科/硕士《美国斯隆管理学院毕业证成绩单》
w4ca12
•
4 vues
本科/硕士《美国太平洋大学毕业证成绩单》
w4ca12
•
3 vues
在哪里可以做《西雅图大学文凭证书|毕业证》
20das12
•
2 vues
在哪里可以做《帝国理工学院文凭证书|毕业证》
1232hdjk
•
2 vues
留学生案例《卡内基梅隆大学学位毕业证书和学士文凭》
15sdasd
•
2 vues
留学生案例《田纳西大学学位毕业证书和学士文凭》
uijn12a
•
2 vues
在哪里可以做《怀俄明大学文凭证书|毕业证》
lobd15
•
2 vues
在哪里可以做《林肯大学文凭证书|毕业证》
1232hdjk
•
2 vues
留信网认证可查【奥克兰商学院文凭证书毕业证购买】
ihh14ds
•
2 vues
web3 x 科学
Hiro Hamada
•
21 vues
☀️《Sunderland毕业证仿真》
DAS54SA
•
2 vues
留学生案例《堪萨斯大学学位毕业证书和学士文凭》
15sdasd
•
2 vues
【ブログ記事用】コルテバ事例紹介:課題 vs 導入効果.pdf
IsabelWong26
•
35 vues
在哪里可以做《利兹贝克特大学文凭证书|毕业证》
25ds12d
•
3 vues
☀️【南达科他大学毕业证成绩单留学生首选】
2125nuh
•
2 vues
留学生案例《新学院学位毕业证书和学士文凭》
uijn12a
•
2 vues
文脈の多様性に基づく名詞換言の評価
文脈の多様性に基づく 名詞換言の評価 長岡技術科学大学 梶原智之 山本和英
背景と目的 国語辞典を用いた換言 [梶原 13] 【語彙平易化】見出し語
→ 語釈文中の語 課題1:語釈文の一部では見出し語と非等価 課題2:数語の語釈文では換言候補が少ない → 既存の換言知識に頼らず 大規模コーパスを用いて換言を生成 2
提案手法 コーパスを用いた名詞換言 分布仮説[Harris 54] 似た意味の語は似た文脈で用いられる 1. 入力文と同じ文脈で用いられる名詞を抽出 → 自然な文を出力するための制約 2.
抽出した各換言候補語と文脈の類似度を計算 → 意味を保持するための制約 3
提案手法による名詞換言の流れ 4
1. 換言候補の収集 「空港へのアクセスを調べる」 「空港への○○」 「○○を調べる」 コーパスを検索して○○を収集 前文脈と後文脈に共通する○○に 換言することで自然な文を出力できる 5
2. 換言先の選択(類似度計算) 換言対象の語と換言候補の語が多くの種類 の文脈を共有するほど換言可能性は高い 換言候補の語が多くの種類の 文脈を持つほど換言可能性は低い sim(nt, nc)
= com(nt, nc) * log(N/DF(nc)) nt:換言対象の名詞、 nc:換言候補の名詞 com(nt, nc):ntとncが共通して用いられる文脈の種類数 N:文脈の総数、 DF(nc):名詞ncが用いられる文脈の種類数 6 1 2 1 2
提案手法の特徴 • 入力文脈に応じた換言が可能 • 単語の出現頻度を使わない •
換言可能な語とは多くの種類の文脈を共有する • 高頻度の単語に影響を受けない • 頻度の偏りにも影響を受けない → 文脈の多様性に基づく名詞換言の提案 7
関連研究 • [Marton et
al. 09] • [Bhagat and Ravichandran 08] 1. コーパス中で換言対象語の 文脈の語から特徴ベクトルを生成する 2. 特徴ベクトル同士のコサイン類似度を 計算し類似度最大の換言候補語へ換言する 8
関連研究 • [Marton et
al. 09] • 未知語の換言により機械翻訳の精度を向上 • 文脈の語との共起頻度で特徴ベクトルを作成 • [Bhagat and Ravichandran 08] • 大規模コーパスから換言対を獲得 • 文脈の語とのPMIで特徴ベクトルを作成 9
関連研究 • [Marton et
al. 09]:共起頻度 • 重要な文脈:多く共起する文脈 → 単体での出現頻度が高い単語の影響が強い • [Bhagat and Ravichandran 08]:PMI • 重要な文脈:偏って共起する文脈 → 単体での出現頻度が低い単語の影響が強い 10
実験 • Web日本語Nグラム:1,365,705件を抽出 • 名詞
+ … + 名詞 + … + 動詞原形 • このうち頻出の200件について実験 • 文頭ではない名詞が換言対象の名詞 • 京都大学格フレーム:文脈の類似度計算 • 述語:34,059語 • 名詞:824,639語 • 【荷物を積む】と【経験を積む】を区別できる 11
換言可能な名詞数(類似度1位) 12 0 10 20 30 40 50 60 評価者A 評価者B 評価者C 提案手法 [Marton
09] [Bhagat 08] 文脈の出現頻度に依存しない提案手法が最も優れている
13 0 20 40 60 80 100 評価者A 評価者B 評価者C 提案手法 [Marton
09] [Bhagat 08] 換言可能な名詞数(類似度上位10位) 10位まで見ると[Bhagat 08]が提案手法に近づいている
類似度と換言可能な名詞数 14 0 10 20 30 40 1位 2位 3位
4位 5位 6位 7位 8位 9位 10位 評価者A 提案手法 [Marton 09] [Bhagat 08] 0 10 20 30 40 50 60 1位 2位 3位 4位 5位 6位 7位 8位 9位 10位 評価者C 提案手法 [Marton 09] [Bhagat 08] 0 10 20 30 40 1位 2位 3位 4位 5位 6位 7位 8位 9位 10位 評価者B 提案手法 [Marton 09] [Bhagat 08] 提案手法 1位と2位の差が大きい Bhagat 08 1位と2位の差が小さい → 提案手法の制約 「入力と同じ文脈で用い られる名詞に換言する」
文脈を考慮した換言事例 • ∼万円以下の【罰金】に処する • 比較手法:懲役、科料、過料、・・・ •
提案手法:罰金刑、過料、・・・ • 腰への【負担】を軽減する • 比較手法:費用、経費、実費、・・・ • 提案手法:負荷、ストレス、ダメージ、・・・ 15
換言できた例 入力文 出力文 オーナーの【承認】が必要になる オーナーの【許可】が必要になる 重要な【課題】として取り組んでいる
重要な【問題】として取り組んでいる 良心的な【料金】を提供する 良心的な【価格】を提供する 国内農業の【発展】を阻害する 国内農業の【成長】を阻害する 教育の【拡充】などがあげられる 教育の【強化】などがあげられる 16
適切な換言ができない例 入力文 換言候補 ① 浴衣にも【洋服】にも合う ドレス、着物、ジーンズ、 水着、普段着、カジュアル ②
以上の【評価】を受けている 活動、教育、事業、 サービス、調査、管理 17 ①類義語を換言候補に集めることはできるが、 上位下位関係の中で適切な階層の語を選択できない ②句単位の換言が必要 【評価を受ける】→【認められる】
まとめ • 提案手法 • 文脈の多様性に基づく名詞の換言 •
提案手法の特徴 • 入力文脈に応じた換言 • 頻度を使用しない文脈の種類数に基づく換言 • 今後の課題 • 上位下位関係の中での語の選択 • 句単位の換言 18
Publicité