SlideShare une entreprise Scribd logo
1  sur  13
固有表現抽出と
適用例のご紹介
2019/4/5 @LT会
自己紹介
IoT/AIソリューション事業部所属のAIの担当
学生時代:
高専から大学院まで情報系だったが、
機械学習という名前に興味が持てず
AIに関係する授業をあまり受講しない学生生活
入社後:
入社してからはずっとAI関連の仕事をすることに
(画像、動画、自然言語、波形データの解析、レコメンドなど)
こういうのは
いいかな
学生時代
固有表現抽出とは?
固有表現抽出は文から人名や組織名、地名、日付等を抽出する方法
【例】
入力文:CCTは2009年に設立された新宿の会社
組織名 日付 地名ラベル: *住所は渋谷区…
固有表現抽出による抽出結果
固有表現抽出をどう活用する?①
プライバシー保護(弊社事例)
【例】
入力文:山田太郎さんは持病があり、茨城から通院している
■■さんは持病があり、■■から通院している
個人情報等を隠した文へ
個人情報が隠された文にして、関係者以外でも閲覧可能な形へ
人名 地名
固有表現抽出をどう活用する?②
対話システム(弊社事例)
【例】
入力文:新宿駅近くのマクドナルドの住所は?
組織名地名
コンピュータが新宿駅近くの
マクドナルドを検索して、住所をユーザーに提示
固有表現抽出をどう活用する?③④
Sansan様の例:
ネットニュースから企業名を抽出しておき、
名刺交換した相手の企業のニュースを配信1
クックパッド様の例:
特売品の情報の文章から商品名を抽出2
[1]https://speakerdeck.com/sansanbuildersbox/introduction-of-ner-survey-paper-and-practical-
example-of-organization-extraction
[2]https://www.slideshare.net/abicky/ss-52441786
固有表現抽出の実現方法
1. ルールベース
どの単語がどれに該当するかをあらわす辞書や、
単語があらわれる文脈によってどう判定するべきかのルールを
人間が頑張って作り、これらをもとに固有表現抽出をおこなう
2. 機械学習
学習に使うデータをたくさん用意することで
ルールを自動で学ばせることができる!
新しい単語も対応可能!
最近はディープラーニングを利用
単語、ルールを網羅しようとするのは大変
新しい単語ができたら都度対応が必要
学習データの用意
機械学習を使う場合にはラベル付きの学習データが必要
基本的には人間が頑張って用意する
佐賀駅から会場となる市村記念体育館までの通りには、
佐賀にゆかりのある偉人の銅像が建てられ、
中には佐賀藩主の鍋島直正や、幕末維新期に活躍した大隈重信
などが姿を現します。
【学習データの例】
地名
地名
地名
地名
人名 人名
実験
固有表現抽出には機械学習(ディープラーニング)を利用
学習データとして2000個のニュース記事を使用
ラベル付の体力の限界のため今回は
2000個ですが、実際の問題では
もっと沢山あったほうが良いです
ラベルは組織名、人名、地名の3つのみ
抽出した結果
【例1】
水戸藩の二代藩主、徳川光圀などがまつられている水戸市の常磐神社で、
ことし1年間にたまったほこりを落とし、新年を迎えるための
すす払いが行われました。
地名 人名 地名 失敗
引用元:https://www3.nhk.or.jp/lnews/mito/
20181213/1070004942.html
抽出した結果
【例2】
ヤクルト・奥村展征内野手(23)が13日、東京・北青山の
球団事務所で契約更改交渉を行い、現状維持の950万円でサインした。
人名 地名組織名
引用元:https://www.sanspo.com/baseball/
news/20181213/swa18121313340005-n1.html
抽出した結果
【例3】
千葉県の千葉市在住の千葉さんは千葉の魅力をアピールした。
人名地名 地名 地名
同じ単語でも
文脈で異なるラベル
まとめ
固有表現抽出と活用例、
ニュース記事に適用した実験結果をご紹介しました
文章データをたくさんお持ちの企業様は
固有表現抽出を使って面白いことができるかもしれません!
固有表現抽出以外にもAIを使ってやりたいことなどあれば
懇親会でご相談ください
【宣伝】
今回の発表内容は弊社のブログでも掲載しています!
https://orizuru.io/challenge/005_ai_extract-word/

Contenu connexe

Tendances

Tendances (20)

バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践バンディットアルゴリズム入門と実践
バンディットアルゴリズム入門と実践
 
全力解説!Transformer
全力解説!Transformer全力解説!Transformer
全力解説!Transformer
 
研究分野をサーベイする
研究分野をサーベイする研究分野をサーベイする
研究分野をサーベイする
 
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けてSSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
SSII2022 [OS3-03] スケーラブルなロボット学習システムに向けて
 
動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット動作認識の最前線:手法,タスク,データセット
動作認識の最前線:手法,タスク,データセット
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
ナレッジグラフとオントロジー
ナレッジグラフとオントロジーナレッジグラフとオントロジー
ナレッジグラフとオントロジー
 
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
Word Tour: One-dimensional Word Embeddings via the Traveling Salesman Problem...
 
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
MLOps に基づく AI/ML 実運用最前線 ~画像、動画データにおける MLOps 事例のご紹介~(映像情報メディア学会2021年冬季大会企画セッショ...
 
研究効率化Tips Ver.2
研究効率化Tips Ver.2研究効率化Tips Ver.2
研究効率化Tips Ver.2
 
優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案優れた研究論文の書き方―7つの提案
優れた研究論文の書き方―7つの提案
 
先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15先端技術とメディア表現1 #FTMA15
先端技術とメディア表現1 #FTMA15
 
SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向SSII2019企画: 点群深層学習の研究動向
SSII2019企画: 点群深層学習の研究動向
 
【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者【メタサーベイ】Vision and Language のトップ研究室/研究者
【メタサーベイ】Vision and Language のトップ研究室/研究者
 
Devsumi 2018summer
Devsumi 2018summerDevsumi 2018summer
Devsumi 2018summer
 
Sift特徴量について
Sift特徴量についてSift特徴量について
Sift特徴量について
 
ドメイン適応の原理と応用
ドメイン適応の原理と応用ドメイン適応の原理と応用
ドメイン適応の原理と応用
 

Similaire à 固有表現抽出と適用例のご紹介

高専を卒業して一回りしました
高専を卒業して一回りしました高専を卒業して一回りしました
高専を卒業して一回りしました
Tomokatsu Yoshizawa
 

Similaire à 固有表現抽出と適用例のご紹介 (20)

Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)Domain Adaptation 発展と動向まとめ(サーベイ資料)
Domain Adaptation 発展と動向まとめ(サーベイ資料)
 
高専を卒業して一回りしました
高専を卒業して一回りしました高専を卒業して一回りしました
高専を卒業して一回りしました
 
IoTセミナー(山形県)酒田法人会チラシ:講演講師ネットビジネスアナリスト・横田秀珠
IoTセミナー(山形県)酒田法人会チラシ:講演講師ネットビジネスアナリスト・横田秀珠IoTセミナー(山形県)酒田法人会チラシ:講演講師ネットビジネスアナリスト・横田秀珠
IoTセミナー(山形県)酒田法人会チラシ:講演講師ネットビジネスアナリスト・横田秀珠
 
クラウドとコミュニティで起きた田舎の会社のゲームチェンジ
クラウドとコミュニティで起きた田舎の会社のゲームチェンジクラウドとコミュニティで起きた田舎の会社のゲームチェンジ
クラウドとコミュニティで起きた田舎の会社のゲームチェンジ
 
AIプロジェクトを始めるための周囲の巻き込み方
AIプロジェクトを始めるための周囲の巻き込み方AIプロジェクトを始めるための周囲の巻き込み方
AIプロジェクトを始めるための周囲の巻き込み方
 
【UDC2015】アーバンデータチャレンジ2015 - 中川祐治・兼久信次郎
【UDC2015】アーバンデータチャレンジ2015 - 中川祐治・兼久信次郎【UDC2015】アーバンデータチャレンジ2015 - 中川祐治・兼久信次郎
【UDC2015】アーバンデータチャレンジ2015 - 中川祐治・兼久信次郎
 
実用としての深層学習 ~深層学習の利用事例と展望~
実用としての深層学習 ~深層学習の利用事例と展望~実用としての深層学習 ~深層学習の利用事例と展望~
実用としての深層学習 ~深層学習の利用事例と展望~
 
このスマートスピーカーとIFTTTの組み合わせがすごい
このスマートスピーカーとIFTTTの組み合わせがすごいこのスマートスピーカーとIFTTTの組み合わせがすごい
このスマートスピーカーとIFTTTの組み合わせがすごい
 
20160310_10_株式会社アドダイス
20160310_10_株式会社アドダイス20160310_10_株式会社アドダイス
20160310_10_株式会社アドダイス
 
IoT講演(モノのインターネット)セミナー講師(千葉県)習志野商工会議所チラシ
IoT講演(モノのインターネット)セミナー講師(千葉県)習志野商工会議所チラシIoT講演(モノのインターネット)セミナー講師(千葉県)習志野商工会議所チラシ
IoT講演(モノのインターネット)セミナー講師(千葉県)習志野商工会議所チラシ
 
みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様みんなのPython勉強会#21 澪標アナリティクス 井原様
みんなのPython勉強会#21 澪標アナリティクス 井原様
 
20190215 lt
20190215 lt20190215 lt
20190215 lt
 
Data-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組みData-Centric AI開発における データ生成の取り組み
Data-Centric AI開発における データ生成の取り組み
 
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ 2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
2018.05.16 DOA 朝会トーク | 自己紹介&勉強会のすゝめ
 
本番稼働した IoT システムのツラミ
本番稼働した IoT システムのツラミ本番稼働した IoT システムのツラミ
本番稼働した IoT システムのツラミ
 
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク  榊 剛史
「今後現場で求められるAIエンジニア像とは?」株式会社ホットリンク 榊 剛史
 
データ流通実証実験について-20180207
データ流通実証実験について-20180207データ流通実証実験について-20180207
データ流通実証実験について-20180207
 
AIのリスクを一緒におさらいしましょう (推し技術:生成AI)Let's review the risks of AI together
AIのリスクを一緒におさらいしましょう(推し技術:生成AI)Let's review the risks of AI togetherAIのリスクを一緒におさらいしましょう(推し技術:生成AI)Let's review the risks of AI together
AIのリスクを一緒におさらいしましょう (推し技術:生成AI)Let's review the risks of AI together
 
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
2015-11-07 電子工作でクリスマス飾りを作ろう会(2015年度WiTワークショップ)
 
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
ブロックチェーンと仮想通貨 -- 新しいビジネスに挑戦
 

Plus de Core Concept Technologies

Plus de Core Concept Technologies (20)

センシングサイエンティストが経費精算を自動化したらこうなった
センシングサイエンティストが経費精算を自動化したらこうなったセンシングサイエンティストが経費精算を自動化したらこうなった
センシングサイエンティストが経費精算を自動化したらこうなった
 
C#で速度を極めるいろは
C#で速度を極めるいろはC#で速度を極めるいろは
C#で速度を極めるいろは
 
コンソールアプリケーションでDIを使う
コンソールアプリケーションでDIを使うコンソールアプリケーションでDIを使う
コンソールアプリケーションでDIを使う
 
開発環境をWindowsからMacに移行してみた話
開発環境をWindowsからMacに移行してみた話開発環境をWindowsからMacに移行してみた話
開発環境をWindowsからMacに移行してみた話
 
Linqの速度測ってみた
Linqの速度測ってみたLinqの速度測ってみた
Linqの速度測ってみた
 
データソースにLinqDataSourceを使った場合のGridViewの高速化
データソースにLinqDataSourceを使った場合のGridViewの高速化データソースにLinqDataSourceを使った場合のGridViewの高速化
データソースにLinqDataSourceを使った場合のGridViewの高速化
 
ロボットアームをPythonで動かす
ロボットアームをPythonで動かすロボットアームをPythonで動かす
ロボットアームをPythonで動かす
 
Pythonでディープラーニングをはじめるための一歩目
Pythonでディープラーニングをはじめるための一歩目Pythonでディープラーニングをはじめるための一歩目
Pythonでディープラーニングをはじめるための一歩目
 
Pythonで簡単動画解析
Pythonで簡単動画解析Pythonで簡単動画解析
Pythonで簡単動画解析
 
Pythonで簡単な統計・分析をしてみよう!
Pythonで簡単な統計・分析をしてみよう!Pythonで簡単な統計・分析をしてみよう!
Pythonで簡単な統計・分析をしてみよう!
 
Google Colab環境でPythonスクレイピング
Google Colab環境でPythonスクレイピングGoogle Colab環境でPythonスクレイピング
Google Colab環境でPythonスクレイピング
 
可視化の先にあるものとは
可視化の先にあるものとは可視化の先にあるものとは
可視化の先にあるものとは
 
ロボットと協働生活中に試行錯誤したこと
ロボットと協働生活中に試行錯誤したことロボットと協働生活中に試行錯誤したこと
ロボットと協働生活中に試行錯誤したこと
 
3Dモデル類似検索
3Dモデル類似検索3Dモデル類似検索
3Dモデル類似検索
 
GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知GPUいらずの高速動画異常検知
GPUいらずの高速動画異常検知
 
深層強化学習入門
深層強化学習入門深層強化学習入門
深層強化学習入門
 
なぜIoTプロジェクトは途中でとまってしまうのか。
なぜIoTプロジェクトは途中でとまってしまうのか。なぜIoTプロジェクトは途中でとまってしまうのか。
なぜIoTプロジェクトは途中でとまってしまうのか。
 
工場に!オフィスに!明日、お安く、安全に導入できるセンサー紹介します
工場に!オフィスに!明日、お安く、安全に導入できるセンサー紹介します工場に!オフィスに!明日、お安く、安全に導入できるセンサー紹介します
工場に!オフィスに!明日、お安く、安全に導入できるセンサー紹介します
 
AIによる簡単レコメンドシステム実装
AIによる簡単レコメンドシステム実装AIによる簡単レコメンドシステム実装
AIによる簡単レコメンドシステム実装
 
Orizuru IoTは何を変えたのか
Orizuru IoTは何を変えたのかOrizuru IoTは何を変えたのか
Orizuru IoTは何を変えたのか
 

固有表現抽出と適用例のご紹介