More Related Content Similar to オントロジー工学に基づく知識の体系化と利用 (20) More from Kouji Kozaki (20) オントロジー工学に基づく知識の体系化と利用2. 自己紹介
略歴
1996.4~ 大阪大学工学部/工学研究科(B4~D3)
2002.4~ 化学工学会嘱託研究員
2002.12~ 大阪大学産業科学・助手(助教)
2008.8~ 大阪大学産業科学研究所・准教授
主な参加学会
人工知能学会
セマンティックウェブとオントロジー研究会幹事
主に参加している国際会議:
ISWC:International Semantic Web Conference
JIST: Joint International Semantic Technology conference
EKAW: Inter… on Knowledge Engineering and Knowledge Management
ICBO: International Conference on Biomedical Ontologies
FOIS: International Conf… on Formal Ontology in Information Systems
コミュニティ
Linked Open Dataとオントロジー勉強会
Linked Open Dataチャレンジ実行委員会 関西支部長
2014/05/30 2
指導教官:
溝口理一郎教授
6. 研究・オントロジー構築歴
学生時代(1997- 継続中)
オントロジー工学の基礎理論に基づくオントロジー構築環境(「法造」)の開発
オントロジーの構築
2002-2007 ナノテクノロジーオントロジーの構築
NEDO「材料技術の知識の構造化」
2006-継続中 臨床医学オントロジーの構築
共同研究:東京大学医学研究科
2007-2009 サスティナビリティ・オントロジーの構築
共同研究:大阪 大学サスティナビリティ・サイエンス研究機構(RISS)
2007-2010 文科省:統合データベース整備事業・統合医科学データベースの構築
共同研究:東京医科歯科大学・大阪大学大学院医学系研究科
2008-2012 蛋白実験プロトコールオントロジーの構築
共同研究:大阪大学蛋白質研究所(文科省:ターゲットタンパクプロジェクト)
2008-2010 バイオ燃料オントロジーの構築
環境省:Hc-082「アジア太平洋地域における地球温暖化の持続可能な発展のためのバイオ燃
料利用戦略に関する研究」(研究代表者:東京大学・武内和彦教授)
2009-2011 災害リスクオントロジーの構築
共同研究:防災科学研究所
2012-継続中 生物規範工学オントロジーの構築
科研新学術領域
2013-継続中 情報リテラシーリスクオントロジーの構築
共同研究:山梨大学
2014/05/30 6
9. 2014/05/30 9
オントロジーの定義
哲学用語:「存在論」
人工知能分野
「概念化の明示的記述」
(An explicit specification of conceptualization)
by T. Gruber
オントロジー工学
人間が対象世界をどのように見ているかという根
源的な問題意識を持って物事をその成り立ちから
解き明かし,それをコンピュータと人間が理解を共
有できるように書き記したもの
(『オントロジー工学』:溝口理一郎)
10. 知識記述とオントロジー
知識記述(モデル化)
知識処理には,対象世界のモデル化(知識記述)が必要.
知識の共有・有効活用には,一貫性をもったモデル化が重要.
オントロジーの役割
「対象世界をどのように捉えたか(概念化したか)を明示し,
一貫性を持って知識(インスタンスモデル)を記述するため
の共通概念や規約を提供するもの」
対象世界
<item rdf:about="http://www.kanzaki.com/bass/">
<title>コントラバスの話</title>
<link>http://www.kanzaki.com/bass/</link>
<description>
コントラバスに関する基礎知識、
エッセイなどを集めた 楽しくてためになるセクション
</description>
</item>
<channel rdf:about="http://www.kanzaki.com/info/rss.rdf">
…省略…
<items> <rdf:Seq>
<rdf:li rdf:resource="http://www.kanzaki.com/bass/"/>
…省略…
</rdf:Seq></items> </channel>
オントロジー
知識
(インスタンスモデル)
知識記述
(モデル化)
概念化
2014/05/30 10
12. オントロジーの構成
対象世界を説明するのに必要な「概念」
概念間の「関係」
概念定義の内容
ラベル(,コメント)
上位概念/下位概念
部分概念
属性
公理
2014/05/30 12
自転車
サドル
ハンドル
前輪
is-a関係
part-of関係
attribute-of関係
秋田犬 土佐犬
犬
ほ乳類
猫
動物
サイズ:26×2.3
色: 赤
変速:24段変速
・前輪とハンドルは
連動している.
・前輪≠後輪
その他の関係
オントロジーの一般的な構成
16. オントロジー構築の基本的な考え方
オントロジー構築の基本姿勢
「何が本質か?」を追求する
例)人間 vs 教師(ロール),もの vs プロセス(川や滝はどちら?)
この基本姿勢が,データスキーマやシソーラスなどとの違い
「対象世界をどのように捉えたか(概念化したか)を明らかに
することにより,諸概念の共通性と相違点を明確にする」
具体的な構築指針
概念間の意味的相違点(分類視点)の明確化
概念の「違い」を理解する(分かる=分ける)
概念間の違いを明確にすることが,is-a階層構築の基本指針
概念の共通性・本質属性
対象とする概念群に共通する性質や本質的な性質(本質属性)を捉
える
2014/05/30 16
17. 2014/05/30 17
例1)概念(分類)階層のみ 例2)概念の定義を追加
車両
-二輪車
-自動二輪
-自転車
-三輪車
-
…
車両
-二輪車
→車輪の数 =2
-自動二輪
→動力源 =エンジン
-自転車
→動力源 =人
-三輪車
→車輪の数 =3
-
…
各概念の意味の
違いは暗黙的
各概念の意味の違い
が明示化される
分類視点の明確化の例:車両
24. オントロジー工学の基礎理論
オントロジー基礎理論
ロール理論
コンテキスト(他者)に依存する概念の理論
identity理論
インスタンスの生成・消滅・同一性の理論
オントロジー構築方法論
視点に応じたIs-a階層の動的生成
p-is-a階層(部分性の着目したis-a階層)
4種類のpart-of
オントロジーの洗練支援
2014/05/30 24
医療オントロジー
構築過程で明ら
かになったニーズ
への対応
25. ロール概念とは
夫婦関係
夫婦 に おける 夫(妻)の役割 は 人間 が担っている
学校
学校 に おける 教師の役割 は 人間が担っている
自動車
自動車 における前輪(後輪)の役割 は 車輪 が担っている
鳥の唐揚げ
鳥の唐揚げ における具の役割 は 鶏肉 が担っている
ロール概念:
ある“もの”や“人”が特定の状況で「果たす役割」を概念化したもの
夫婦
関係
夫・妻ロール
教師ロール
前輪(後輪)ロール
具ロール
2014/05/30 25
コンテキスト ロール概念 プレイヤー
26. ロール概念の構成
26
ロール概念
コンテキスト depend on プレイヤー
playing
教員
ロール_1
木村さん
大阪高校
ロールホルダー
教員-1
大阪高校において、木村さんが教員の役割(教員ロール_1)を担ったとき
教員(教員_1)と呼ばれる
学校において、人間が教員ロールを担ったとき教員ロールホルダーと
呼ばれる
ロール概念
コンテキスト
depend on
playable
教員
ロール
人間
学校
ロールホルダー
教員
クラスの世界
インスタンス
の世界
プレイヤー
(クラス制約)
2014/05/30 26
コンテキスト プレイヤー ロール概念 ロールホルダー
36. オントロジーの利用
2014/05/30 36
オントロジー利用研究の分析
Semantic Webの国際会議(ISWC,ESWC,ASWC)(229件)
国内の論文(88件)
分析の観点
(方針)オントロジーの使われ方を中心に分析する.
オントロジーの種類:どのようなオントロジーを利用するか?
オントロジーの利用タイプ:どのような目的でオントロジーを利用する
か?
対象とするドメイン
分析結果資料の入手先(http://www.hozo.jp からもリンクあり)
http://www.ei.sanken.osaka-u.ac.jp/hozo/onto_apps/
最新の情報については下記の書籍を参照
『オントロジーの普及と応用』(人工知能学会:編集,
來村 徳信:編著),オーム社,2012
5章 オントロジー利用研究の分類と傾向分析(古崎晃司)
37. オントロジーの種類
2014/05/30 37
意味的構成要素による分類
0)統一された語彙集合/簡単なスキーマ
1)概念間のis-a関係に基づく階層
2)is-a以外の関係を含む
3)意味制約の公理的記述を含む
4)その他の強い公理を含む
哲学的な考察の深さによる分類
情報論的な利用効率を重視
哲学的な考察に基づき対象世界を適切に
捉えることを重視
その他の分類基準
オントロジーの規模
対象とする領域
オントロジーの構築手法
これら分類基準の組合せに
より,
「ライトウェイトオントロジー」
vs.
「ヘビーウェイトオントロジー」
と区別されることがある.
オントロジーの種類によって
処理できる内容が異なる
38. オントロジーの種類
意味的構成要素による分類
意味的構成要素による分類
0)統一された語彙集合/簡単なスキーマ
rdfs:Classやowl:Classによる概念定義の列挙
1)概念間のis-a関係に基づく階層
rdfs:subClassOf によるクラス階層の記述
2)is-a以外の関係を含む
プロパティの記述
制約(Restriction)の記述
3)意味制約の公理的記述を含む
transitiveProperty,inverseOfといった関係の性質に関
する制約
disjointWith,oneOfといった制約
4)その他の強い公理を含む
ルール記述言語(KIF,SWRLなど)による強い公理(推
論規則など)をとして記述
RDF(S)
OWL
OWL
+
SWRL
382014/05/30
RSS,
FOAF
Webディ
レクトリ
シソーラス
+α(概念構造)
より詳細な制約
を含むもの
厳密な推論規則を含むもの
39. オントロジー利用タイプの分類
9種の利用タイプで分類
(1)共通語彙
(2)検索
(3)インデックス
(4)データスキーマ
(5)知識共有の媒体
(6)分析
(7)抽出
(8)知識モデルの規約
(9)知識の体系化
分類の方針
1つのシステムを複数の利用タイプに分類してもよい
そのシステムの主目的を中心に分類する
2014/05/30 39
浅い利用
高度な利用
52. Linked Open Data(LOD)
とオントロジー
Semantic Web技術の概要
従来のWebからSemantic Webへ
オントロジーの位置づけ
Semantic WebからLODへ
国内におけるLODとOpen Dataの動向
LODに関わるコミュニティ
日本政府によるOpen Dataの取り組み
Open Dataに関するコンテスト
2014/05/30 52
53. (従来の)Webの基本的仕組み
Webを構成する基本的な技術
URL(Uniform Resource Locator)
Web(インターネット)上の文書の置き場所を表す
HTML(HyperText Markup Language)
Webページを記述するためのマークアップ言語.
ハイパーリンク(hyperlink)により,他のWebページとの関連(リンク)
を記述することができる.
(従来の)Webの本質
URLで示された文書をハイパーリンクを用いて関連づけるこ
とにより,リンクを辿って,世界中の(インターネットに接続さ
れた)コンピュータで公開された文章を,自由に閲覧(ブラウ
ジング)できる.
誰でも,自由に情報を発信できる.
2014/05/30 53
54. HTMLの例
2014/05/30 54
閲覧中のWebページのURL
<h3><a href=“http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-
bus_all”>デジタル家電価格に底入れの兆し 「数から質へ」競争も変化</a>
</h3>
デジタル家電の価格下落に底入れの兆しが出てきた。「値段が張っても機能性
を重視する消費者が増えてきた」(アナリスト)ことが要因だ。価格競争に苦しんで
きた電機メーカーにとっては吉報といえそうだ。夏商戦で各社はフルハイビジョンの
約4倍の解像度の「4K」に対応した次世代テレビなどを投入予定で、需要の掘り起
こしに躍起になっている。 (SankeiBiz) <br>
<a href="http://headlines.yahoo.co.jp/hl?a=20130528-00000501-fsi-
bus_all">[記事全文]</a><br>
<br>
◇価格低下から転換?<br>
・ <a href="http://headlines.yahoo.co.jp/hl?a=20130429-00000005-san-
bus_all">電機大手どうなる「通信簿」 脱デジタル家電で明暗</a> - 産経新聞
(4月29日) <br>
・ <a href="http://headlines.yahoo.co.jp/hl?a=20130416-00000004-rbb-
sci">デジタル家電が値上がり傾向、背景に“アベノミクス”と“円安”あり? カカクコ
ム調べ</a> - RBB TODAY(4月16日) <br>
ソースファイル(HTML)では,文書に「タ
グ」を付与することで様々な情報を付与
ハイパーリンクを表すタグ
文字サイズを
表すタグ
改行を表すタグ
55. 従来のWebから
セマンティック(Semantic Web)へ
従来のWebの基本思想
文書を効率的に公開するための仕様.
文書の内容については「人が読んで理解する」ことが前提.
→HTMLに用いられるタグは,文書を読みやすく見せるための「レイアウト」を
指定するためのもの(が中心).
Webに対するあらたなニーズ
膨大に公開されたWeb文書(=情報)を,コンピュータを用いて効果的に活
用したい.
Webページの「意味」を,コンピュータに理解させたい.
例)“藤沢”,“野田” →「人名」 or 「地名」 ?
(病院のページの)“土曜日”という記載 → 「休診日」 or 「開業日」?
※人が読めば,前後のコンテキストで理解できるが,コンピュータには
理解が難しい(自然言語処理などで理解しようという研究もある).
→Webページ上の「情報(データ)の意味」を表すメタデータをタグ付けするこ
とで,「データのWeb」を実現する.
=セマンティックウェブ(Semantic Web)の基本思想
2014/05/30 55
56. Semantic Webの概要
Semantic Webとは
従来の「人が読む(理解する)ためのWeb」から,
「コンピュータが理解(意味処理)可能なWeb」へ
技術的には,
Web上のドキュメントにコンピュータによる意味処理に用
いる「メタデータ」を付与する(タグを付ける)」
その際に用いるフォーマットが「RDF」
メタデータに用いる語彙を定義するのが「オントロジー」(
RDFSやOWLで書かれる)
RDFで書かれたメタデータを検索するためのクエリー言
語が「SPARQL」
...
2014/05/30 56
57. Layer Cake
Semantic Webに必要な要素技術を階層状
に表したもの
2014/05/30 57
http://www.w3.org/2001/09/06-ecdl/slide17-0.html http://www.dajobe.org/talks/200905-redland/
58. RDF(Resource Description Framework)
Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み
RDFのデータモデル
主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み
合わせで,リソースに関する情報を表現する.
計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.
リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場
所を示すための記述方式.URLはURIの一種)を用いて表される.
2014/05/30 58
知識工
学論
古崎
担当教員
主語 述語 目的語
所属 知識システム
研究分野
述語 目的語主語
來村
担当教員 所属授業コード
280598
59. RDF(Resource Description Framework)
Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み
RDFのデータモデル
主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み
合わせで,リソースに関する情報を表現する.
計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.
リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場
所を示すための記述方式.URLはURIの一種)を用いて表される.
目的語には「リテラル」(文字列)を用いることができる.
2014/05/30 59
https://koan.osaka-u.ac.jp/
koan/lecture#280598
http://www.ei.sanken.
osaka-u.ac.jp/~kozaki/
担当教員
主語 述語 目的語
所属
http://www.ei.sanken.
osaka-u.ac.jp/main
述語 目的語主語
http://www.ei.sanken.
osaka-u.ac.jp/~kita/
担当教員 所属授業コード
280598
リソース
リテラル
プロパティ
:リソース間の関係
60. RDF(Resource Description Framework)
Web上の情報(リソースと呼ぶ)を記述するための統一的枠組み
RDFのデータモデル
主語(subject),述語(predicate),目的語(object)の3つ組み(トリプル)の組み
合わせで,リソースに関する情報を表現する.
計算機表現上はXML形式をはじめ,いくつかの表現が用意されている.
リソースはURI(Uniform Resource Identifier:Web上の情報資源(リソース)の場
所を示すための記述方式.URLはURIの一種)を用いて表される.
2014/05/30 60
koan:lecture#280598 ei:kozaki/
担当教員
主語 述語 目的語
所属
ei:main
述語 目的語主語
ei:kita/
担当教員 所属授業コード
280598
ネームスペース(namespace)を用いると…
koan:=https://koan.osaka-u.ac.jp/koan/
ei:=http://www.ei.sanken.osaka-u.ac.jp/
62. RDFSとOWL
セマンティックウェブにおいてオントロジー記述に用いられる言語
RDFS(RDF Schema)
クラスおよびプロパティのis-a階層
プロパティの定義域(domain)/値域(range):主語/目的語となれるリソー
スの種類
OWL(Web Ontology Language)
あるクラスの持つプロパティの値域に関する制約
→述語論理における全称記号(∀),存在記号(∃)に相当する表現
あるクラスが持つプロパティの数に関する制約
プロパティの推移律(例:「子孫の子孫」は「子孫」)
..など,より詳細なオントロジーの記述が可能
2014/05/30 62
63. SPARQL
SPARQL
RDFデータに対するクエリ言語
「指定したグラフ構造」に一致するトリプルを検索する
例
select distinct * where {
?s ?p ?o .
} LIMIT 100
select distinct * where {
<http://ja.dbpedia.org/resource/東京都> ?p ?o .
} LIMIT 100
select distinct ?s where {
?s <http://www.w3.org/2000/01/rdf-schema#label> ?o
FILTER(regex(str(?o), “Osaka", "m")) .
}
2014/05/30 63
日本語DBPediaでのクエリ検索例 http://ja.dbpedia.org/
で指定したパターンに一致するトリプルを検索する.
←取得する数
↑同じパターンは除外する
↓返す要素(*は全て)
全トリプルの組み合わせ
東京都を主語(Subject)に含むトリプル
ラベルに“Osaka”を含むトリプル
64. Semantic Webの研究動向の変遷
研究動向(流行トピック)の変遷
語彙(オントロジー)に基づいたメタデータによる意味処理の実現
誰がメタデータを?→Web2.0的共同構築
データ(インスタンス)のLinkの重視:Linked Data
2014/05/30
リ
ッ
チ
な
意
味
記
述
スケーラビリティ(大量データ)
Semantic Web (の理想)
すぐに使えるタグを(RSS,FOAF)
SNS利用・Web2.0
DBPedia
× Linked Data
2004-2006
2007
2008-
64
65. TED Talk by Tim Berrners Lee (1) 2009/2
~Raw Data Now!~
2014/05/30
http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
データを抱え込むのでは無く,
誰もが使えるように(オープンに)
することを呼びかける
=Raw Data Now!
(生データをすぐに!)
65
66. TED Talk by Tim Berrners Lee (1) 2010/2
~LODの活用事例~
2014/05/30
http://www.ted.com/talks/tim_berners_lee_the_year_open_data_went_worldwide.html
オープンデータの活用事例を紹介
・白人/黒人の住む家と水道管の整備状況
の相関を見える化→裁判で勝利へ
・Where does my money go?
(税金はどこへ行った?)
(英国) http://wheredoesmymoneygo.org/
(横浜市) http://spending.jp/
66
67. Linked Dataが目指すこと
WWW(World Wide Web)
文書を公開し,相互に接続(ハイパーリンクでつなぐ)ための
革命的な仕組みを提供したことで,今日のWebの発展につ
ながった.
Linked Data
データを共有(公開)し,相互につなぐ仕組みを提供する.
Linked Dataの原理
データの構造化
構造化されたデータはより洗練された処理を可能にする
分散したデータをつなぐハイパーリンク
文書単位では無く,データ単位のリンクを可能にする.
データの島々から一つのグローバルデータ空間へ
分散されたデータ群を1つのグローバルなデータ空間へ統合する
参考:『Linked Data-Webをグローバルなデータ空間に
する仕組み(Tom Heath, Christian Bizer(武田英明監訳),
丸善,2013)』 1章.はじめに
2013/8/5 第2回LODとオントロジー勉強会 67
70. Linked Open Data(LOD)
とオントロジー
Semantic Web技術の概要
従来のWebからSemantic Webへ
オントロジーの位置づけ
Semantic WebからLODへ
国内におけるLODとOpen Dataの動向
LODに関わるコミュニティ
日本政府によるOpen Dataの取り組み
Open Dataに関するコンテスト
2014/05/30 70
71. 国内でのLODに関する活動
学術的な取り組み
国立情報学研究所(NII):博物館情報,文献DB,科研費DB,など
JSTバイオサイエンスデータベースセンター(NBDC):生命科学情報
理化学研究所:生命科学情報
オープンガバメント
電子行政オープンデータ戦略(2012/7/4)
経済産業省
オープンガバメントラボ,IT融合フォーラム 公共データワーキンググループ,
Open Data METI(経産省のオープンデータ公開サイト)
総務省
オープンデータ流通推進コンソーシアム
地方自治体:地域情報のオープンデータ化
鯖江市,横浜市LOD,会津若松市,流山市,千葉市,...
世界先端IT国家宣言(案):2013/05/24
その他:オープンデータを推進している団体
Linked Open Data Initiative
Open Knowledge Foundation Japan
Linked Open Data チャレンジ Japan 2011-
2014/05/30
日本ではLODに関する学術的取り組みが先行
東日本大震災以降,政府の
オープンデータへの取り組
みが活発化
71
90. アレルギーリウマチ内科:37
眼科 :561
血液内科 :415
呼吸器内科 :788
耳鼻科 :470
循環器内科 :610
小児科 :879
神経内科 :418
腎臓内分泌内科 :142
整形外科 :139
糖尿病代謝内科 :506
皮膚科 :1086
--------------------------
合計 :6051
9
0
疾患オントロジー
異常状態
因果関係
12診療科・6000疾
患から抽出された
数万の異常状態間の
因果連鎖の可視化・
推論処理が可能に!
異常状態オントロジーに基づき,各疾患の異常状態・因果関係を
一般化することで,診療科を横断した汎用的な因果連鎖を抽出
2014/05/30
12診療科の臨床医が疾患定義(異常状態間の因果連鎖)を記述
91. 異常状態オントロジー
構造
形状 材質 位相
変形
線の変形 面の変形 立体の変形
縮小 拡大
狭窄
血管狭窄 xx狭窄 xxx狭窄
冠状動脈
狭窄
xx動脈狭
窄
xxxx狭
窄 各診療科共通で,
再利用できる概念
各診療科毎に疾患定義(因果連鎖)において異常状態を記述
レベル1:
人体非依存
の異常状態
レベル2:
複数疾患に汎用的
に現れる異常状態
レベル3:
各疾患に現れる
異常状態
属性⇔特性変換
異常状態(知識)を定
量表現(rawデータ)
に変換
912014/05/30
103. バイオミメティックDBに
求められる特徴
多種多様なデータや知識の相互運用性
工学・化学~生物学という異分野連携
多数の異なる機関から提供されるデータの統合
テキスト(文献情報),画像,実験データ,…など
異なるデータ形式の統合
発想支援・連想型の検索機構
機能,構造,プロセス,生態系など多様な観点
からの検索
“想定外の(思いがけない)”つながりの発見
オープンなプラットフォームとしての公開
誰もが自由に利用できる仕組みを作ることで,
プラットフォームを自己成長させる.
2014/05/30 103
オ
ン
ト
ロ
ジ
ー
の
利
用
→Linked Open Data (LOD)の利用