SlideShare une entreprise Scribd logo
1  sur  56
Télécharger pour lire hors ligne
ライフサイエンス統合データベースセンター
文献情報関連サービスを活用する
ライフサイエンス統合データベースセンター
山本泰智 (@yayamamo)
ライフサイエンス統合データベースセンター
PubMed検索最新情報
インターフェースが変化し続けている
http://pubmed.gov/
ライフサイエンス統合データベースセンター
ライフサイエンス統合データベースセンター
ライフサイエンス統合データベースセンター
効率的な検索を可能にする機能
• 柔軟なフィルタ機能を検索結果ページに配置

• 発表年による絞り込みを容易にする対話的なグラフを配置

• より詳細な条件設定を可能にするフォームを配置

• RSSを用いた最新検索結果の自動配信機能を提供
ライフサイエンス統合データベースセンター
例: MERSで検索
ライフサイエンス統合データベースセンター
ライフサイエンス統合データベースセンター
Sort by Relevance
ライフサイエンス統合データベースセンター
個々の文献情報に対する付加情報
ライフサイエンス統合データベースセンター
MeSHタームを利用していますか?
ライフサイエンス統合データベースセンター
Middle East Respiratory Syndrome Coronavirus/isolation &
purification*
ライフサイエンス統合データベースセンター
MeSH (Medical Subject Headings) ターム
• 概念階層関係を持つ統制語彙 (語彙数は約2万6千) で毎年更新される

• MEDLINE収録の全文献に対しNational Library of Medicine (NLM) の約100人の
専門スタッフがMeSHタームを用いた注釈付けを行う

• 全員が生命科学関係の学士以上の学位を有す

• PubMed検索時に利用することで効率良く目的の文献を見つけられる

• MEDLINEの代表的な特徴
ライフサイエンス統合データベースセンター
MeSHデータベースを利用したPubMed検索
参考: https://youtu.be/uyF8uQY9wys
ライフサイエンス統合データベースセンター
①
②
ライフサイエンス統合データベースセンター
①②
③
ライフサイエンス統合データベースセンター
ライフサイエンス統合データベースセンター
特定の検索目的に特化したPubMedの利用
ライフサイエンス統合データベースセンター
ライフサイエンス統合データベースセンター
予め設定されたPubMed検索テンプレート
Category Optimized For
Sensitive/
Specific
PubMed Equivalent
therapy
sensitive/broad 99%/70%
((clinical[Title/Abstract] AND trial[Title/Abstract]) OR clinical trials as topic[MeSH Terms] OR clinical
trial[Publication Type] OR random*[Title/Abstract] OR random allocation[MeSH Terms] OR therapeutic
use[MeSH Subheading])
specific/narrow 93%/97%
(randomized controlled trial[Publication Type] OR (randomized[Title/Abstract] AND controlled[Title/Abstract]
AND trial[Title/Abstract]))
diagnosis
sensitive/broad 98%/74%
(sensitiv*[Title/Abstract] OR sensitivity and specificity[MeSH Terms] OR diagnose[Title/Abstract] OR
diagnosed[Title/Abstract] OR diagnoses[Title/Abstract] OR diagnosing[Title/Abstract] OR diagnosis[Title/
Abstract] OR diagnostic[Title/Abstract] OR diagnosis[MeSH:noexp] OR diagnostic * [MeSH:noexp] OR
diagnosis,differential[MeSH:noexp] OR diagnosis[Subheading:noexp])specific/narrow  64%/98% (specificity[Title/Abstract])
etiology
sensitive/broad 93%/63%
(risk*[Title/Abstract] OR risk*[MeSH:noexp] OR risk *[MeSH:noexp] OR cohort studies[MeSH Terms] OR
group[Text Word] OR groups[Text Word] OR grouped [Text Word])
specific/narrow 51%/95%
((relative[Title/Abstract] AND risk*[Title/Abstract]) OR (relative risk[Text Word]) OR risks[Text Word] OR cohort
studies[MeSH:noexp] OR (cohort[Title/Abstract] AND study[Title/Abstract]) OR (cohort[Title/Abstract] AND
studies[Title/Abstract]))
prognosis
sensitive/broad 90%/80%
(incidence[MeSH:noexp] OR mortality[MeSH Terms] OR follow up studies[MeSH:noexp] OR prognos*[Text
Word] OR predict*[Text Word] OR course*[Text Word])
specific/narrow 52%/94% (prognos*[Title/Abstract] OR (first[Title/Abstract] AND episode[Title/Abstract]) OR cohort[Title/Abstract])
clinical
prediction
guides
sensitive/broad 96%/79%
(predict*[tiab] OR predictive value of tests[mh] OR score[tiab] OR scores[tiab] OR scoring system[tiab] OR
scoring systems[tiab] OR observ*[tiab] OR observer variation[mh])
specific/narrow 54%/99% (validation[tiab] OR validate[tiab])
http://www.ncbi.nlm.nih.gov/books/NBK3827/#pubmedhelp.Clinical_Queries_Filters
ライフサイエンス統合データベースセンター
PubMedから直接BLASTを利用する
ライフサイエンス統合データベースセンター
PubMed検索の注意
• 複合語の検索は二重引用符()で囲むことで可能

ただし、それがPubMedデータベースの索引に含まれていなければならな

• 例:

○ Linked Open Data

○ Open Data

× Linked Open

• 最新の文献およびPubMedのみに含まれる文献はMeSHタームでは検索できない

1. 人手により付けられており、通常約3週間かかるため

2. MeSHタームはMEDLINEに書誌情報が収められる文献が対象

PubMed検索対象はMEDLINE+α
ライフサイエンス統合データベースセンター
PMID: 25189709 [PubMed - indexed for MEDLINE]
ライフサイエンス統合データベースセンター
PMID: 25814886 [PubMed]
実習
iPS細胞に関する山中先生が著者
に含まれている論文を探す

(MeSH Databaseから検索)
ライフサイエンス統合データベースセンター
inMeXesAllie
Colil
文献で使われる英語
表現を検索
文献で使われる略語
を検索
引用情報の検索
随時更新
無料
ライフサイエンス統合データベースセンター
Allie (アリー)
文献で使われる略語とその展開形を検索
Allie
http://allie.dbcls.jp/
ライフサイエンス統合データベースセンター
danmachold
ライフサイエンス統合データベースセンター
生命科学分野の文献中には略語が多い
• 研究者により自由に略語が生み出されている

発表文献数は増加の一途 (PubMedには2000報以上追加/日)

• 多くの多義語・類義語が存在

• 読み手に誤解と混乱を生じさせる

PC: personal computer, primary care, prostate cancer, ...

Alcoholic chronic pancreatitis: ACP, alcoholic CP, ...
Year 2015
6万8千略語
2500万件
(出現頻度10以上)
ライフサイエンス統合データベースセンター
生命科学系の略語を簡単に調べる方法はないか?
新たに作られた略語も含めて
ライフサイエンス統合データベースセンター
計算機を用いて自動的に抽出
complementary DNA - cDNA
ライフサイエンス統合データベースセンター
reactive oxygen species

ROS
high-performance liquid
chromatography

FTIR
superoxide dismutase

SOD
約2500万件
約1560万ペア
MEDLINEに含まれる全文献情報を対象に抽出
(unique: 280万)
ライフサイエンス統合データベースセンター
Allie
• 日本語訳があれば提示

reactive oxygen species / 活性酸素種, 反応性酸素生成物

• よく使われる分野を提示、絞り込みも可能

Biochemistry / 生化学, 生物化学

• 出現文献情報を提示

ROS - (1980) Evidence for both oxygen and non-oxygen dependent
mechanisms of antibody sensitized target cell lysis by human monocytes.

• 同じ文献で使われている他の略語 (共起略語) も提示

ROS -SOD, NO, NAC, ...
ライフサイエンス統合データベースセンター
ペア出現頻度の経年変化
ライフサイエンス統合データベースセンター
発展的な利用
• ftpでデータベースのダウンロードが無料で可能

• 毎週更新

• APIにより利用者の開発したプログラムから検索可能

• SOAP / REST / SPARQL

• http://data.allie.dbcls.jp/
ライフサイエンス統合データベースセンター
AllieデータベースへのSPARQL検索結果例
頻度 略語 展開形 展開形の対訳
14629 HIV-1 human immunodeficiency virus type 1 ヒト免疫不全ウイルス1型
14186 EBV Epstein-Barr virus ((略)) EBウイルス, (DNA腫瘍ウイルス) エプスタイン・バーウイルス, Epstein-Barrウイルス
6371 HSV herpes simplex virus 単純ヘルペスウイルス, 単純疱疹ウイルス
6356 RT reverse transcriptase 逆転写酵素
5579 HSV-1 herpes simplex virus type 1 単純ヘルペスウイルス1型
4581 HA hemagglutinin ヘマグルチニン, 血球凝集素, 赤血球凝集素
4176 ORFs open reading frames
(DNA上でタンパク質をコードする範囲) 翻訳領域, オープンリーディングフレ
ーム, 読み取り枠, 読み枠
4108 HCMV human cytomegalovirus ヒトサイトメガロウイルス
3290 VZV varicella-zoster virus 水痘・帯状疱疹ウイルス, 水痘帯状疱疹ウイルス
2798 LTR long terminal repeat 末端反復配列
研究分野がVirologyである文献中に出現する略語
ライフサイエンス統合データベースセンター
http://allie.dbcls.jp/
検索略語のアリー
ライフサイエンス統合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20100831.html#p01
実習
• 略語MERSの展開形を検索

• 共起略語をみて、MERSよりも
MERS-CoVとして使われている
文献が多いことを確認する

• 目的の展開形について、詳細情
報として実際に利用されている
表現や文献リストを確認する
ライフサイエンス統合データベースセンター
inMeXes (インメクセズ)
文献中に書かれている英語表現を検索
inMeXes
http://docman.dbcls.jp/im/
ライフサイエンス統合データベースセンター
英作文をしていると出くわす悩み
• is associated に続く前置詞は何だったっけ?

• リン酸化に対応する英単語、phosの続きはどう綴ったかな?

• associated with を修飾する副詞、文献でよく使われているものは何だろう?

• thermodynamic parameters には the が付くことが多い?

付いている場合の実際の文章は?
is	 associated	 ...
ライフサイエンス統合データベースセンター
inMeXes にお任せください!
ライフサイエンス統合データベースセンター
inMeXes
• 高速

MEDLINEに含まれる全ての題目、要旨中の表現を高速に検索

• 軽快

4文字以上入力すると、キーを叩く毎に検索結果を表示

• 便利

結果は頻度順、気になる表現をクリックすると関連情報を表示
ライフサイエンス統合データベースセンター
やや高度な使い方: 正規表現フィルタ
• 例: was _ correlated withの_にはどのような表現があるかを知りたい
ライフサイエンス統合データベースセンター
発展的な利用
• API (JSONP) による検索が可能

• ご自身のブログやホームページに検索サービスを埋め込めます

• API Keyなどの認証は不要
ライフサイエンス統合データベースセンター
http://docman.dbcls.jp/im/
検索インメクセズ
ライフサイエンス統合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20091216.html#p01
実習
• contributeと入力して続く前置
詞を確認する

• informationと入力して下記の表
現の利用頻度をみる

• information of

• information on

• information about

• 以上の表現について、実際の文
章を確認する
ライフサイエンス統合データベースセンター
Colil (コリル)
文献の引用情報を検索
http://colil.dbcls.jp/
ライフサイエンス統合データベースセンター
ある文献に関する第三者からの視点
• ある文献について、当該文献の著者ではない研究者による評価はどうだろう?

• ある文献について、共によく引用されている文献はあるだろうか?

• 引用する文献について、文中で引用するさいの適切な記述例はないだろうか?
Colilがお答えします
ライフサイエンス統合データベースセンター
Colil (Comments on literature in literature)
• 特定の論文について、その引用記述を検索します

• 特定の論文について、他の論文から共に引用されている論文を表示します

(共引用情報)

• 対象はPMIDが付けられているPMC OA (Open Access)サブセットです

(約74万件、PubMed全体の3%強)

• 現バージョンは2015年2月時点取得時のものです

• 約618万件のPMID付き文献がPMC OAサブセットから引用されています

(PubMed全体の1/4強)
ライフサイエンス統合データベースセンター
PubMed ID or PubMed検索語を入力
①
②
PubMed ID
PubMed検索語
もしくは
ライフサイエンス統合データベースセンター
発展的な使い方
• ftpでデータベースのダウンロードが無料で可能

• APIにより利用者の開発したプログラムから検索可能

• REST / SPARQL

• http://colil.dbcls.jp/
ライフサイエンス統合データベースセンター
SPARQLクエリ例
ライフサイエンス統合データベースセンター
http://colil.dbcls.jp/
検索colil
ライフサイエンス統合データベースセンター
動画チュートリアル(統合TV)
http://togotv.dbcls.jp/20150207.html#p01
実習
• PDBの文献(PMID: 10592235)に
対し、他の文献中でどのように
触れられているのか概観する。

• 関連文献にはどのような研究課
題があるのかを確認する。

• EMBL-EBIのバイオインフォ解
析ツールに関する文献(PMID:
20439314)についてはどうか。

Contenu connexe

Tendances

【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
etic_sal
 
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
etic_sal
 
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
etic_sal
 
【No.4】ベビーシッターアルバイトに関する学生の意識調査
【No.4】ベビーシッターアルバイトに関する学生の意識調査【No.4】ベビーシッターアルバイトに関する学生の意識調査
【No.4】ベビーシッターアルバイトに関する学生の意識調査
etic_sal
 
情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで
Koji Sekiguchi
 

Tendances (9)

海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
海外論文なんてこわくない!15分でマスター Web of Science 講座 (2016)
 
15分でシットク! Web of Scienceから論文検索(2014)
15分でシットク! Web of Scienceから論文検索(2014)15分でシットク! Web of Scienceから論文検索(2014)
15分でシットク! Web of Scienceから論文検索(2014)
 
【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
【No.19】食を通じた地方出身女性のキャリアアップによる地域活性化の可能性
 
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その1)
 
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
【No.3】子育て世帯の悩みと保育施設サービスへのニーズ分析(その2)
 
【No.4】ベビーシッターアルバイトに関する学生の意識調査
【No.4】ベビーシッターアルバイトに関する学生の意識調査【No.4】ベビーシッターアルバイトに関する学生の意識調査
【No.4】ベビーシッターアルバイトに関する学生の意識調査
 
トーゴーの日2014ポスター
トーゴーの日2014ポスタートーゴーの日2014ポスター
トーゴーの日2014ポスター
 
AJACS advanced: NGSデータベース検索
AJACS advanced: NGSデータベース検索AJACS advanced: NGSデータベース検索
AJACS advanced: NGSデータベース検索
 
情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで情報検索の基礎からデータの徹底活用まで
情報検索の基礎からデータの徹底活用まで
 

Similaire à AJACS54 PubMed Allie inMeXes Colil

筑波事務所分館におけるOPAC強化の試み
筑波事務所分館におけるOPAC強化の試み筑波事務所分館におけるOPAC強化の試み
筑波事務所分館におけるOPAC強化の試み
Takanori Hayashi
 
Infosta実習 発表ver
Infosta実習 発表verInfosta実習 発表ver
Infosta実習 発表ver
skdmai
 
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
Kosuke Tanabe
 
SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103
tsuneyoshi
 

Similaire à AJACS54 PubMed Allie inMeXes Colil (15)

Ajacs33 文献の検索とその整理方法
Ajacs33 文献の検索とその整理方法Ajacs33 文献の検索とその整理方法
Ajacs33 文献の検索とその整理方法
 
第52回生命科学夏の学校
第52回生命科学夏の学校第52回生命科学夏の学校
第52回生命科学夏の学校
 
筑波事務所分館におけるOPAC強化の試み
筑波事務所分館におけるOPAC強化の試み筑波事務所分館におけるOPAC強化の試み
筑波事務所分館におけるOPAC強化の試み
 
Infosta実習 発表ver
Infosta実習 発表verInfosta実習 発表ver
Infosta実習 発表ver
 
RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発RDFによるデータ統合と相互運用性のための技術開発
RDFによるデータ統合と相互運用性のための技術開発
 
図書館でAPIをスルメのように 味わうには
図書館でAPIをスルメのように 味わうには図書館でAPIをスルメのように 味わうには
図書館でAPIをスルメのように 味わうには
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -
 
Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013Cross search and_semantic_web_mbsj2013
Cross search and_semantic_web_mbsj2013
 
Ep mix
Ep mixEp mix
Ep mix
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
 
Bh13.13 sagace 1
Bh13.13 sagace 1Bh13.13 sagace 1
Bh13.13 sagace 1
 
AIが入った栄養士Botのアーキテクチャー
AIが入った栄養士BotのアーキテクチャーAIが入った栄養士Botのアーキテクチャー
AIが入った栄養士Botのアーキテクチャー
 
SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103
 
20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGA20140612 ddbjing_minowa_NBDChumanDB&JGA
20140612 ddbjing_minowa_NBDChumanDB&JGA
 

Plus de yayamamo @ DBCLS Kashiwanoha

Plus de yayamamo @ DBCLS Kashiwanoha (19)

D2RQ Mapper
D2RQ MapperD2RQ Mapper
D2RQ Mapper
 
Qaシステム解説
Qaシステム解説Qaシステム解説
Qaシステム解説
 
JSAI 2015 1G5-1 生命科学分野の日本語言語資源の整備と日本語コンテンツへのリンク
JSAI 2015 1G5-1 生命科学分野の日本語言語資源の整備と日本語コンテンツへのリンクJSAI 2015 1G5-1 生命科学分野の日本語言語資源の整備と日本語コンテンツへのリンク
JSAI 2015 1G5-1 生命科学分野の日本語言語資源の整備と日本語コンテンツへのリンク
 
SWAT4LS 2014 SLIDE by Yamamoto
SWAT4LS 2014 SLIDE by YamamotoSWAT4LS 2014 SLIDE by Yamamoto
SWAT4LS 2014 SLIDE by Yamamoto
 
SIG-SWO-A1402-09:SPINを用いたトリプルストアの性能評価システム
SIG-SWO-A1402-09:SPINを用いたトリプルストアの性能評価システムSIG-SWO-A1402-09:SPINを用いたトリプルストアの性能評価システム
SIG-SWO-A1402-09:SPINを用いたトリプルストアの性能評価システム
 
Made in "Jimoto"
Made in "Jimoto"Made in "Jimoto"
Made in "Jimoto"
 
第7回 Linked Data 勉強会 @yayamamo
第7回 Linked Data 勉強会 @yayamamo第7回 Linked Data 勉強会 @yayamamo
第7回 Linked Data 勉強会 @yayamamo
 
R intro
R introR intro
R intro
 
Linked Open Data
Linked Open DataLinked Open Data
Linked Open Data
 
Swc2013 yamamoto
Swc2013 yamamotoSwc2013 yamamoto
Swc2013 yamamoto
 
Ontology howto
Ontology howtoOntology howto
Ontology howto
 
Building Data
Building DataBuilding Data
Building Data
 
第5回LinkedData勉強会@yayamamo
第5回LinkedData勉強会@yayamamo第5回LinkedData勉強会@yayamamo
第5回LinkedData勉強会@yayamamo
 
Towards Database Integration Through RDF & Linked Data
Towards Database Integration Through RDF & Linked DataTowards Database Integration Through RDF & Linked Data
Towards Database Integration Through RDF & Linked Data
 
LOD challenge day 2011 LT
LOD challenge day 2011 LTLOD challenge day 2011 LT
LOD challenge day 2011 LT
 
Ajacs27 TogoDoc, inMeXes, Allie
Ajacs27 TogoDoc, inMeXes, AllieAjacs27 TogoDoc, inMeXes, Allie
Ajacs27 TogoDoc, inMeXes, Allie
 
SADI practice
SADI practiceSADI practice
SADI practice
 
第2回LinkedData勉強会@yayamamo
第2回LinkedData勉強会@yayamamo第2回LinkedData勉強会@yayamamo
第2回LinkedData勉強会@yayamamo
 
生物物理若手夏の学校 TogoDoc inMeXes Allie
生物物理若手夏の学校 TogoDoc inMeXes Allie生物物理若手夏の学校 TogoDoc inMeXes Allie
生物物理若手夏の学校 TogoDoc inMeXes Allie
 

AJACS54 PubMed Allie inMeXes Colil