SlideShare une entreprise Scribd logo
1  sur  39
Télécharger pour lire hors ligne
統計言語Rを用いた
電子カルテデータの二次利用
2015.06.13 第4回SappoRoR
自己紹介
内科医師(専門は、消化器、肝臓病)
平成22年、内科クリニックを開業
@R_beginner
趣味
R言語の新しいパッケージを試すこと
好きなパッケージは、dplyr ,ggplot2 ,leaflet , rmarkdown
マラソン、PC自作、ピザ自作
Agenda
1
2
3
4
当院の電子カルテ、ネットワーク環境について
電子カルテデータへの接続
Rによるデータ視覚化、二次利用の実例
今後の展望
電子カルテ
DELL U3011(30inch)
WQXGA 2560X1600
○○○社製電子カルテ
内部データベースは、
Microsoft社SQLserver
ネットワーク環境
画像サーバー(DICOM)
クライアントPC 5台
電子カルテサーバー
電子カルテの問題点
基本的に各個人のデータを時系列で閲覧することを
目的に作られている。
電子カルテ内のデータ全体を俯瞰したり
疾患ごとの患者の分布や、群別の比較等が行えない。
データの解析は行えない、データを抽出することも
できないものが多い。Rで何とかならないか?
Agenda
1
2
3
4
当院のネットワーク環境、電子カルテについて
電子カルテデータへの接続
Rによるデータ視覚化、二次利用の実例
今後の展望
データベースへの接続
Microsoft
SQLserver
ODBCdriver
RODBC package
R
データベースへの
アクセス権が必要なので
メーカーと交渉!
SQLデータベース
Structured Query Languageの略で、
構造化された問い合わせ言語という意味。
ID Name age gender
1055 琴似 太郎 70 Male
2795 屯田 花子 40 Female
4865 麻生 二郎 65 Male
ID byoumei date
1055 急性上気道炎 2010-01-15
2795 胃潰瘍 2012-03-30
4865 肝硬変 2014-05-10
Select * from pt_master
Select id, byoume, date
from byoumei_table
接続スクリプト
library(RODBC)
con <- odbcConnect(“データソース", “ID", “PASSWORD")
con %>% sqlQuery(., “use データベース名;")
sql <- c("select Id,Name,Birth,Age,sex from Person ;")
ds <- con %>% sqlQuery(.,sql)
con %>% odbcClose
# databeseを変更
# databaseとのconnectionを切断
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
テーブルの結合
患者マスター
検査処置薬剤マスター
病名マスター
病名テーブル血液検査テーブル
処置テーブル
カルテテーブル
サマリーテーブル バイタルテーブル
来院テーブル
予約テーブル
会計テーブル
Agenda
1
2
3
4
当院のネットワーク環境、電子カルテについて
電子カルテデータへの接続
Rによるデータ視覚化、二次利用の実例
今後の展望
個のデータ 全体のデータ
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
年齢データ
血液検査データ
全患者の年齢分布
pyramid packageでplot
全患者の血液検査データ
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
病名リスト
病名毎のpie chart
plotrix packageでpie chart作ってます。
悪性疾患の臓器別の比率
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
住所情報 緯度経度情報(Google API使用)
leaflet package
ネット接続環境では、操作性の良いleafletが便利。
本当はInteractiveな地図になります。
疾患毎にデータを検討
糖尿病
血糖値が高い状態が⾧く続き、全身の様々な臓器に
障害が起こる病気です。
三大合併症
○糖尿病性網膜症
○糖尿病性腎症
○糖尿病性神経症
腎不全 血液透析
糖尿病性腎症が原因の透析患者は11万5千人(2013年現在)
eGFR(推算糸球体濾過量)
一般的に腎機能の目安は糸球体濾過量(GFR)により評価されます。
日常臨床では、eGFRという計算式で求めます。
でもこんなの電卓で計算できないので、Rでやってもらいます。
eGFR(mL/分/1.73m^2)
=194 X Cr [mg/dL]^-1.094 X 年齢[歳]^-0.287 (女性は X 0.739)
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
年齢、性別
糖尿病患者リスト
血清Cr
糖尿病、非糖尿病症例におけるeGFRの変化
糖尿病治療の動機づけ
糖尿病は生活習慣病のため食事療法がとても大切
糖尿病は、重症でなければ症状が無い場合が多く、
放置される患者も多い
治療中断しがちな患者には、病気のリスク
について十分理解してもらう
血液透析導入予測関数
eGFRが、およそ10を下回ると透析に移行する。
過去のeGFR値の低下から、
血液透析導入予測日を計算する
血液透析導入の予測
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
年齢、性別
糖尿病患者リスト
血清Cr
薬剤データ(今回はビクトーザ)
糖尿病性腎症に対する薬剤の効果
治療介入しどの薬剤が効果的か検討することができる
ビクトーザ開始
薬剤の効果をplotする関数
① 薬剤を内服している患者リストを抽出
② 患者ID毎に、薬剤投与開始日からの
検査のデータを抽出
③ ggplotでグラフ作成
データベース内のテーブル構成
テーブル名 項目 行数
患者マスター ID,名前,性別,生年月日,住所等 約6,300
処置、検査、薬剤
マスター
薬剤名、薬価、製薬会社、
内視鏡検査、XP、US等
約43,000
病名マスター 約30,000
病名テーブル ID,病名,日付,等 約79,000
血液検査テーブル ID,検査日,検査コード,値,等 約400,000
処置テーブル 約800,000
カルテテーブル 約42,000
サマリーテーブル 約6,300
バイタルテーブル 約68,000
来院テーブル 約17,000
予約テーブル 約79,000
年齢、性別
糖尿病患者リスト
HbA1c
薬剤データ
代表的な経口糖尿病薬
(Metformin、glimepiride、sitagliptin、ipragliflozin)
が、
HbA1c(1ヶ月の平均血糖の目安)を
どれだけ低下させるか?
糖尿病薬のHbA1cに対する効果
Agenda
1
2
3
4
当院のネットワーク環境、電子カルテについて
電子カルテデータへの接続
Rによるデータ視覚化、二次利用の実例
今後の展望
今後の展望
ご清聴ありがとうございました。
機械学習による診断・治療支援システムの作成

Contenu connexe

En vedette

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

En vedette (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

電子カルテデータの二次利用

Notes de l'éditeur

  1. 本日はData visualization、データの視覚化という題目で 統計言語Rを用いた電子カルテデータの二次利用の方法について、 お話させていただきます。
  2. 本日の内容ですが、 当院のネットワーク環境、電子カルテについて 電子カルテのデータ保存について 統計言語Rによるデータ視覚化の実例 今後の展望についてです。 (表示) まず当院のネットワーク環境について簡単に説明します。
  3. 当院は、電子カルテサーバー1台、画像サーバーが1台、クライアントPC5台構成になっております。 画像サーバーはDICOMサーバーでFUJIのadvanciaと 東芝のXario200、X線システムと直結しております。 クライアントPCはデュアルディスプレイで電子カルテと画像を同時に表示しております。
  4. では次に、(表示)電子カルテのデータ保存について説明します。
  5. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  6. テーブルは(表示)各々IDで紐づけされており、一つのテーブルのデータ量が多くならないように工夫されております。 この考え方が、現在データベースの主流である、リレーショナルデータベースという概念です。
  7. では実際に(表示)統計言語Rによるデータの視覚化の実例をお話しします。 まず先にR言語についてですが、
  8. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  9. (表示)Summary関数を用いて、平均、中央値、最大、最小、25パーセンタイルを求めます。 (表示)ボックスプロットを用いるとさらに(表示)、一目で基本統計量の一部が確認できます。 ただ情報をかなり切り捨てているため、このままでは年代毎の特徴等は不明です。 (表示)Pyramid関数を用いて人口ピラミッドを作成すると、40台、60台にピークを持つ人口構成がハッキリします。
  10. 血液検査データも、容易に抽出することができます。 全ての血液検査項目のヒストグラムを作成したり、気になる項目は(表示)、QQプロットで正規性を確認したり、ボックスプロットで平均、外れ値を見たりが簡単に行えます。
  11. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  12. 病名テーブルからは、疾患毎の患者数、有病率が計算できます。治験や、市販後臨床試験の対象患者をチェックするのに便利です。
  13. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  14. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  15. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  16. データベースは、いくつかのテーブルで構成されています。 患者マスター、処置マスター、病名テーブル、病名マスター等です。血液検査、処置テーブルは、ID毎に多くのデータをもっていますので、 当院の患者数であっても、行数が50万行に達しています。
  17. では実際に(表示)統計言語Rによるデータの視覚化の実例をお話しします。 まず先にR言語についてですが、
  18. 今回は、電子カルテから抽出した情報をグラフ等で視覚化するのみで、ほとんどデータの加工は行っておりません。 今後はこれらのデータを用いて、アソシエーション分析、SVM、決定木等による診断支援システムの構築。 薬剤による治療介入の効果判定等を検討しております。