SlideShare une entreprise Scribd logo
1  sur  36
Riakでつくる
Healthcare Database
川島直美
自己紹介
• 川島直美です
- (独)国立病院機構 本部 総合研究センター
診療情報分析部 システム開発専門職
- 前処理SE
- GitHub: imoan1983
診療情報分析部
since 2010
• 診療データの収集・分析
- 医療の可視化・比較
- 質の向上・均てん化への貢献
• 国立病院機構 143病院
- 入院患者:60万人/年
- 外来患者:のべ1,000万人/年
今日のお話
1. 医療情報の利用
2. RiakでつくるHealthcare Database
3. これからしたいこと
医療情報の利用
二次利用
医療情報の利用
一次利用
医療情報の利用
患者個人の記録
傷病の治癒
一次利用
二次利用
医療情報の利用
不特定多数の記録
新しい知見
臨床疫学研究
前向き
研究
後向き
研究
臨床疫学研究
研究計画
予算獲得
調査開始
前向き
研究
大金
時間
臨床疫学研究
過去データ
研究計画・予算獲得
分析開始
少額
すぐ
後向き
研究
支援DBを
作ろう!!
MIA since 2010
Medical Information Analysis databank
• テキストファイルを収集・RDB化
• SQLで自由分析
- DPC調査データ
• 包括支払い制度参加病院(1900弱)に作成義務
- レセプトデータ
• 全国9万超の保険医療機関が作成する診療報酬請求データ
RDB
レセプトで分析するお話
情報処理学会 デジタルプラクティス 2013年15号
https://ipsj.ixsq.nii.ac.jp/ej/?action=pages_view_main&active_
action=repository_view_main_item_detail&
item_id=94255&item_no=1&page_id=13&block_id=8
第36回 データマイニング+WEB@東京
http://www.slideshare.net/naomikawashima52/
tokyowebmining36th
載りました
喋りました
もっと知りたい
• レセプト=『○○をしました ××円です』
- どうしてしたのか?
- した結果どうなったのか?
• カルテには書いてある
- 自然言語処理はハードルが高い…
SS-MIX2データ
Standardized Structured Medical record Information eXchange
• 電子カルテのデータを統一形式で出力
- 部門システム間連携
- 地域医療機関情報連携
• 20種を超えるファイル定義
- 検査結果 etc
- 検査や薬を全国統一コードで記載
Riakで作る
SS-MIX Database
実験開始
• データ提供
- 中規模2病院
- 1年分
- 1.5GB, 3.5GB
- オフライン収集
Why Riak?
未確定仕様
• SS-MIX2仕様書 ver 0.96
- 今後ファイル定義は変わりうる
- 患者ごと・日ごとのファイル
- 1KB程度 ×数百万/1年
- ファイル命名規則は確定
• 患者ID_診療日_オーダーNo_タイムスタンプ_有効/無効フラグ
Key Value Store Key:ファイル名 Value:ファイル内容
総量予測困難
• 作成義務のないデータ
- 電子カルテ未導入病院
- 必要になったら必要な分だけ作成
• スモールスタートして急増にも備えたい
分散処理DB
AWS使う?
• 超個人情報です
- 全ファイルに患者氏名
- オンプレミス前提
KVS + 分散処理 + オンプレミス
Riak
インポート
• HL7メッセージの組み合わせ
- 繰り返しあり、省略あり
MSH|^~&|HIS123|SEND|GW|RCV|20111220103059.0000||OUL^R22^OUL_R22|20111220131032|P|2.5||||||~ISO
PID|0001||0001000052^^^^PI||患者^太郎^^^^^L^I~カンジャ^タロウ^^^^^L^P||19700405|M|||^^^^
PV1|0001|O|01^^^^^C
SPM|1|000000001219001||023^血清^JC10|||||||||||||201112191500
OBR|1|000000011000354|000000001219001|E001^血液学的検査^99O03|||20111219|20111219||||||||607^医
ORC|SC|000000011000354|000000001219001||CM||||20111220103059|||607^医師一郎^^^^^^^^L^^^^^I|01
OBX|1|NM|3A016000002327102^A/G比^JC10||1.7||1.2-2.0||||F|||201112191500
OBX|2|NM|3A010000002327101^総蛋白^JC10||7.2|g/dl^g/dl^99XYZ|6.70-8.3||||F|||201112191500
OBX|3|NM|3A015000002327101^アルブミン^JC10||4.9|g/dl^g/dl^99XYZ|3.7-5.5||||F|||201112191500
HL7
• 各フィールドに省略あり、深さあり
- JSON化してインポート
- kuenishi/meddatum
https://github.com/kuenishi/meddatum
“fieldA”:“AA”,
“fieldB”:{“subField1”:“B1”,“subField2”:“B2”},
“fieldD”:“DD”
AA | B1 ^ B2|| DD
検索
• Riak Searchで楽々・高速
- medicineCode : AAAAA*
• どのまとまりで出力する?
患者をどう数えるか?
Q. 数えたい『1人』とは何か?
A. 症例数
冬に肺炎、夏に骨折で入院は別症例
汎用的な区切りは?
• ~入院 :外来エピソード
• 入院~退院:入院エピソード
• 退院~ :外来エピソード エピソード単位で出力
入院 退院 入院
抽出後…
• JSONでは統計ソフトに渡せない
• kuenishi/presto-riak
https://github.com/kuenishi/presto-riak
- SQLで二次元表を出力
- グループ化
presto:default> select * from table;
hosp_id | patiend_id | date
---------+------------+---------
123456 | 7777777777 | 19830311
123456 | 0000000000 | 20000401
234567 | 3333333333 | 20140122
(3 rows)
これからしたいこと
ファイルの取り消し
• ファイル名の末尾1桁で有効/無効の区別
患者ID_診療日_オーダーNo_タイムスタンプ_1
患者ID_診療日_オーダーNo_タイムスタンプ_0
ファイル名(Key)で検索して削除
データの保全
• 研究利用
- 利用中に値が変わっては困る
• データ、indexディレクトリを保存
ファイル内のヒット
• 『HbA1c検査の値が10.0以上』で過剰ヒット
JSON化の工夫
“検査名”:“HbA1C”,“検査値”:8.2 …
“検査名”:“血糖”,“検査値”:110.5…
“HbA1C”:8.2 …
“血糖”:110.5…
検出限界以下・以上の表現
• 『検査値:[ * : 2 ]』で検索漏れ
JSON化の工夫
“検査値”:“<=1.0”…
“検査値下限”:0 …
“検査値上限”:1.0 …
様々なエピソード
• ○○薬投与期間中
• ✕✕発症前1年から直近
• □□の検査値が△△を上回っている間
Start~Endを患者ごとに指定?
データの是正
• 仕様無視
- 数値フィールドに文字列
- JISなのに『 ① 』『 ㌘ 』
- 『髙』野さんは? 標準化団体へ問い合わせ
• 独自コード
- 標準コード付番中
終わりに
• 大きな予算がつきそうです
- 数十病院、リアルタイム収集
• 成果物を発信していきます
- https://github.com/imoan1983
ありがとうございました

Contenu connexe

Similaire à RiakでつくるHealthcare Database

20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjects20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjectsNaotoKume
 
在宅療養支援診療所における組織マネジメント(村上典由)
在宅療養支援診療所における組織マネジメント(村上典由)在宅療養支援診療所における組織マネジメント(村上典由)
在宅療養支援診療所における組織マネジメント(村上典由)sakurazaitaku
 
医療情報の標準化手法について
医療情報の標準化手法について医療情報の標準化手法について
医療情報の標準化手法についてEhime Univ.
 
協立病院院内勉強会20170529
協立病院院内勉強会20170529協立病院院内勉強会20170529
協立病院院内勉強会20170529SR WS
 
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdfTsubasa Kambe
 
延岡薬剤師会 20141121
延岡薬剤師会 20141121延岡薬剤師会 20141121
延岡薬剤師会 20141121遠矢 純一郎
 
NDBを用いた臨床疫学研究の留意点
NDBを用いた臨床疫学研究の留意点NDBを用いた臨床疫学研究の留意点
NDBを用いた臨床疫学研究の留意点Yasuyuki Okumura
 
日病図書委員会 シンポジウム 2016s
日病図書委員会 シンポジウム 2016s日病図書委員会 シンポジウム 2016s
日病図書委員会 シンポジウム 2016s敏雄 福岡
 
20141002 医療福祉技術シンポジウム
20141002 医療福祉技術シンポジウム20141002 医療福祉技術シンポジウム
20141002 医療福祉技術シンポジウムIsamu Kajitani
 
Communication Between Medical Staff And Patients
Communication Between Medical Staff And PatientsCommunication Between Medical Staff And Patients
Communication Between Medical Staff And Patients陽 石見
 
121225 医療ビジネス概要
121225 医療ビジネス概要121225 医療ビジネス概要
121225 医療ビジネス概要Yoshinaga Kazutaka
 
医療ビジネス概要
医療ビジネス概要医療ビジネス概要
医療ビジネス概要Perry
 
もしもがんと診断されたら?治療選択に必要な情報収集
もしもがんと診断されたら?治療選択に必要な情報収集もしもがんと診断されたら?治療選択に必要な情報収集
もしもがんと診断されたら?治療選択に必要な情報収集Makiko Watanabe
 
Social listening1
Social listening1 Social listening1
Social listening1 tobyo_init
 
iPhone、iPadを活用した在宅医療システムの運用とその取り組み
iPhone、iPadを活用した在宅医療システムの運用とその取り組みiPhone、iPadを活用した在宅医療システムの運用とその取り組み
iPhone、iPadを活用した在宅医療システムの運用とその取り組み遠矢 純一郎
 
他社とも連携!企業の壁を越えるチームワークの現実
他社とも連携!企業の壁を越えるチームワークの現実他社とも連携!企業の壁を越えるチームワークの現実
他社とも連携!企業の壁を越えるチームワークの現実Cybozucommunity
 
バリデーション研究の計画・報告・活用
バリデーション研究の計画・報告・活用バリデーション研究の計画・報告・活用
バリデーション研究の計画・報告・活用Yasuyuki Okumura
 
Social listening1
Social listening1 Social listening1
Social listening1 tobyo_init
 
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」遠矢 純一郎
 

Similaire à RiakでつくるHealthcare Database (20)

20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjects20151104 health2.0 in Japan - clinical big data and subjects
20151104 health2.0 in Japan - clinical big data and subjects
 
医療情報とビッグデータセキュリティ
医療情報とビッグデータセキュリティ医療情報とビッグデータセキュリティ
医療情報とビッグデータセキュリティ
 
在宅療養支援診療所における組織マネジメント(村上典由)
在宅療養支援診療所における組織マネジメント(村上典由)在宅療養支援診療所における組織マネジメント(村上典由)
在宅療養支援診療所における組織マネジメント(村上典由)
 
医療情報の標準化手法について
医療情報の標準化手法について医療情報の標準化手法について
医療情報の標準化手法について
 
協立病院院内勉強会20170529
協立病院院内勉強会20170529協立病院院内勉強会20170529
協立病院院内勉強会20170529
 
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf
2024.02.17.永生会リハ部門研修「外部環境と内部環境分析とそのさき」.pdf
 
延岡薬剤師会 20141121
延岡薬剤師会 20141121延岡薬剤師会 20141121
延岡薬剤師会 20141121
 
NDBを用いた臨床疫学研究の留意点
NDBを用いた臨床疫学研究の留意点NDBを用いた臨床疫学研究の留意点
NDBを用いた臨床疫学研究の留意点
 
日病図書委員会 シンポジウム 2016s
日病図書委員会 シンポジウム 2016s日病図書委員会 シンポジウム 2016s
日病図書委員会 シンポジウム 2016s
 
20141002 医療福祉技術シンポジウム
20141002 医療福祉技術シンポジウム20141002 医療福祉技術シンポジウム
20141002 医療福祉技術シンポジウム
 
Communication Between Medical Staff And Patients
Communication Between Medical Staff And PatientsCommunication Between Medical Staff And Patients
Communication Between Medical Staff And Patients
 
121225 医療ビジネス概要
121225 医療ビジネス概要121225 医療ビジネス概要
121225 医療ビジネス概要
 
医療ビジネス概要
医療ビジネス概要医療ビジネス概要
医療ビジネス概要
 
もしもがんと診断されたら?治療選択に必要な情報収集
もしもがんと診断されたら?治療選択に必要な情報収集もしもがんと診断されたら?治療選択に必要な情報収集
もしもがんと診断されたら?治療選択に必要な情報収集
 
Social listening1
Social listening1 Social listening1
Social listening1
 
iPhone、iPadを活用した在宅医療システムの運用とその取り組み
iPhone、iPadを活用した在宅医療システムの運用とその取り組みiPhone、iPadを活用した在宅医療システムの運用とその取り組み
iPhone、iPadを活用した在宅医療システムの運用とその取り組み
 
他社とも連携!企業の壁を越えるチームワークの現実
他社とも連携!企業の壁を越えるチームワークの現実他社とも連携!企業の壁を越えるチームワークの現実
他社とも連携!企業の壁を越えるチームワークの現実
 
バリデーション研究の計画・報告・活用
バリデーション研究の計画・報告・活用バリデーション研究の計画・報告・活用
バリデーション研究の計画・報告・活用
 
Social listening1
Social listening1 Social listening1
Social listening1
 
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」
日本在宅医療学会 「多職種みんなで使えるを目指す地域医療連携支援システムの取り組み」
 

RiakでつくるHealthcare Database