Contenu connexe
Similaire à [Track1-7] COVID19ワクチン開発に向けた、AIの挑戦 ~深層学習が導く、新領域との接点~ (20)
Plus de Deep Learning Lab(ディープラーニング・ラボ) (20)
[Track1-7] COVID19ワクチン開発に向けた、AIの挑戦 ~深層学習が導く、新領域との接点~
- 1. Copyright © 2020 by Future Corporation
フューチャー株式会社
Chief AI Officer 貞光九月
Deep Learning Digital Conference
COVID19ワクチン開発に向けた、AIの挑戦
~深層学習が導く、新領域との接点~
- 3. Copyright ©2020 by Future Corporation. Japan
3
• 貞光 九月(さだみつ くがつ)
• 経歴:
– 2009 筑波大学大学院 博士課程(工学)修了
– 2009-2017 NTT研究所
• 人工知能学会現場イノベーション賞 「しゃべってコンシェルにおける日本語質問応答技術の実用化」
– 2017.7- フューチャー株式会社
• Strategic AI Group 共同立ち上げ
• 外部活動:
自己紹介
情報処理学会、人工知能学会、言語処理学会各委員
AAAI, ACL, EMNLP Program Committee等(-2020)
AI
16年
1
8
年
Copyright © 2007-2020 All Rights Reserved by Gijutsu-Hyohron Co., Ltd.
- 7. Copyright ©2020 by Future Corporation. Japan
2020/4/30 プレスリリース
抗体誘導ペプチド推定AI?
WHY FUTURE?
- 8. Copyright ©2020 by Future Corporation. Japan
抗体誘導ペプチド推定AIのマイルストン
2018年8月 大阪大学との共同研究開始
2019年夏 初期実験での効果を確認
2019年12月 論文発表&受賞(IPSJ)
2020年4月 COVID19向け共同研究発表
【NEW!】
2020年7月 kaggleでの研究用データセット無償公開
bioRxivでの英語論文公開
7月29日公開
で検索
kaggle future corporation
- 9. Copyright ©2020 by Future Corporation. Japan
kaggle dataset
Dataset
学術領域で蓄積された学習データ
+COVID19の予測用データ
Task/Kernel
Task 1: SARS prediction (正解データ有)
Task2: COVID19 prediction (正解データ無)
で検索
kaggle future corporation 今日の話を聞いて
イイね!と思ったら是非up voteをお願いします!
(※要アカウント)
- 11. Copyright ©2020 by Future Corporation. Japan
抗ウイルス薬とワクチン
◼抗ウイルス薬:
病気を快復させるもの。
アビガン、レムデシビル
◼ワクチン:
病原体から作り、人体に接種して、
体内に免疫を生じさせるもの。
- 13. Copyright ©2020 by Future Corporation. Japan
これはCOVID19ワクチンに関する数字です。
何の数字でしょうか?
Phase1(第I相) :数十人 Phase2(第II相) :数百人 Phase3(第III相) :数千人 の被験者を要する。
特にP3で莫大な時間とコストが必要。
→審査・認可(米国FDA,日本厚労省)
- 14. Copyright ©2020 by Future Corporation. Japan
COVID19 ワクチン開発に取り組む組織
(WHO資料より)
https://www.who.int/publications/m/
item/draft-landscape-of-covid-19-
candidate-vaccines
ワクチン種別数:
7/24 (compared to 7/15)
Inactivated:5 (4)
Non-replicating
viral vector: 3 (2)
Protein subunit: 6 (2)
RNA: 6 (4)
DNA:4 (2)
VLP:1 (1)
- 15. Copyright ©2020 by Future Corporation. Japan
B細胞
部分配列=「ペプチド」
抗原=COVID19
(SARS-CoV-2)等
抗体誘導ペプチド推定AIの概要
B細胞が「抗体」を「誘導」するための「ペプチド」を「推定」する「AI」
⇒「抗体誘導ペプチド推定AI」
ペプチドを推定するAI
(①②を両方考慮しつつ)
②抗体(抗原を攻撃する物質)を、B細胞が産出
①B細胞が、ワクチンと反応
免疫反応を簡略化した図。
本来は樹状細胞、
MHCI/II、T細胞等も考慮する
- 16. Copyright ©2020 by Future Corporation. Japan
深層学習の接点
アナロジー
自然言語処理や音声処理と類似!
アナロジー
SNSネットワーク等のNW構造と
類似!
各データの情報量=少
データ量=多
各データの情報量=多
データ量=少
シーケンス構造としてのタンパク質 立体構造としてのタンパク質
深層学習的に見ると、他分野とのアナロジーが見つかる
- 17. Copyright ©2020 by Future Corporation. Japan
深層学習の接点
アナロジー
自然言語処理や音声処理と類似!
アナロジー
SNSネットワーク等のNW構造と
類似!
各データの情報量=少
データ量=多
各データの情報量=多
データ量=少
シーケンス構造としてのタンパク質 立体構造としてのタンパク質
深層学習的に見ると、他分野とのアナロジーが見つかる
- 18. Copyright ©2020 by Future Corporation. Japan
シーケンス構造としてのタスク設定
◼正例・負例が付与された過去の学習データが多く存在
(例:SARSの学習データがあるが、COVID19の学習データはない)
MTSKLAVALLAAFLISAALCEGAVLPRSAKELRCQCIKTYSKPFHPKFIKELRVIEQRVVEKRAETSKLAVALLAAFLISAALCEEKRKMNGNSQRV………………. PKFIK
抗体誘導活性をもたないペプチド
陰性(ラベル:負)
抗体誘導活性をもつペプチド
陽性(ラベル:正)
抗原タンパク質全体のアミノ酸配列
(数百~数千アミノ酸)
貞光はDLDCでワクチン開発について話している。
自然言語処理 (固有表現抽出)
人名 イベント名 負例
(一般名詞)
負例
(一般名詞)
貞光は人名か地名
→「話す」とあるから人名のはず!
DLDCは場所名かイベント名
→ネットで検索すると
同名イベントがあった!
- 20. Copyright ©2020 by Future Corporation. Japan
評価結果
あるタンパク質中の全ペプチドに対する予測結果
赤(答え=positive)が上、青(答え=negative)が下に来ると嬉しい
従来法 提案法
精度比較:値が高い方が嬉しい
自然言語処理の技術を用いることで、大幅に精度改善
手法 精度(Accuracy)
BepiPred-2.0 0.489
提案法 0.673
- 21. Copyright ©2020 by Future Corporation. Japan
深層学習の接点
アナロジー
自然言語処理や音声処理と類似!
アナロジー
SNSネットワーク等のNW構造と
類似!
各データの情報量=少
データ量=多
各データの情報量=多
データ量=少
シーケンス構造としてのタンパク質 立体構造としてのタンパク質
深層学習的に見ると、他分野とのアナロジーが見つかる
- 22. Copyright ©2020 by Future Corporation. Japan
ネットワーク構造=隣接行列
Table1 Table2 Table3 Table4
func1 Create
func2 Read
func3 Read Read
func4 Create
func5 Delete
John Taro Shelly Miyo
John - Follow
Taro Follow - Follow
Shelly Follow -
Miyo Follow Follow -
A B C D
A - 3.5 2.3 1.3
B - 4.2 5.6
C - 7.8
D -
物理上の距離(無向グラフ) Follow関係(有向グラフ) CRUD関係(二部グラフ)
隣
接
行
列
タンパク質立体構造 ソーシャルネットワーク構造 システム構造
(四角が機能、ドラムがテーブル)
ネットワーク構造は、隣接行列に変換可能
(貞光JSAI2018)
- 23. Copyright ©2020 by Future Corporation. Japan
ニューラルネットワークとの接点
グラフニューラルネットワーク:
・Graph Convolutional Neural Network (GCN)
(Kipf+ ICLR2017)
グラフスペクトル(グラフ周波数)フィルタリングを用いる手法
・Diffusion-Convolutional Neural Network (DCNN)
(Atwood+ NIPS2016)
頂点領域フィルタリングを用いる手法
ノードの
素性行列
推測ラベル
DCNNの模式図
ここが隣接行列
⇒前ページの
何に対しても使える!
- 24. Copyright ©2020 by Future Corporation. Japan
深層学習の接点
アナロジー
自然言語処理や音声処理と類似!
アナロジー
SNSネットワーク等のNW構造と
類似!
各データの情報量=少
データ量=多
各データの情報量=多
データ量=少
シーケンス構造としてのタンパク質 立体構造としてのタンパク質
深層学習的に見ると、他分野とのアナロジーが見つかる
- 25. Copyright ©2020 by Future Corporation. Japan
25
QRコード
個人ページ
(FB/Linkedin/eight)
AIビジネス
事例紹介
AIエンジニア/コンサルタント
リクルートページ