SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
理解して使うRNA Velocity解析ツール
- 最近のツール編 -
Mika Yoshimura
2023/02/08 理化学研究所
scVelo開発チームによるレビュー論文
• RNA velocity—現在の課題と将来の展望
Volker Bergen, Ruslan A Soldatov, Peter V Kharchenko, Fabian J Theis
Mol Syst Biol. 2021 Aug;17(8):e10282
• Velocity解析手法の限界についての実例とFeature Plansを示す
scVeloの今後の展望 A. velocityモデルの拡張
細胞の状態間やダイナミックなプロセス中におこる
パラメータの動的な変化を考慮した拡張
B. 細胞特異的ダイナミクスの確率論的モデル
RNA velocityのモデルは決定論的な微分方程式で
記述されるため、不均一性は無視されている
→ 確率的変動をモデルに取り込む
C. システムダイナミクスに向けた多変量解析モデル
RNA velocityのモデルで各遺伝子の制御関係は無視される
→ 細胞状態の遷移に沿った制御性相互作用を記述する
多変量モデルに拡張する
D. Multi-modal omics models
protein, 細胞質のmRNA, キャッピングmRNA,
クロマチンの状態等、他のシグナルをモデルに組み込む
scVeloの現在
複数の系統をもつ細胞集団
特定のクラスタで、推定されたダイナミクス(紫の曲線) では説明できない挙動を示す遺伝子
異なる挙動のクラスタ Velocity再計算
[疑問]
2022.12 時点で、 Velocity解析の課題を認識した 新しいVelocityツールは
どれくらい発表されているのか?
→ レビュー論文 Mol Syst Biol. 2021 を引用する論文を調査
V.Bergen.et.al, Mol Syst Biol. 2021 を引用している論文
22年12月時点
引用論文数 : 54報
重複を除去 : 51報
23年2月現在 → 70報
A : Review(解析者向け) = 1本
B : 手法検証= 2本
C : 既存velocityの応用 = 3本
D : scVeloの後継手法 = 13本
E : scVeloのFigを掲載 = 10本
F : velocityに言及・他 = 21本
A : Review(解析者向け) = 1本
B : 手法検証= 2本
C : 既存velocityの応用 = 3本
D : scVeloの後継手法 = 13本
E : scVeloのFigを掲載 = 10本
F : velocityに言及・他 = 21本
V.Bergen.et.al, Mol Syst Biol. 2021 を引用している論文
22年12月時点
引用論文数 : 54報
重複を除去 : 51報
23年2月現在 → 70報
scTour
DeepVelo
LatentVelo
PhyloVelo
Pyro-Velocity
veloVI
VeloVAE
spliceJAC
Molecular Systems Biology (2022)18:e111
MultiVelo
UniTVelo
κ-velo/eco-velo
ValoAE
Nature Biotechnology (2022)
Nature Comm volume 13, 6586 (2022)
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
Proc Natl Acad Sci U S A. 2021 Dec 7
Preprints
Published
not use
“velocity”
scVeloの後継手法 一覧
モデル拡張
MultiVelo
Nature Biotechnology (2022)
UniTVelo
Nature Comm volume 13, 6586 (2022)
モデル拡張 + embeddingの改良
κ-velo/eco-velo
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
変分オートエンコーダー(生成モデル)
ValoAE
Proc Natl Acad Sci U S A. 2021 Dec 7
scTour LatentVelo
Pyro-Velocity
深層生成モデル
veloVI
グラフ畳み込み
ネットワーク
DeepVelo
変分ベイズ
VeloVAE
細胞系統樹
多変量スプライシングモデル
(not use velocity)
PhyloVelo spliceJAC
Molecular Systems Biology (2022)
オートエンコーダー
モデル拡張
MultiVelo
Nature Biotechnology (2022)
UniTVelo
Nature Comm volume 13, 6586 (2022)
MultiVelo
Nature Biotechnology (2022)
・エピゲノムデータを取り入れた微分方程式モデル
・転写速度はクロマチンアクセシビリティ (c)に
比例し時間的に変化すると仮定
・時間tが進むにつれて変化する状態kをモデル化
・遺伝子発現のスイッチ時間
(クロマチン閉環、転写誘導、転写抑制が始まるタイミング)
・遺伝子固有のVelocityパラメータ
→ 3次元位相ポートレートを用いて推定
UniTVelo
Nature Comm volume 13, 6586 (2022)
・spliced-RNAを使用し遺伝子発現の完全なダイナミクスを
放射状基底関数 (RBF) でモデル化、トップダウン的にRNA velocityを推定する
・スプライシングされていないRNAが全くない状態でもVelocityを予測することができる
・細胞ごとにトランスクリプトーム全体で共有する潜在time pointを導入し、
遺伝子間でのノイズ(方向性の不一致)を解決 → 細胞分化経路の予測精度が向上
モデル拡張 + embeddingの改良
κ-velo/eco-velo
Cell volume 185, Issue 4, 2022
PLoS Comput Biol. 2022 Sep 28
Cell volume 185, Issue 4, 2022
・代謝標識シーケンスデータを
spliced/unsplicedダイナミクスに基づくモデルに統合し
真の(absolute) velocity を推定
・代謝ラベリングなしの1細胞RNA-seqデータにも適用可
・各細胞の遺伝子発現量と変化速度(velocity) から、
遺伝子発現量ベクトルを受け取って変化速度を返す
関数 f (ベクトルフィールド)を学習する
・再構成された解析的ベクトルフィールドを用いて、
細胞が存在しない領域に対しても、低次元空間の
ベクトルフィールドを数学的に復元したり、
細胞運命変遷、遺伝子擾乱の結果などの予測が可能
参考:1細胞シーケンシングデータを用いた遺伝子発現変化予測
(in silico perturbation) 手法 (Dynamo, SCENIC+) の紹介
https://qiita.com/masa12/items/1e564768ad98c0d4cf9c
κ-velo/eco-velo
PLoS Comput Biol. 2022 Sep 28
・メインはκ-velo
・細胞密度 = 遺伝子に依存しないグローバルな
潜在時間 “スケーリングファクターκ”をモデルに導入
(スケール不変性問題を克服)
・非線形低次元空間embeddingに
Nyström射影を用いる
・eco-veloは 高次元のRNA velocityを推論しない
ヒューリスティックなアプローチ
変分オートエンコーダー(生成モデル)
ValoAE
Proc Natl Acad Sci U S A. 2021 Dec 7
scTour LatentVelo
Pyro-Velocity
深層生成モデル
veloVI
グラフ畳み込み
ネットワーク
DeepVelo
変分ベイズ
VeloVAE
オートエンコーダー
VeloAE
Proc Natl Acad Sci U S A. 2021 Dec 7
・ノイズの多い高次元spliced/unsplicedベクトルを
オートエンコーダで低次元潜在空間に射影し、
線形回帰(=定常状態モデル)を用いて潜在空間上の
velocityを推定する
※embeddingはscVeloと同じく遷移確率を用いる
scTour
・変分オートエンコーダ(VAE)とneural ODEを用いて、
教師なしでpseudotime、トランスクリプトームベクトル場、
潜在空間を同時に推定
・バッチ効果を受けず、事前知識(ルート細胞の指定など)や
spliced/unspliced mRNAの区別も必要ない
biorxiv.org/content/10.1101/2022.04.17.488600v2.full
LatentVelo
・変分オートエンコーダ(VAE)で細胞のカウントデータを
低次元潜在空間に埋め込み、潜在空間上での
分化ダイナミクスをneural ODEで記述する
・VeloAEと異なり、細胞状態を学習した潜在空間に埋め込み
ダイナミクスを細胞状態や系譜に依存させることができる
・単に局所的なVelocityベクトルを出力するのではなく、
個々の細胞ごとにグローバルな経路 を推定する
→ 潜在的な軌道も予測することができる
・細胞状態とRNA velocityに対する一括バッチ補正が可能
biorxiv.org/content/10.1101/2022.08.22.504858v2.full
Pyro-Velocity
・spliced/unsplicedリードカウントを用いてvelocityベクトルフィールド & 共有潜在時間の不確実性推定を行う確率的生成モデル
・変分推論の自動化として提案されている自動微分変分推論(Automatic Differentiation Variational Inference ; ADVI)という
アルゴリズムを利用し、近似事後分布を導出する
・variable genesの選択、主成分の数、kNNによる平滑化などの前処理ステップや、遺伝子ごとの独立したvelocityに対する
平滑化、集約などアドホックな後処理が必要ない
biorxiv.org/content/10.1101/2022.09.12.507691v2.full
Pyro : pythonの機械学習ライブラリPyTorchを
ベースにした確率的プログラミング言語
veloVI
・scVeloと同じラボからの論文
・ 深層生成モデル(Deep Generative Model) を用いて、
反応速度パラメータと潜在時間を学習しながら、
すべての細胞と遺伝子間で情報を共有するモデルを介して
RNA velocityの推論を再定式化
・velocityの経験的事後分布(細胞-遺伝子レベル)を出力
→ 内在的な不確実性 + 細胞の近傍間の変動性の両方を
定量化できる
https://github.com/YosefLab/velovi
・数ヶ月以内にscvi-tools に移行 + scVeloでラッパーがビルド
biorxiv.org/content/10.1101/2022.08.12.503709v1.full
DeepVelo
・グラフ畳み込みネットワーク(GCN)を用いて、遺伝子ごと、細胞ごとのRNAスプライシング・分解速度を推定
・異種細胞集団やマルチリネージを持つデータに対して、複雑な分化動態のRNA velocityをモデル化することが可能
biorxiv.org/content/10.1101/2022.04.03.486877v2.full
VeloVAE
・変分ベイズを用いて、各細胞の潜在時間、細胞の状態、
反応速度パラメータの事後分布を推定
・データ適合性と分化方向の推定精度の点で、
従来のアプローチを大幅に上回る
・細胞状態変数と全遺伝子で共有する潜在時間の導入によって
従来の手法では捉えられなかった発現ダイナミクスの
定性的特徴をモデル化できる
(遅延誘導、初期抑制、転写ブースト、分岐など)
biorxiv.org/content/10.1101/2022.07.08.499381v2.full
細胞系統樹
多変量スプライシングモデル
(not velocity)
PhyloVelo spliceJAC
Molecular Systems Biology (2022)
PhyloVelo
・一細胞トランスクリプトーム + 系統樹情報 で
細胞運命の遷移を系統的にマッピングする手法
・細胞分裂に伴う単調発現遺伝子(MEGs)は、
末端細胞の種類に関わらず、系統分岐に沿って
連続的に発現が増減する
・MEGを利用し、細胞系統樹に分解された
scRNA-seqデータからvelocityフィールドを
低次元空間上で後ろ向きに再構築する
biorxiv.org/content/10.1101/2022.10.06.511094v2.full
spliceJAC
Molecular Systems Biology (2022)
A. unspliced mRNAとspliced mRNAのカウント、
細胞のアノテーションを入力とする
B,C. 多変量mRNAスプライシングモデルにより
各細胞状態に特異的な遺伝子-遺伝子相互作用行列を出力
D. 細胞状態間の切り替えを、状態特異的な
遺伝子制御ネットワークによる高次元ランドスケープ上の
遷移として解釈する
E. 安定性解析により、細胞状態間の移行に重要な
“遷移遺伝子 “を予測できる
(F. 各細胞状態は、制御ネットワークに捕捉された遺伝子間の
特異的な相互作用を示す)
まとめ
・scVelo開発チームがMol Syst Biol. 2021にて問題提起した課題について、後継手法はその多くを
克服しつつある
個々の手法での課題
・前処理 → 正確なunspliced RNAの定量など
・既存モデルの拡張 → 確率的ダイナミクスのより良い推論
・生成モデルの活用 → ハイパーパラメータの調整
・ほとんど観測されない一過性の細胞クラスタを持つ、疎な細胞系譜集団でのVelocity推定
etc…
現状、どの手法も従来のscVeloとしか比較していないため、ベンチマーク論文が待たれる
scVeloチームも後継のVeloVIを開発しており、今後Velocity解析の標準はアップデートしていくと予想

Contenu connexe

Tendances

トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?hoxo_m
 
【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)Deep Learning JP
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual FeaturesARISE analytics
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成Yoshitaka Ushiku
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理Yuya Unno
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs Deep Learning JP
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心takehikoihayashi
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)Takao Yamanaka
 
グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題joisino
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門tmtm otm
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデルMasashi Komori
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Surveytmtm otm
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process ModelsDeep Learning JP
 
[DL輪読会]Ensemble Distribution Distillation
[DL輪読会]Ensemble Distribution Distillation[DL輪読会]Ensemble Distribution Distillation
[DL輪読会]Ensemble Distribution DistillationDeep Learning JP
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21horihorio
 
[DL輪読会]Estimating Predictive Uncertainty via Prior Networks
[DL輪読会]Estimating Predictive Uncertainty via Prior Networks[DL輪読会]Estimating Predictive Uncertainty via Prior Networks
[DL輪読会]Estimating Predictive Uncertainty via Prior NetworksDeep Learning JP
 
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII
 

Tendances (20)

トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?トピックモデルの評価指標 Perplexity とは何なのか?
トピックモデルの評価指標 Perplexity とは何なのか?
 
【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)【DL輪読会】Patches Are All You Need? (ConvMixer)
【DL輪読会】Patches Are All You Need? (ConvMixer)
 
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
【論文読み会】Deep Clustering for Unsupervised Learning of Visual Features
 
画像キャプションの自動生成
画像キャプションの自動生成画像キャプションの自動生成
画像キャプションの自動生成
 
深層学習時代の自然言語処理
深層学習時代の自然言語処理深層学習時代の自然言語処理
深層学習時代の自然言語処理
 
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs 【DL輪読会】Perceiver io  a general architecture for structured inputs & outputs
【DL輪読会】Perceiver io a general architecture for structured inputs & outputs
 
相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心相関と因果について考える:統計的因果推論、その(不)可能性の中心
相関と因果について考える:統計的因果推論、その(不)可能性の中心
 
変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)変分推論法(変分ベイズ法)(PRML第10章)
変分推論法(変分ベイズ法)(PRML第10章)
 
グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題グラフニューラルネットワークとグラフ組合せ問題
グラフニューラルネットワークとグラフ組合せ問題
 
順推論と逆推論
順推論と逆推論順推論と逆推論
順推論と逆推論
 
PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門PRML学習者から入る深層生成モデル入門
PRML学習者から入る深層生成モデル入門
 
MCMC法
MCMC法MCMC法
MCMC法
 
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
【読書会資料】『StanとRでベイズ統計モデリング』Chapter12:時間や空間を扱うモデル
 
HiPPO/S4解説
HiPPO/S4解説HiPPO/S4解説
HiPPO/S4解説
 
Bayesian Neural Networks : Survey
Bayesian Neural Networks : SurveyBayesian Neural Networks : Survey
Bayesian Neural Networks : Survey
 
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
[DL輪読会]Scalable Training of Inference Networks for Gaussian-Process Models
 
[DL輪読会]Ensemble Distribution Distillation
[DL輪読会]Ensemble Distribution Distillation[DL輪読会]Ensemble Distribution Distillation
[DL輪読会]Ensemble Distribution Distillation
 
RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21RでGARCHモデル - TokyoR #21
RでGARCHモデル - TokyoR #21
 
[DL輪読会]Estimating Predictive Uncertainty via Prior Networks
[DL輪読会]Estimating Predictive Uncertainty via Prior Networks[DL輪読会]Estimating Predictive Uncertainty via Prior Networks
[DL輪読会]Estimating Predictive Uncertainty via Prior Networks
 
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
SSII2020 [OS2-03] 深層学習における半教師あり学習の最新動向
 

Similaire à 理解して使うRNA Velocity解析ツール-最近のツール編

ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel弘毅 露崎
 
Data assim r
Data assim rData assim r
Data assim rXiangze
 
20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasyYoichi Shirasawa
 
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーPFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーMatlantis
 
Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Ryohei Suzuki
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベースDNA Data Bank of Japan center
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクスMas Kot
 

Similaire à 理解して使うRNA Velocity解析ツール-最近のツール編 (10)

ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernelISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel
 
Data assim r
Data assim rData assim r
Data assim r
 
20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy20100626 CVIM(3)6,7 shirasy
20100626 CVIM(3)6,7 shirasy
 
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナーPFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
PFP:材料探索のための汎用Neural Network Potential_中郷_20220422POLセミナー
 
Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向Single-cell pseudo-temporal ordering 近年の技術動向
Single-cell pseudo-temporal ordering 近年の技術動向
 
ENCODE勉強会
ENCODE勉強会ENCODE勉強会
ENCODE勉強会
 
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdfStatGenSummerSchool2023_GenomeDataAnalysis3.pdf
StatGenSummerSchool2023_GenomeDataAnalysis3.pdf
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
 
ケモインフォマティクス
ケモインフォマティクスケモインフォマティクス
ケモインフォマティクス
 
hashimoto m
hashimoto mhashimoto m
hashimoto m
 

理解して使うRNA Velocity解析ツール-最近のツール編