SlideShare une entreprise Scribd logo
1  sur  24
Single-cell pseudo-temporal ordering
近年の技術動向
報告:鈴木良平
参考文献 (括弧内はソフトウェア/アルゴリズム名)
1. Trapnell, Cole, et al. "The dynamics and regulators of cell fate decisions are revealed by
pseudotemporal ordering of single cells." Nat. biotechnol. 32.4 (2014): 381-386. (Monocle 1)
2. Marco, Eugenio, et al. "Bifurcation analysis of single-cell gene expression data reveals
epigenetic landscape." PNAS 111.52 (2014): E5643-E5650. (SCUBA)
3. Setty, Manu, et al. "Wishbone identifies bifurcating developmental trajectories from
single-cell data." Nat. biotechnol. 34.6 (2016): 637. (Wishbone)
4. Haghverdi, Laleh, et al. "Diffusion pseudotime robustly reconstructs lineage branching."
Nat. methods (2016): 041384. (DPT)
5. Qiu, Xiaojie, et al. "Reversed graph embedding resolves complex single-cell trajectories."
Nat. methods (2017). (Monocle 2, RGE)
Single-cell biology
組織中の細胞ごとの表現型の
違いを捉える実験・分析手法.
IHC, FACSなどlow-throughput
↔ オミックス(バルク分析)
目的となる知見
• 組織内の遺伝型多様性, 変異
• 同種細胞間の表現型多様性
• 異種細胞の組織内空間分布
(Navin et al., 2011: breast cancer CNV)
• 細胞種同士の分化関係
Junker, Jan Philipp, and Alexander van Oudenaarden. "Every cell is special: genome-wide
studies add a new dimension to single-cell biology." Cell 157.1 (2014): 8-11.
→ High-throughput+single-cellへ
Single-cell transcriptome
Single-cell real-time PCR
• Guo et al., 2010: マウス胚500細胞48遺伝子の発現量測定
→ PCAを用いて3胚葉への早期分化マーカーを特定
• 同時に計測できるのは数十遺伝子程度が限界
scRNA-seq
• 細胞ごとにゲノムワイドなトランスクリプトームを計測する
• 逆転写時に各細胞でユニークなバーコード配列を結合,シーケンス後にどの細胞
由来のリードか区別 (Hashimshony et al., 2012; Islam et al., 2011)
※single-cell mass-cytometry (プロテオーム)
• 様々なタンパク質に重金属修飾抗体を結合, ToF質量分析で同時定量
scRNA-seqの技術発展
Svensson, Valentine, Roser Vento-Tormo, and Sarah A. Teichmann. "Exponential
scaling of single-cell RNA-seq in the last decade.", arXiv:1704.01379 [q-bio.GN]
実験あたりシーケンス細胞数
• 2011年ごろ〜100個程度
• 2017年現在100万個が視野に
※数百〜数万細胞での実験が典型的
バーコード手法の進化
• STRT-seq (Islam et al., 2011)
細胞ごとにチューブに分離
• Drop-seq (Macosko et al., 2015)
ユニークプライマー入り液滴に細胞分離
• Combinatorial index (Cao et al., 2017)
バーコード配列のin situ逆転写を繰り返す
Tissue homeostasis and development
組織内には様々な分化段階の細胞が恒常的な割合で共存している
→「ある時点に組織に含まれる細胞集団には、
ひとつひとつの細胞が辿る各瞬間の状態に
対応した姿の細胞が含まれている」(仮定)
cf. エルゴード性 (ergodicity)
≡アンサンブル(集団)平均と時間平均が等しい
一時点での組織のsingle cell解析により、
組織内の細胞分化ダイナミクスが分かる!
リンパ系,造血系など
Pseudo-temporal ordering (PT, 偽時系列解析)
入力
• single-cell methodで得られたデータ (e.g., scRNA-seq, mass cytometry, Hi-C)
出力
• 各細胞の時間的順序 (または代表的な時系列)
• 分岐(bifurcation)パターンとその位置の特定
入力例:高次元発現プロファイル
細胞
細胞
低次元空間にマッピング
(手法による)
PTの基本的なアイデア
仮定
• 分化に伴い表現型は連続的に変化する
→ 時間的に近い細胞は高次元空間内で近接
• 組織中には分化経路上のあらゆる段階の細胞が
まんべんなく存在している
アプローチ
• 細胞の高次元空間中での分布を調べる
• 列をなしていれば、それが時系列変化
• 枝分かれがあれば、それが分岐的分化
Furusawa, Chikara, and Kunihiko Kaneko. "A dynamical-systems
view of stem cell biology." Science 338.6104 (2012): 215-217.
近年のPT研究の発展
2011〜2013年ごろ
• 各種single-cell技術が登場 (real-time PCR, scRNA-seq, mass cytometry)
2014年 (pseudo-temporal analysis黎明)
• Wanderlust, Monocle, SCUBA
→ 複数時刻でサンプリングしたデータが主な対象.単純な次元削減+グラフ解析
2016年
• Wishbone, TSCAN, DPT
→ ~万クラスの細胞数+ゲノムワイドデータへの対応
2017年
• RGE (Monocle 2)
PTアルゴリズムの比較軸
入力データの複雑さ
• 数十次元 (mass cytometry向け) 〜 超高次元 (genome wide)
次元削減・データ表現の方法
• 高次元データからどうやって低次元構造を抽出するか (PCA, ICA, diffusion mapなど)
分岐検出
• 非対応, 2分岐のみ, 多分岐対応
生物学的事前知識・教師データの利用
• マーカー遺伝子, 分岐数などの情報
他、真の複数時刻測定に対して分岐解析を行う機能を持つもの(SCUBA)など
主なPT手法 (2014年以降のpublication)
https://github.com/agitter/single-cell-pseudotime
Monocle / Monocle 2 (Census) / Wanderlust / Cycler / Wishbone / SCUBA / DPT /
Oscope / Diffusion maps / destiny / DeLorean / Waterfall / Embeddr / GP-LVM /
pseudogp / GP-LVM / SLICER / TSCAN / SCOUP / Topslam / Ouija / Slingshot /
Gpfates / SCIMITAR / WaveCrest / LEAP / CellTree / Bayesian hierarchical mixture
of factor analysers (MFA) / Mpath / SCORPIUS / SCODE / switchde / MAGIC /
PHATE / SOMSC / TASIC / FORKS / UNCURL / reCAT / PhenoPath / Branched
Gaussian processes / Branch-recombinant Gaussian Processes / MATCHER /
SoptSC / Di-SNE / Population Balance Analysis / Scanpy / etc.
得意とする細胞数や遺伝子数,生物学的プロセスが違う(あと、論文書きやすいのではないだろうか…)
Monocle [Trapnell et al., 2014]
特徴 ベンチマーク標準.広く使われている
戦略 次元削減(独立成分分析)+スパイン検出 (最小全域木)
評価 ヒト筋芽細胞の分化を複数時刻でscRNA-seq
→ 既知マーカー再現+新転写因子提案
長所 多遺伝子データセットに適用可能
短所 数百細胞程度までしか安定動作しない
分岐数はマニュアル指定
https://bioconductor.org/packages/release/bioc/html/monocle.html
Monocle - 独立成分分析 (FastICA)
PCAに似た目的の処理
正規分布(ガウス性)を仮定しない
• 混合モデル
• 分離モデル
Wを最適化してuの独立性を最大化
※独立性≡KLダイバージェンス
観測データ
分離信号
FastICA: xを白色化して|W|=1の直交行列に限定
https://www.slideshare.net/sfchaos/numpy-scipy-9039097
Monocle - スパイン検出
最小全域木 (MST)
• 全細胞を含む最小のネットワーク
• 一番長く取れる経路=スパイン
順序付け&分岐検出 (PQ-tree)
• スパインに沿って順序付け
• スパイン上の同じ細胞から伸びた
枝どうしは順不同
• 上の制約を満たしつつ
全距離最小の全順序を
偽時系列として出力
• 分岐は指定回数だけ
スパインの次に長い経路を取る
SCUBA [Marco et al., 2014]
特徴 実時系列single-cellデータの分岐階層分析が主機能.
戦略 次元削減(t-SNE)+主経路検出 (principal curve analysis)
評価 B細胞分化のmass cytometry (2万細胞)
→ 偽時系列のCD群増減が既知の振る舞いと一致
長所 シンプルな実装, 多細胞データへの対応
短所 分岐検出は不完全
https://github.com/gcyuan/SCUBA
SCUBA – principal curve
Hastie, Trevor, and Werner Stuetzle. "Principal curves." Journal of the
American Statistical Association 84.406 (1989): 502-516.
離散的なデータについては折れ線を作る.
各頂点 xi について、
• V = {xiの近傍のデータ点 yj} として
• xi = E[yj ∈ V]
を満たすような折れ線がprincipal curve.
実際は反復的最適化で計算する.
Wishbone [Setty et al., 2016]
特徴 二又分岐に特化,mass cytometryが主なターゲット
戦略 次元削減 (diffusion map) + 最短路ベース経路 (kNN-graph)
評価 マウス胸腺 CD4+/CD8+分化 (23万細胞, 表面マーカmass cytometry)
→ DN,DP,SPの分化経路を多CDで正しく再現
長所 高精度な分岐判定
短所 高次元データには対応しない
scRNA-seqではマーカー選択が必須
http://www.c2b2.columbia.edu/danapeerlab/html/wishbone.html
Wishbone – diffusion maps
Coifman, Ronald R., and Stéphane Lafon. "Diffusion maps." Applied
and computational harmonic analysis 21.1 (2006): 5-30.
要素の類似性にもとづく高次元
データの次元削減手法
1. 集合をグラフ表現
2. ランダムウォークで類似性計算
3. 類似性(遷移)行列を対角化
4. 固有値が大きい固有ベクトルが
粗視化空間を張る
Wishbone – kNN-graphによる分岐判定
• 低次元空間内でkNNを結んだネット
ワークを作る
• ランダムに選ばれた複数の細胞それぞ
れ(waypoints)から他の各細胞までの
最短距離を計算
• global trajectoryは近隣のwaypointに
重みを付けてコンセンサスを取る
• Aを開始点, BとCをwaypointとして
d(A,B) < d(A,C)とする
• もしA,B,Cが同じ経路上にあれば
d(A,B) + d(B,C) ≈ d(A, C)
DPT [Haghverdi et al., 2016]
特徴 次元圧縮を行わない,密度分析による準安定状態検出
戦略 遷移確率行列をプロファイルに用いる+シンプルな分岐検出
評価 マウス造血系qPCR (赤血球/内皮分化), ES細胞scRNA-seq
→ 既知の発現パターンを再現
長所 ロバストネス
スケーラビリティ(?)
短所 複雑な分岐パターンには対応しない(?)
diffusion parameterの非自明な調整が必要
DPT - アルゴリズム
• 距離行列の構成はWishboneと類似
• 開始細胞からの距離で見た順序と,最遠隔細胞からの距離で見た順序を比較
• もし分岐がなければ常に逆相関する
• 分岐地点では二つの順序が正の相関を示す
RGE (Monocle 2) [Qiu et al., 2017]
特徴 反復的戦略,高次元空間内でのprincipal graph (木構造) 生成
戦略 低次元空間での経路予測と高次元空間でのデータ操作を反復
評価 筋芽細胞ゲノムワイドscRNA-seq
→ 分化経路依存の887遺伝子を特定
長所 分岐モデルなど事前知識が不要
短所 ?
Reversed graph embedding
今後の課題
• 10万〜細胞×ゲノムワイド入力に対応するスケーラビリティ
• 少数遺伝子変化へのセンシティビティ (cocktail party)
• 細胞分布の偏りに対する頑強性
• 階層的な分岐構造の自動検出
• cell cycleなど分化と無関係なダイナミクスの自動検出
• などなど…

Contenu connexe

Tendances

Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編Hiroshi Shimizu
 
PRML輪読#8
PRML輪読#8PRML輪読#8
PRML輪読#8matsuolab
 
研究室内PRML勉強会 8章1節
研究室内PRML勉強会 8章1節研究室内PRML勉強会 8章1節
研究室内PRML勉強会 8章1節Koji Matsuda
 
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...Deep Learning JP
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Satoshi Kato
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Shohei Kumagai
 
モンテカルロサンプリング
モンテカルロサンプリングモンテカルロサンプリング
モンテカルロサンプリングKosei ABE
 
Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介Chihiro Kusunoki
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?Masanao Ochi
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点Taiji Suzuki
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)Masahiro Suzuki
 
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...Deep Learning JP
 
顕著性マップの推定手法
顕著性マップの推定手法顕著性マップの推定手法
顕著性マップの推定手法Takao Yamanaka
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木 Miyoshi Yuya
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019Yusuke Uchida
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデルMasahiro Suzuki
 
PRML第6章「カーネル法」
PRML第6章「カーネル法」PRML第6章「カーネル法」
PRML第6章「カーネル法」Keisuke Sugawara
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理Taiji Suzuki
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類Shintaro Fukushima
 

Tendances (20)

Stanコードの書き方 中級編
Stanコードの書き方 中級編Stanコードの書き方 中級編
Stanコードの書き方 中級編
 
PRML輪読#8
PRML輪読#8PRML輪読#8
PRML輪読#8
 
研究室内PRML勉強会 8章1節
研究室内PRML勉強会 8章1節研究室内PRML勉強会 8章1節
研究室内PRML勉強会 8章1節
 
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
[DL輪読会]Model soups: averaging weights of multiple fine-tuned models improves ...
 
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages. Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
Dimensionality reduction with t-SNE(Rtsne) and UMAP(uwot) using R packages.
 
Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用Partial least squares回帰と画像認識への応用
Partial least squares回帰と画像認識への応用
 
モンテカルロサンプリング
モンテカルロサンプリングモンテカルロサンプリング
モンテカルロサンプリング
 
Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介Deep State Space Models for Time Series Forecasting の紹介
Deep State Space Models for Time Series Forecasting の紹介
 
【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?【論文紹介】How Powerful are Graph Neural Networks?
【論文紹介】How Powerful are Graph Neural Networks?
 
深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点深層学習の数理:カーネル法, スパース推定との接点
深層学習の数理:カーネル法, スパース推定との接点
 
深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)深層生成モデルと世界モデル(2020/11/20版)
深層生成モデルと世界モデル(2020/11/20版)
 
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
[DL輪読会]Factorized Variational Autoencoders for Modeling Audience Reactions to...
 
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM) 一般化線形モデル (GLM) & 一般化加法モデル(GAM)
一般化線形モデル (GLM) & 一般化加法モデル(GAM)
 
顕著性マップの推定手法
顕著性マップの推定手法顕著性マップの推定手法
顕著性マップの推定手法
 
パターン認識 第10章 決定木
パターン認識 第10章 決定木 パターン認識 第10章 決定木
パターン認識 第10章 決定木
 
モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019モデルアーキテクチャ観点からの高速化2019
モデルアーキテクチャ観点からの高速化2019
 
深層生成モデルと世界モデル
深層生成モデルと世界モデル深層生成モデルと世界モデル
深層生成モデルと世界モデル
 
PRML第6章「カーネル法」
PRML第6章「カーネル法」PRML第6章「カーネル法」
PRML第6章「カーネル法」
 
数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理数学で解き明かす深層学習の原理
数学で解き明かす深層学習の原理
 
不均衡データのクラス分類
不均衡データのクラス分類不均衡データのクラス分類
不均衡データのクラス分類
 

Similaire à Single-cell pseudo-temporal ordering 近年の技術動向

Pachinko Allocation Model を用いたクラスタリングによるシングルセル発現解析手法
Pachinko Allocation Model  を用いたクラスタリングによるシングルセル発現解析手法Pachinko Allocation Model  を用いたクラスタリングによるシングルセル発現解析手法
Pachinko Allocation Model を用いたクラスタリングによるシングルセル発現解析手法Wataru Hirota
 
Analysis of differential splicing suggests different modes of short-term spli...
Analysis of differential splicing suggests different modes of short-term spli...Analysis of differential splicing suggests different modes of short-term spli...
Analysis of differential splicing suggests different modes of short-term spli...Mika Yoshimura
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベースDNA Data Bank of Japan center
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012Hiroyuki Mishima
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-SeqItoshi Nikaido
 
動物とロボットの空間ナビゲーション
動物とロボットの空間ナビゲーション動物とロボットの空間ナビゲーション
動物とロボットの空間ナビゲーションHoriguchi Shuhei
 
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオンEli Kaminuma
 
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...奈良先端大 情報科学研究科
 
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリングDNA Data Bank of Japan center
 
事前登録のやり方
事前登録のやり方事前登録のやり方
事前登録のやり方Yuki Yamada
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状Takeru Nakazato
 
理解して使うRNA Velocity解析ツール-最近のツール編
理解して使うRNA Velocity解析ツール-最近のツール編理解して使うRNA Velocity解析ツール-最近のツール編
理解して使うRNA Velocity解析ツール-最近のツール編Mika Yoshimura
 
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報DNA Data Bank of Japan center
 
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)pinmarch_t Tada
 
バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析sesejun
 

Similaire à Single-cell pseudo-temporal ordering 近年の技術動向 (16)

Pachinko Allocation Model を用いたクラスタリングによるシングルセル発現解析手法
Pachinko Allocation Model  を用いたクラスタリングによるシングルセル発現解析手法Pachinko Allocation Model  を用いたクラスタリングによるシングルセル発現解析手法
Pachinko Allocation Model を用いたクラスタリングによるシングルセル発現解析手法
 
Analysis of differential splicing suggests different modes of short-term spli...
Analysis of differential splicing suggests different modes of short-term spli...Analysis of differential splicing suggests different modes of short-term spli...
Analysis of differential splicing suggests different modes of short-term spli...
 
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
 
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
ヒトゲノム変異解析ワークフローにおける公共データベース活用@MBSJ2012
 
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
 
動物とロボットの空間ナビゲーション
動物とロボットの空間ナビゲーション動物とロボットの空間ナビゲーション
動物とロボットの空間ナビゲーション
 
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
[2018-03-29]JSPP18 Oxford Flower Image Datasetを用いた深層学習ハンズオン
 
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
KNApSAcK Family Databases: Integrated Metabolite–Plant Species Databases for ...
 
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
[All-in-one2016] ゲノム配列と蛋白質立体構造の統合的検索とモデリング
 
[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方[DDBJing31] DDBJ と NIG SuperComputer の使い方
[DDBJing31] DDBJ と NIG SuperComputer の使い方
 
事前登録のやり方
事前登録のやり方事前登録のやり方
事前登録のやり方
 
ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状ライフサイエンスデータベースの現状
ライフサイエンスデータベースの現状
 
理解して使うRNA Velocity解析ツール-最近のツール編
理解して使うRNA Velocity解析ツール-最近のツール編理解して使うRNA Velocity解析ツール-最近のツール編
理解して使うRNA Velocity解析ツール-最近のツール編
 
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
[DDBJing30] DDBJ と NIG SuperComputer の紹介、大量配列情報
 
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
 
バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析バイオインフォマティクスによる遺伝子発現解析
バイオインフォマティクスによる遺伝子発現解析
 

Plus de Ryohei Suzuki

Transformer based approaches for visual representation learning
Transformer based approaches for visual representation learningTransformer based approaches for visual representation learning
Transformer based approaches for visual representation learningRyohei Suzuki
 
Paper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsPaper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsRyohei Suzuki
 
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Ryohei Suzuki
 
Basic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresBasic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresRyohei Suzuki
 
Disentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsDisentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsRyohei Suzuki
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"Ryohei Suzuki
 
Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Ryohei Suzuki
 
等号と不等号の物理学
等号と不等号の物理学等号と不等号の物理学
等号と不等号の物理学Ryohei Suzuki
 
コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?Ryohei Suzuki
 
身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線Ryohei Suzuki
 
Collaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdCollaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdRyohei Suzuki
 
汝は計算機なりや?
汝は計算機なりや?汝は計算機なりや?
汝は計算機なりや?Ryohei Suzuki
 
アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―Ryohei Suzuki
 
色字共感覚と書記素学習
色字共感覚と書記素学習色字共感覚と書記素学習
色字共感覚と書記素学習Ryohei Suzuki
 
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時埋め込みによる編集支援AnnoTone: 高周波音の映像収録時埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援Ryohei Suzuki
 
立体音響とインタラクション
立体音響とインタラクション立体音響とインタラクション
立体音響とインタラクションRyohei Suzuki
 
SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionRyohei Suzuki
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User InterfacesRyohei Suzuki
 
Brief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesBrief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesRyohei Suzuki
 

Plus de Ryohei Suzuki (20)

Transformer based approaches for visual representation learning
Transformer based approaches for visual representation learningTransformer based approaches for visual representation learning
Transformer based approaches for visual representation learning
 
Paper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problemsPaper memo: persistent homology on biological problems
Paper memo: persistent homology on biological problems
 
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
Paper memo: Optimal-Transport Analysis of Single-Cell Gene Expression Identif...
 
Basic Concepts of Entanglement Measures
Basic Concepts of Entanglement MeasuresBasic Concepts of Entanglement Measures
Basic Concepts of Entanglement Measures
 
Disentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative ModelsDisentangled Representation Learning of Deep Generative Models
Disentangled Representation Learning of Deep Generative Models
 
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
論文紹介: "MolGAN: An implicit generative model for small molecular graphs"
 
Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"Report: "MolGAN: An implicit generative model for small molecular graphs"
Report: "MolGAN: An implicit generative model for small molecular graphs"
 
等号と不等号の物理学
等号と不等号の物理学等号と不等号の物理学
等号と不等号の物理学
 
コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?コンピュータは知恵熱を出すか?
コンピュータは知恵熱を出すか?
 
身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線身体の中の小宇宙:免疫研究の最前線
身体の中の小宇宙:免疫研究の最前線
 
Collaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the CrowdCollaborative 3D Modeling by the Crowd
Collaborative 3D Modeling by the Crowd
 
汝は計算機なりや?
汝は計算機なりや?汝は計算機なりや?
汝は計算機なりや?
 
アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―アナログとはなんだろう。―古くて新しい、もう一つの計算―
アナログとはなんだろう。―古くて新しい、もう一つの計算―
 
AnnoTone (CHI 2015)
AnnoTone (CHI 2015)AnnoTone (CHI 2015)
AnnoTone (CHI 2015)
 
色字共感覚と書記素学習
色字共感覚と書記素学習色字共感覚と書記素学習
色字共感覚と書記素学習
 
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時埋め込みによる編集支援AnnoTone: 高周波音の映像収録時埋め込みによる編集支援
AnnoTone: 高周波音の映像収録時 埋め込みによる編集支援
 
立体音響とインタラクション
立体音響とインタラクション立体音響とインタラクション
立体音響とインタラクション
 
SIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" SessionSIGGRAPH 2014 Preview -"Shape Collection" Session
SIGGRAPH 2014 Preview -"Shape Collection" Session
 
Overview of User Interfaces
Overview of User InterfacesOverview of User Interfaces
Overview of User Interfaces
 
Brief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial InterfacesBrief Introduction to Recent Spatial Interfaces
Brief Introduction to Recent Spatial Interfaces
 

Single-cell pseudo-temporal ordering 近年の技術動向

  • 2. 参考文献 (括弧内はソフトウェア/アルゴリズム名) 1. Trapnell, Cole, et al. "The dynamics and regulators of cell fate decisions are revealed by pseudotemporal ordering of single cells." Nat. biotechnol. 32.4 (2014): 381-386. (Monocle 1) 2. Marco, Eugenio, et al. "Bifurcation analysis of single-cell gene expression data reveals epigenetic landscape." PNAS 111.52 (2014): E5643-E5650. (SCUBA) 3. Setty, Manu, et al. "Wishbone identifies bifurcating developmental trajectories from single-cell data." Nat. biotechnol. 34.6 (2016): 637. (Wishbone) 4. Haghverdi, Laleh, et al. "Diffusion pseudotime robustly reconstructs lineage branching." Nat. methods (2016): 041384. (DPT) 5. Qiu, Xiaojie, et al. "Reversed graph embedding resolves complex single-cell trajectories." Nat. methods (2017). (Monocle 2, RGE)
  • 3. Single-cell biology 組織中の細胞ごとの表現型の 違いを捉える実験・分析手法. IHC, FACSなどlow-throughput ↔ オミックス(バルク分析) 目的となる知見 • 組織内の遺伝型多様性, 変異 • 同種細胞間の表現型多様性 • 異種細胞の組織内空間分布 (Navin et al., 2011: breast cancer CNV) • 細胞種同士の分化関係 Junker, Jan Philipp, and Alexander van Oudenaarden. "Every cell is special: genome-wide studies add a new dimension to single-cell biology." Cell 157.1 (2014): 8-11. → High-throughput+single-cellへ
  • 4. Single-cell transcriptome Single-cell real-time PCR • Guo et al., 2010: マウス胚500細胞48遺伝子の発現量測定 → PCAを用いて3胚葉への早期分化マーカーを特定 • 同時に計測できるのは数十遺伝子程度が限界 scRNA-seq • 細胞ごとにゲノムワイドなトランスクリプトームを計測する • 逆転写時に各細胞でユニークなバーコード配列を結合,シーケンス後にどの細胞 由来のリードか区別 (Hashimshony et al., 2012; Islam et al., 2011) ※single-cell mass-cytometry (プロテオーム) • 様々なタンパク質に重金属修飾抗体を結合, ToF質量分析で同時定量
  • 5. scRNA-seqの技術発展 Svensson, Valentine, Roser Vento-Tormo, and Sarah A. Teichmann. "Exponential scaling of single-cell RNA-seq in the last decade.", arXiv:1704.01379 [q-bio.GN] 実験あたりシーケンス細胞数 • 2011年ごろ〜100個程度 • 2017年現在100万個が視野に ※数百〜数万細胞での実験が典型的 バーコード手法の進化 • STRT-seq (Islam et al., 2011) 細胞ごとにチューブに分離 • Drop-seq (Macosko et al., 2015) ユニークプライマー入り液滴に細胞分離 • Combinatorial index (Cao et al., 2017) バーコード配列のin situ逆転写を繰り返す
  • 6. Tissue homeostasis and development 組織内には様々な分化段階の細胞が恒常的な割合で共存している →「ある時点に組織に含まれる細胞集団には、 ひとつひとつの細胞が辿る各瞬間の状態に 対応した姿の細胞が含まれている」(仮定) cf. エルゴード性 (ergodicity) ≡アンサンブル(集団)平均と時間平均が等しい 一時点での組織のsingle cell解析により、 組織内の細胞分化ダイナミクスが分かる! リンパ系,造血系など
  • 7. Pseudo-temporal ordering (PT, 偽時系列解析) 入力 • single-cell methodで得られたデータ (e.g., scRNA-seq, mass cytometry, Hi-C) 出力 • 各細胞の時間的順序 (または代表的な時系列) • 分岐(bifurcation)パターンとその位置の特定 入力例:高次元発現プロファイル 細胞 細胞 低次元空間にマッピング (手法による)
  • 8. PTの基本的なアイデア 仮定 • 分化に伴い表現型は連続的に変化する → 時間的に近い細胞は高次元空間内で近接 • 組織中には分化経路上のあらゆる段階の細胞が まんべんなく存在している アプローチ • 細胞の高次元空間中での分布を調べる • 列をなしていれば、それが時系列変化 • 枝分かれがあれば、それが分岐的分化 Furusawa, Chikara, and Kunihiko Kaneko. "A dynamical-systems view of stem cell biology." Science 338.6104 (2012): 215-217.
  • 9. 近年のPT研究の発展 2011〜2013年ごろ • 各種single-cell技術が登場 (real-time PCR, scRNA-seq, mass cytometry) 2014年 (pseudo-temporal analysis黎明) • Wanderlust, Monocle, SCUBA → 複数時刻でサンプリングしたデータが主な対象.単純な次元削減+グラフ解析 2016年 • Wishbone, TSCAN, DPT → ~万クラスの細胞数+ゲノムワイドデータへの対応 2017年 • RGE (Monocle 2)
  • 10. PTアルゴリズムの比較軸 入力データの複雑さ • 数十次元 (mass cytometry向け) 〜 超高次元 (genome wide) 次元削減・データ表現の方法 • 高次元データからどうやって低次元構造を抽出するか (PCA, ICA, diffusion mapなど) 分岐検出 • 非対応, 2分岐のみ, 多分岐対応 生物学的事前知識・教師データの利用 • マーカー遺伝子, 分岐数などの情報 他、真の複数時刻測定に対して分岐解析を行う機能を持つもの(SCUBA)など
  • 11. 主なPT手法 (2014年以降のpublication) https://github.com/agitter/single-cell-pseudotime Monocle / Monocle 2 (Census) / Wanderlust / Cycler / Wishbone / SCUBA / DPT / Oscope / Diffusion maps / destiny / DeLorean / Waterfall / Embeddr / GP-LVM / pseudogp / GP-LVM / SLICER / TSCAN / SCOUP / Topslam / Ouija / Slingshot / Gpfates / SCIMITAR / WaveCrest / LEAP / CellTree / Bayesian hierarchical mixture of factor analysers (MFA) / Mpath / SCORPIUS / SCODE / switchde / MAGIC / PHATE / SOMSC / TASIC / FORKS / UNCURL / reCAT / PhenoPath / Branched Gaussian processes / Branch-recombinant Gaussian Processes / MATCHER / SoptSC / Di-SNE / Population Balance Analysis / Scanpy / etc. 得意とする細胞数や遺伝子数,生物学的プロセスが違う(あと、論文書きやすいのではないだろうか…)
  • 12. Monocle [Trapnell et al., 2014] 特徴 ベンチマーク標準.広く使われている 戦略 次元削減(独立成分分析)+スパイン検出 (最小全域木) 評価 ヒト筋芽細胞の分化を複数時刻でscRNA-seq → 既知マーカー再現+新転写因子提案 長所 多遺伝子データセットに適用可能 短所 数百細胞程度までしか安定動作しない 分岐数はマニュアル指定 https://bioconductor.org/packages/release/bioc/html/monocle.html
  • 13. Monocle - 独立成分分析 (FastICA) PCAに似た目的の処理 正規分布(ガウス性)を仮定しない • 混合モデル • 分離モデル Wを最適化してuの独立性を最大化 ※独立性≡KLダイバージェンス 観測データ 分離信号 FastICA: xを白色化して|W|=1の直交行列に限定 https://www.slideshare.net/sfchaos/numpy-scipy-9039097
  • 14. Monocle - スパイン検出 最小全域木 (MST) • 全細胞を含む最小のネットワーク • 一番長く取れる経路=スパイン 順序付け&分岐検出 (PQ-tree) • スパインに沿って順序付け • スパイン上の同じ細胞から伸びた 枝どうしは順不同 • 上の制約を満たしつつ 全距離最小の全順序を 偽時系列として出力 • 分岐は指定回数だけ スパインの次に長い経路を取る
  • 15. SCUBA [Marco et al., 2014] 特徴 実時系列single-cellデータの分岐階層分析が主機能. 戦略 次元削減(t-SNE)+主経路検出 (principal curve analysis) 評価 B細胞分化のmass cytometry (2万細胞) → 偽時系列のCD群増減が既知の振る舞いと一致 長所 シンプルな実装, 多細胞データへの対応 短所 分岐検出は不完全 https://github.com/gcyuan/SCUBA
  • 16. SCUBA – principal curve Hastie, Trevor, and Werner Stuetzle. "Principal curves." Journal of the American Statistical Association 84.406 (1989): 502-516. 離散的なデータについては折れ線を作る. 各頂点 xi について、 • V = {xiの近傍のデータ点 yj} として • xi = E[yj ∈ V] を満たすような折れ線がprincipal curve. 実際は反復的最適化で計算する.
  • 17. Wishbone [Setty et al., 2016] 特徴 二又分岐に特化,mass cytometryが主なターゲット 戦略 次元削減 (diffusion map) + 最短路ベース経路 (kNN-graph) 評価 マウス胸腺 CD4+/CD8+分化 (23万細胞, 表面マーカmass cytometry) → DN,DP,SPの分化経路を多CDで正しく再現 長所 高精度な分岐判定 短所 高次元データには対応しない scRNA-seqではマーカー選択が必須 http://www.c2b2.columbia.edu/danapeerlab/html/wishbone.html
  • 18. Wishbone – diffusion maps Coifman, Ronald R., and Stéphane Lafon. "Diffusion maps." Applied and computational harmonic analysis 21.1 (2006): 5-30. 要素の類似性にもとづく高次元 データの次元削減手法 1. 集合をグラフ表現 2. ランダムウォークで類似性計算 3. 類似性(遷移)行列を対角化 4. 固有値が大きい固有ベクトルが 粗視化空間を張る
  • 19. Wishbone – kNN-graphによる分岐判定 • 低次元空間内でkNNを結んだネット ワークを作る • ランダムに選ばれた複数の細胞それぞ れ(waypoints)から他の各細胞までの 最短距離を計算 • global trajectoryは近隣のwaypointに 重みを付けてコンセンサスを取る • Aを開始点, BとCをwaypointとして d(A,B) < d(A,C)とする • もしA,B,Cが同じ経路上にあれば d(A,B) + d(B,C) ≈ d(A, C)
  • 20. DPT [Haghverdi et al., 2016] 特徴 次元圧縮を行わない,密度分析による準安定状態検出 戦略 遷移確率行列をプロファイルに用いる+シンプルな分岐検出 評価 マウス造血系qPCR (赤血球/内皮分化), ES細胞scRNA-seq → 既知の発現パターンを再現 長所 ロバストネス スケーラビリティ(?) 短所 複雑な分岐パターンには対応しない(?) diffusion parameterの非自明な調整が必要
  • 21. DPT - アルゴリズム • 距離行列の構成はWishboneと類似 • 開始細胞からの距離で見た順序と,最遠隔細胞からの距離で見た順序を比較 • もし分岐がなければ常に逆相関する • 分岐地点では二つの順序が正の相関を示す
  • 22. RGE (Monocle 2) [Qiu et al., 2017] 特徴 反復的戦略,高次元空間内でのprincipal graph (木構造) 生成 戦略 低次元空間での経路予測と高次元空間でのデータ操作を反復 評価 筋芽細胞ゲノムワイドscRNA-seq → 分化経路依存の887遺伝子を特定 長所 分岐モデルなど事前知識が不要 短所 ?
  • 24. 今後の課題 • 10万〜細胞×ゲノムワイド入力に対応するスケーラビリティ • 少数遺伝子変化へのセンシティビティ (cocktail party) • 細胞分布の偏りに対する頑強性 • 階層的な分岐構造の自動検出 • cell cycleなど分化と無関係なダイナミクスの自動検出 • などなど…

Notes de l'éditeur

  1. STRT-Seq: Single-cell Tagged Reverse-Transcription Sequencing
  2. 手法の概説