Large-scale imputation of epigenetic datasets for systematic annotation of diverse human tissues
1. Large-scale imputation of epigenetic
datasets for systematic annotation
of diverse human tissues
2015/3/17
Epigenome Roadmap 輪読会
RIKEN ACCC BiT
露崎弘毅
7. 提案手法 : ChromImpute法
sample c ?
mark m
sample c
mark m
sample c
mark m
?
周囲500bpくらい
推定するときの重み(カバレッジが厚いところほど優先)
カバレッジ
ポジション
周りのマッピング状況から、欠損値を回帰モデルで推測する
8. 補足 : アンサンブル回帰木
回帰木 : 区間毎に値を推定する(非線形な回帰をやりたかったから使った)
scikit-learn 1.8 Decision Treesより
アンサンブル回帰木 : 木を沢山書いて、平均をとる
要するにバギング、ブートストラップ集約(Random Forestではない?)
Regression tree ensembles in the
perspective of kernel-based methodsより
1個の回帰木 100個の回帰木の平均