Soumettre la recherche
Mettre en ligne
Kashiwa.R#9 Rでゲノム解析
•
Télécharger en tant que PPT, PDF
•
2 j'aime
•
3,404 vues
Haruka Ozaki
Suivre
Formation
Technologie
Signaler
Partager
Signaler
Partager
1 sur 27
Télécharger maintenant
Recommandé
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Haruka Ozaki
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
Amelieff
SNPデータ解析入門
SNPデータ解析入門
Amelieff
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析
Hiromi Kajiya-Kanegae
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
Amelieff
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
pinmarch_t Tada
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
Amelieff
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
Amelieff
Recommandé
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Rでゲノム上の区間データを扱う話 (15.09.05 WACODE 2nd)
Haruka Ozaki
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
Amelieff
SNPデータ解析入門
SNPデータ解析入門
Amelieff
ゲノム育種を実装・利用するためのNGSデータ解析
ゲノム育種を実装・利用するためのNGSデータ解析
Hiromi Kajiya-Kanegae
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
Amelieff
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
SNPのオープンデータを覗き見る TokyoWebmining #47 (2015.06.27)
pinmarch_t Tada
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
Amelieff
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
Amelieff
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
DNA Data Bank of Japan center
メタバーコーディングが拓く新種探索の新時代
メタバーコーディングが拓く新種探索の新時代
astanabe
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
Genaris Omics, Inc.
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
Genaris Omics, Inc.
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
Amelieff
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
Genaris Omics, Inc.
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
kazuoishii20
Exome解析入門
Exome解析入門
Amelieff
メタバーコーディングのフレームワークとアルゴリズム
メタバーコーディングのフレームワークとアルゴリズム
astanabe
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
弘毅 露崎
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
弘毅 露崎
遺伝子のアノテーション付加
遺伝子のアノテーション付加
弘毅 露崎
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
Amelieff
2014年度 第4回バイオインフォマティクス実習
2014年度 第4回バイオインフォマティクス実習
Jun Nakabayashi
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
Tetsuro Toyoda
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
Toriningen,Inc.
Rで塩基配列を扱う方法
Rで塩基配列を扱う方法
Haruka Ozaki
SIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫び
真一 藤川
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
Akira Shibata
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
Haruka Ozaki
Excelによる遺伝子名の誤変換 -傾向と対策-
Excelによる遺伝子名の誤変換 -傾向と対策-
Haruka Ozaki
距離まとめられませんでした
距離まとめられませんでした
Haruka Ozaki
Contenu connexe
Tendances
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
DNA Data Bank of Japan center
メタバーコーディングが拓く新種探索の新時代
メタバーコーディングが拓く新種探索の新時代
astanabe
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
Genaris Omics, Inc.
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
Genaris Omics, Inc.
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
Amelieff
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
Genaris Omics, Inc.
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
kazuoishii20
Exome解析入門
Exome解析入門
Amelieff
メタバーコーディングのフレームワークとアルゴリズム
メタバーコーディングのフレームワークとアルゴリズム
astanabe
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
弘毅 露崎
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
弘毅 露崎
遺伝子のアノテーション付加
遺伝子のアノテーション付加
弘毅 露崎
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
Amelieff
2014年度 第4回バイオインフォマティクス実習
2014年度 第4回バイオインフォマティクス実習
Jun Nakabayashi
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
Tetsuro Toyoda
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
Toriningen,Inc.
Tendances
(16)
[DDBJing30] メタゲノム解析と微生物統合データベース
[DDBJing30] メタゲノム解析と微生物統合データベース
メタバーコーディングが拓く新種探索の新時代
メタバーコーディングが拓く新種探索の新時代
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
CBI学会2013チュートリアル NGSデータ解析入門(実験条件編) 配布資料
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
BGI Webinar Aug 28, 2014 "Genome wide methylation analysis and analytics"
Exome解析入門
Exome解析入門
メタバーコーディングのフレームワークとアルゴリズム
メタバーコーディングのフレームワークとアルゴリズム
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
文献注釈情報MeSHを利用した網羅的な遺伝子の機能アノテーションパッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
metaSeq: RNA-seqデータにおけるメタアナリシス解析パッケージ
遺伝子のアノテーション付加
遺伝子のアノテーション付加
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
2014年度 第4回バイオインフォマティクス実習
2014年度 第4回バイオインフォマティクス実習
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
フェノタイプ情報の高度な活用によるバイオリソースの付加価値創造
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
世界のバイオ教育を革新するハードウェアNinjaPCR@IVS 2013 Fall
En vedette
Rで塩基配列を扱う方法
Rで塩基配列を扱う方法
Haruka Ozaki
SIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫び
真一 藤川
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
Akira Shibata
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
Haruka Ozaki
Excelによる遺伝子名の誤変換 -傾向と対策-
Excelによる遺伝子名の誤変換 -傾向と対策-
Haruka Ozaki
距離まとめられませんでした
距離まとめられませんでした
Haruka Ozaki
12-11-30 Kashiwa.R #5 初めてのR Rを始める前に知っておきたい10のこと
12-11-30 Kashiwa.R #5 初めてのR Rを始める前に知っておきたい10のこと
Haruka Ozaki
可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜
Takashi Kitano
160817 ISMB2016読み会
160817 ISMB2016読み会
Haruka Ozaki
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
Haruka Ozaki
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
Haruka Ozaki
巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table について
Haruka Ozaki
ドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoR
Shuyo Nakatani
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Yohei Sato
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
takehikoihayashi
変分ベイズ法の説明
変分ベイズ法の説明
Haruka Ozaki
時系列分析による異常検知入門
時系列分析による異常検知入門
Yohei Sato
基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料
at grandpa
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
Ken'ichi Matsui
統計学の基礎の基礎
統計学の基礎の基礎
Ken'ichi Matsui
En vedette
(20)
Rで塩基配列を扱う方法
Rで塩基配列を扱う方法
SIer出身者を採用したい非SI経験+採用責任者の叫び
SIer出身者を採用したい非SI経験+採用責任者の叫び
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
LHCにおける素粒子ビッグデータの解析とROOTライブラリ(Big Data Analysis at LHC and ROOT)
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
ISMB2014読み会 Ragout—a reference-assisted assembly tool for bacterial genomes
Excelによる遺伝子名の誤変換 -傾向と対策-
Excelによる遺伝子名の誤変換 -傾向と対策-
距離まとめられませんでした
距離まとめられませんでした
12-11-30 Kashiwa.R #5 初めてのR Rを始める前に知っておきたい10のこと
12-11-30 Kashiwa.R #5 初めてのR Rを始める前に知っておきたい10のこと
可視化周辺の進化がヤヴァイ 〜2016〜
可視化周辺の進化がヤヴァイ 〜2016〜
160817 ISMB2016読み会
160817 ISMB2016読み会
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
トピックモデル勉強会: 第2章 Latent Dirichlet Allocation
FDRの使い方 (Kashiwa.R #3)
FDRの使い方 (Kashiwa.R #3)
巨大な表を高速に扱うData.table について
巨大な表を高速に扱うData.table について
ドラえもんでわかる統計的因果推論 #TokyoR
ドラえもんでわかる統計的因果推論 #TokyoR
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
Rで学ぶ 傾向スコア解析入門 - 無作為割り当てが出来ない時の因果効果推定 -
傾向スコア:その概念とRによる実装
傾向スコア:その概念とRによる実装
変分ベイズ法の説明
変分ベイズ法の説明
時系列分析による異常検知入門
時系列分析による異常検知入門
基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 2章 勉強会資料
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
基礎からのベイズ統計学 輪読会資料 第1章 確率に関するベイズの定理
統計学の基礎の基礎
統計学の基礎の基礎
Similaire à Kashiwa.R#9 Rでゲノム解析
RNASkim
RNASkim
弘毅 露崎
kita m
kita m
harmonylab
R spec勉強会
R spec勉強会
Tatsunori Nishikori
Tokyo r50 beginner_2
Tokyo r50 beginner_2
Takashi Minoda
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
Itoshi Nikaido
ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel
弘毅 露崎
Protein-RNA Interaction Prediction
Protein-RNA Interaction Prediction
Masahito Ohue
Protein-protein docking-based virtual screening
Protein-protein docking-based virtual screening
Masahito Ohue
ENCODE勉強会
ENCODE勉強会
Itoshi Nikaido
データサイエンスワールドからC++を眺めてみる
データサイエンスワールドからC++を眺めてみる
Shintaro Fukushima
drbonodojo3-6 データ統合解析
drbonodojo3-6 データ統合解析
Yoshiaki Yasumizu
Tokyowebmining41
Tokyowebmining41
Tokyo Medical and Dental University
Yamadai.Rデモンストレーションセッション
Yamadai.Rデモンストレーションセッション
考司 小杉
Protein-Protein Interaction Prediction
Protein-Protein Interaction Prediction
Masahito Ohue
Similaire à Kashiwa.R#9 Rでゲノム解析
(14)
RNASkim
RNASkim
kita m
kita m
R spec勉強会
R spec勉強会
Tokyo r50 beginner_2
Tokyo r50 beginner_2
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
0.1 pg の mRNA をシーケンスする高精度なRNA-Seq法: Quartz-Seq
ISMB読み会 2nd graph kernel
ISMB読み会 2nd graph kernel
Protein-RNA Interaction Prediction
Protein-RNA Interaction Prediction
Protein-protein docking-based virtual screening
Protein-protein docking-based virtual screening
ENCODE勉強会
ENCODE勉強会
データサイエンスワールドからC++を眺めてみる
データサイエンスワールドからC++を眺めてみる
drbonodojo3-6 データ統合解析
drbonodojo3-6 データ統合解析
Tokyowebmining41
Tokyowebmining41
Yamadai.Rデモンストレーションセッション
Yamadai.Rデモンストレーションセッション
Protein-Protein Interaction Prediction
Protein-Protein Interaction Prediction
Dernier
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
YukiTerazawa
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
koheioishi1
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ssusere0a682
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
Takayuki Itoh
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ssusere0a682
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
yuitoakatsukijp
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
Tokyo Institute of Technology
Dernier
(7)
TokyoTechGraduateExaminationPresentation
TokyoTechGraduateExaminationPresentation
The_Five_Books_Overview_Presentation_2024
The_Five_Books_Overview_Presentation_2024
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習106 -価格の交渉ゲーム-#ゲーム理論 #gametheory #数学
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
生成AIの回答内容の修正を課題としたレポートについて:お茶の水女子大学「授業・研究における生成系AIの活用事例」での講演資料
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
ゲーム理論 BASIC 演習105 -n人囚人のジレンマモデル- #ゲーム理論 #gametheory #数学
UniProject Workshop Make a Discord Bot with JavaScript
UniProject Workshop Make a Discord Bot with JavaScript
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
東京工業大学 環境・社会理工学院 建築学系 大学院入学入試・進学説明会2024_v2
Kashiwa.R#9 Rでゲノム解析
1.
13.10.11 Kashiwa.R#9 @
駒場キャンパス ゲノム解析で R を使う ゲノム解析で R を使う ゲノム解析で R を使う @yuifu おざきはるか 概要 : ゲノム解析,配列解析, NGS 解析などで R を実際にどう使っているかを紹介しま す. 1
2.
ゲノム • 生物の遺伝情報の全て http://en.wikipedia.org/wiki/File:NHGRI_human_male_karyotype.png 2
3.
ゲノム(データとしての) • 文字列 • 4種類の文字(塩基) •
とても長い http://www.sciencedaily.com/releases/2009/10/091014130702.htm 3
4.
ゲノム上のデータ • どこに何があるか • 遺伝子 •
転写イベント • 化学修飾 http://dpb.carnegiescience.edu/labs/huala-lab/projects/genome-annotation 4
5.
ゲノム解析 • ゲノムの部分文字列に対する解析 • ゲノム上の区間に対する解析 http://www.pharmainfo.net/articles/homology-modeling-family-39-glycoside-hydrolase-clostridium-thermocellum http://bedtools.readthedocs.org/en/latest/content/tools/complement.html 5
6.
今日の内容 • 「 R
でこんなこともできるんだ」という紹介 • コードの説明はあまりしません(あとで自分で試してみてください) 6
7.
Bioconductor http://bioconductor.org 7
8.
ゲノム配列を手元に持ってくる library(BSgenome) # Bioconductor のアノテーションパッケージとして利用可能なゲノムの一覧
available.genomes() # Fruit fly のゲノムをインストール source("http://bioconductor.org/biocLite.R") # chooseBioCmirror()biocLite("BSgenome.Dmelanogaster.UCSC.dm3") # パッケージを読み込む library(BSgenome.Dmelanogaster.UCSC.dm3) # BSgenome オブジェクトとしてのゲノム配列 Dmelanogaster 8
9.
あるモチーフの出現回数を数える # IUPAC code
でモチーフを定義 RRE <- "WAWNTRGGTCA" # Fruit fly のゲノム配列全体から, RRE にマッチする箇所をカウント count.RRE <- vcountPattern(RRE, Dmelanogaster, fixed=c(pattern=FALSE, subject=TRUE)) # ヒストグラムで結果を表示 library(ggplot2)p <- ggplot(count.RRE, aes(x=paste(seqname,strand), y=count)) + geom_histogram() + theme(axis.text.x=element_text(angle=90, hjust = 1))plot(p) 9
10.
遺伝子配列をたくさんとってくる # Ensembl データベースを使う library(biomaRt)ensembl
<- useMart("ensembl") ensembl <- useDataset("drerio_gene_ensembl", mart=ensembl) id <- c("ENSDARG00000044774", "ENSDARG00000070913") # cDNA 配列の取得 seq <- getSequence(id=id, type="ensembl_gene_id", seqType="cdna", mart=ensembl) # pre-mRNA 配列(エキソン+イントロン)の取得 seq <- getSequence(id=id, type="ensembl_gene_id", seqType="gene_exon_intron", mart=ensembl) # FASTA 形式での保存 library(Biostrings)dna <- DNAStringSet(seq[,1])names(dna) <- seq[,2]writeXStringSet(dna, file="hoge.fa", format="fasta") http://qiita.com/yuifu/items/a757629506c1cd98156b 10
11.
RNA-seq から発現変動遺伝子を抽出する • RNASeqDataSubset
( RNA-seq のテストデータ) • 組織 : マウスの心臓 • 実験条件 : TBX20 KO マウス と 野生型マウス • 予備知識 : TBX20 は心臓の発生と機能に不可欠な転写因子 • 軽くするために, chr19 のみ • mm9 にマップ(最新は mm10 なので注意) 11
12.
RNA-seq から発現変動遺伝子を抽出する • データへのアクセス(テストデータ) #
Data ( テストデータ )source("http://bioconductor.org/biocLite.R")biocLite("RNASeqDataSubset")library("RNASeqDataSubset") # BAM ファイルの一覧を取得 fls <- RNASeqDataSubset::getBamFileList() > fls SRR316184 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316184.bam" SRR316185 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316185.bam" SRR316186 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316186.bam" SRR316187 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316187.bam" SRR316188 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316188.bam" SRR316189 "/Library/Frameworks/R.framework/Versions/2.15/Resources/library/RNASeqDataSubset/extdata/SRR316189.bam" 12
13.
RNA-seq から発現変動遺伝子を抽出する • メタデータの取得 #
メタデータの取得 fn <- system.file("extdata", "phenoData.txt", stringsAsFactors=FALSE) package="RNASeqDataSubset")pd <- read.table(fn, header=TRUE, > pd SRX SRR GSM condition replicate1 SRX085099 SRR316184 GSM767225 normal 12 SRX085100 SRR316185 GSM767226 normal 23 SRX085101 SRR316186 GSM767227 normal 34 SRX085102 SRR316187 GSM767228 Tbx20 knockout 15 SRX085103 SRR316188 GSM767229 Tbx20 knockout 26 SRX085104 SRR316189 GSM767230 Tbx20 knockout 3 どんなバイオロジカルな implication が得られるかまで 13
14.
RNA-seq から発現変動遺伝子を抽出する • カウントテーブルの作成 •
各サンプルで各遺伝子にマップされたリード数の表 • 行数=遺伝子数,列数=サンプル数 • 今回は Bioconductor の easyRNAseq で作成する 14
15.
RNA-seq から発現変動遺伝子を抽出する # easyRNASeq source("http://bioconductor.org/biocLite.R")biocLite("easyRNASeq")library(easyRNASeq) listMarts(host="may2012.archive.ensembl.org")count.table
<- easyRNASeq(filesDirectory=dirname(fls)[1], filenames=basename(fls), gapped=TRUE, annotationMethod="biomaRt", organism="Mmusculus", count="genes", summarization="geneModels", host="may2012.archive.ensembl.org", nbCore=2) • HTSeq • GTF ファイルのダウンロード • http://feb2012.archive.ensembl.org/info/data/ftp/index.html > head(count.table) SRR316184.bam SRR316185.bam SRR316186.bam SRR316187.bam SRR316188.bamENSMUSG00000001750 98 107 88 446 386ENSMUSG00000003053 1 0 0 0 0ENSMUSG00000003228 2 0 2 11 8ENSMUSG00000003555 6 8 6 29 17ENSMUSG00000003559 8 2 1 5 6ENSMUSG00000003680 37 51 40 187 232 SRR316189.bamENSMUSG00000001750 381ENSMUSG00000003053 0ENSMUSG00000003228 5ENSMUSG00000003555 13ENSMUSG00000003559 4ENSMUSG00000003680 301 15
16.
RNA-seq から発現変動遺伝子を抽出する • 2条件間で発現が変動した遺伝子を抽出する #
DESeqcondition <- pd$condition[match(paste0(pd$SRR,".bam"), colnames(count.table))]names(condition) <colnames(count.table)library(DESeq)cds <- newCountDataSet(countData=count.table, conditions=condition)cds <estimateSizeFactors( cds )sizeFactors(cds) cds <- estimateDispersions( cds ) res <- nbinomTest( cds, "normal", "Tbx20 knockout" )res <- res[order(res$padj),] sum(res$padj < 0.01,na.rm=TRUE) plotMA(res) deg <- res[res$padj < 0.01 & !is.na(res$padj),] 16
17.
ChIP-seq でタンパク質のゲノム上の結合位置を検出できる http://www.illuminakk.co.jp/document/pdf/datasheet_chip_sequence-J.pdf より引用 17
18.
異なる転写因子の ChIP-seq を比較すると協調関係がみえてくる Cho
et al. Nature (2012) 18
19.
この転写因子の機能を知りたい • この転写因子のターゲットを知りたい • この転写因子の結合する配列(モチーフ)を知りたい • この転写因子が協調する転写因子を知りたい X Y Z W 19
20.
テストケース : 体内時計の分子機構 • 3
つの結合モチーフ • • D-box • • E-box RRE 転写因子 • 正 • 負 Ukai & Ueda, Annual Review of Physiology (2010) 20
21.
Cho et al,
Nature (2012) 21
22.
ステップ1 : ChIP-seq
のピークを検出する( R の 外) • リード( NGS データ)をゲノ ム配列にマッピング(アライン メント) • • • Bowtie BWA ピークを検出する • MACS • GPS http://www.illuminakk.co.jp/document/pdf/datasheet_chip_sequence-J.pdf より引用 22
23.
ステップ 2: ピークがどんな遺伝子の近くにあるか library(Biostrings) bedFile2
<- "~/Desktop/GSM840529_ReverbB_4086_peaks.txt"reverba.gr <BED2RangedData(read.table(bedFile1, header=T, sep="t")) # Load TSS annotation library(biomaRt) mart = useMart(biomart = "ENSEMBL_MART_ENSEMBL", dataset = "mmusculus_gene_ensembl", host="www.ensembl.org") tss <- getAnnotation(mart, featureType = "TSS") # Annotate peaks library(ChIPpeakAnno)reverba.annot = annotatePeakInBatch(reverba.gr, AnnotationData = tss, output="both") #, maxgap = 0) Cho et al. Nature (2012) 23
24.
ステップ 3: 複数の
ChIP-seq と比較する bedFile1 <- "~/Desktop/GSM840528_ReverbA_4086_peaks.txt"bedFile2 <"~/Desktop/GSM840529_ReverbB_4086_peaks.txt"data1 <BED2RangedData(read.table(bedFile1, header=T, sep="t"))data2 <BED2RangedData(read.table(bedFile2, header=T, sep="t"))strand(data1) <"*"strand(data2) <- "*"data1.data2.overlap <- findOverlappingPeaks(data1, data2, annotate=1)# pie(table(data1.data2.overlap$OverlappingPeaks$overlapFeature) ) head(data1.data2.overlap$OverlappingPeaks$overlapFeature)data1.data2.over lap.count <makeVennDiagram( RangedDataList(data1,data2), NameOfPeaks = c("Data1", "Data2"), maxgap=0, minoverlap =1, totalTest = 100, useFeature=FALSE) venn( list( Reverba=c( rep(0, nrow(data1) nrow(data1.data2.overlap$Peaks1withOverlaps)), rep(1,nrow(data1.data2.overlap$Peaks1withOverlaps) ) ), Reverbb=c( rep(2, nrow(data2) - nrow(data1.data2.overlap$Peaks2withOverlaps)), rep(1,nrow(data1.data2.overlap$Peaks2withOverlaps) ) ))) 24
25.
ステップ 4: GO
解析をする # Load genome-wide annotation for mouselibrary(org.Mm.eg.db)reverba.go <getEnrichedGO( reverba.annot, orgAnn = "org.Mm.eg.db", maxP = 0.01, multiAdj = TRUE, minGOterm = 10, multiAdjMethod = "BH")# Top results for GO Molecular Functionreverba.go.mf <unique(reverba.go$mf[order(reverba.go$mf[,1 0]), c(2,10)]) go.term BH.adjusted .p.value cytoskeletal protein binding 2.77E-06 GTPase regulator activity 3.79E-06 protein binding 1.04E-05 phospholipid binding 1.04E-05 nucleoside-triphosphatase regulator activity 1.04E-05 enzyme binding 2.26E-05 protein complex binding 7.09E-05 ion binding 1.17E-04 cation binding 1.66E-04 metal ion binding 1.66E-04 25
26.
今後の展開 • 遺伝子発現との関連 • • WT ,変異体 モチーフ解析 • 共通部分と独自部分でそれぞれ • • → 新たな協調因子 別の
ChIP-seq データとの比較 • Rev-Erbα Rev-Erbβ → 新たな協調因子 ??? Cho et al. Nature (2012) http://molbio.mgh.harvard.edu/sheenweb/PromoterATAK&MZ06.html より引用 ??? 26
27.
課題(誰か教えてください) • makeTranscriptDbFromBiomart で古い
Ensembl のアーカイブにアクセスす る方法 • ゲノム配列に基づいてアノテーションはつくられるため,ゲノム配列の バージョンが新しくなると,デフォルトでは新しいゲノム配列に基づく • 例) Dec. 2011 からマウスゲノム mm10 がリリースしたため, Ensembl のアノテーションは Jul. 2012 からは mm10 ベースになっている • 以下ではエラーが出る > pwf <- nullp(genes, "mm9", "ensGene")Loading mm9 length data... 以下にエラー qr.R(qrx) : ルが見つかりませんでした ジエネリック関数の環境中に "..." というシンボ 28
Télécharger maintenant