SlideShare une entreprise Scribd logo
1  sur  14
がんゲノムのエクソーム解析


            2012年5月24日
           アメリエフ株式会社




    Copyright © Amelieff Co. Ltd. All Rights Reserved
要旨
次世代シーケンサー(NGS)から出力される膨大なデータから、生物学的意味付けまでの一連の解析を、常に
最新の解析ツールにアップグレードできるフレキシブルなパイプラインの構築は、研究の効率化に有効である。
我々は、GATK、SAMtools、VarScanなどを用いて、がん細胞と正常細胞から、ソマティックな変異を検出するた
めの、解析パイプラインの構築を行った。

                                  <ソマティック変異を検出する流れ>
【方法1 】
 SAMtoolsを用いて、がん細胞と正常細胞から    intersectBedなどで                                               偽陽性を除外するために
       各々のSNV/Indelを検出 →  がん細胞特異的なSNV/Indelを抽出 →                                      GATKでも検出されたSNV/Indelを検出



         Tumor.vcf   Normal.vcf                  Somatic?                                 Somatic!



【方法2】
                                                                                          偽陽性を除外するために
SAMtoolsを用いてpileupファイルを出力         →       VarScanを用いてSNV/Indel検出                 →    GATKでも検出されたSNV/Indelを検出

  Tumor.pileup Normal.pileup                                                                         Somatic
                                      Germline     Somatic      LOH        Unknown                   Somatic!
※Pileupを入力することで、各々のマッピング情報を
 比較しながらソマティックな変異を検出できる


                     方法1と2はどちらが有効なのか?? 考慮すべき問題点は?
                                                                                                                2
                                  Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
■データ
Nature Genetics Volume: 43, Pages: 875–878 Year published: (2011) DOI: doi:10.1038/ng.907 Received 13 May 2011 Accepted 15 July
2011 Published online 07 August 2011

Frequent mutations of chromatin remodeling genes in transitional cell carcinoma of the
bladder
 ・移行上皮癌(TCC)は、膀胱癌の中で発生頻度が最も高い。
 ・Discovery screenとして、患者9人のエキソーム解析を行った。
 ・Prevalence Screenとして、発見された全ての変異遺伝子に対して、異なったステージとグレードの患者88人の試料を用いてスクリーニングを行った。
 ・患者97人のうち59% にクロマチンリモデリングにかかわる遺伝子(UTX、MLL-MLL3、CREBBP-EP300、NCOR1、ARID1A、CHD6)に変異が認められた。
 ・UTX は、ステージとグレードのより低い腫瘍において、はるかに高い頻度で変化しているため、膀胱癌における分類と診断において役に立つ可能性
  がある。
 ・クロマチン制御の異常が膀胱癌の特徴であることを示唆した。


上記のデータのうち、下記の4検体8サンプルを使用した。
      ・ Illumina Genome Analyzer IIを使用した。
      ・NimbleGen Sequence Capture 2.1M Exome Array(SeqCap EZ Exome発売前の商品)を使用した。


                             num     SRR          SRX           sample
                              1      SRR290592 SRX079167 B2_Blood
                              2      SRR290593 SRX079168 B2_Cancer
                              3      SRR290594 SRX079169 B8_Blood
                              4      SRR290597 SRX079172 B8_Cancer
                              5      SRR290595 SRX079170 B9_Blood
                              6      SRR290598 SRX079173 B9_Cancer
                              7      SRR290599 SRX079174 B10_Blood
                              8      SRR290600 SRX079175 B10_Cancer                                                          3
                                          Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
■ソフトウェア

              1. FastQC                  : FastqファイルのQC
     QC       2. FastX                   : Fastqファイルをフィルタリング
              3. TagCleaner              : 混入しているアダプターを予測
              4. compfastq               : ペアリードのうち片側のみのリードを除外

  Mapping     1. BWA                     : アライメント&マッピング
              2. Picard                  : 重複リードの除去

              1. SAMtools                : SNV/Indel検出、BAMファイル操作
  SNV/Indel   2. VarScan                 : Tumor/Normal比較
              3. GATK                    : SNV/Indel検出、カバレージ算出
              4. QuickAnnotator          :アノテーション付与

    集計        1. snpEFF  :アノテーション付与/集計
              2. 弊社開発スクリプト
                                                                          4
                                                                          4
                      Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
 ■エクソーム解析の手順
                                                                                           参考コマンド
                  FASTQ形式チェック
   QC                                                                     # FASTQデータのクオリティチェック
                                                                            htmlやサマリーが出力される
             データクオリティチェック(FastQC)
                                                                          $ fastqc -o FILE -f fastq FILE1.fastq
                                                                          # クオリティ20未満の塩基が80%以上のリードを除去
             Illumina CASAVA filter [Y] を除去
                                                                          $ fastq_quality_filter -i FILE1.fastq -o
Mapping                                                                   FILE1.qual.fastq -q 20 -p 80 -Q 33 -v
              クオリティ20未満が80%以上の
                   リードを除去                                                 # クオリティ20未満の末端をトリム
                                                       弊社開発
                                                       スクリプト              $ prinseq-lite.pl -fastq FILE1.qual.fastq -
              クオリティ20未満の末端をトリム                        Qcleaner使用          out_format 3 -log -trim_qual_right 20 -
                                                                          trim_qual_left 20
SNV/Indel
             未知の塩基(N)が多いリード除去                                             # 配列長が20未満のリード除去
                                                                          $ prinseq-lite.pl -fastq
                配列長が短いリード除去                                               FILE1_prinseq_good_Su1_.fastq -
                                                                          out_format 3 -min_len 20
  集計             片側のみのリードを除外


             データクオリティチェック(FastQC)

            ※Qcleanerの詳細につきましてはT38のポスター、または、アメリエフのブースへお越しください。
                                                                                                                     5
                             Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
                                                                                       参考コマンド
 ■エクソーム解析の手順
                                                                     # アライメント
                                                                     $ bwa aln -t 4 hg19.fa FILE1.treated.fastq -f
                                                                     FILE1.sai
                  アライメント
   QC                                                                # マッピング→BAMに変換→ソート
                                                 BWA
                  マッピング                                              $ bwa sampe -r
                                                                     "@RG¥tID:FILE¥tSM:FILE¥tPL:Illumina" -n
                SAMファイルを                                             3 -N 10 -a 500 hg19.fa FILE1.sai FILE2.sai
              BAMファイルに変換                                             FILE1.treated.fastq FILE2.treated.fastq |
Mapping                                                              samtools view -Sb - | samtools sort -
                                                 SAMtools            FILE.sorted
              BAMファイルをソート
                                                                     # Duplicated reads を除去
            BAMファイルをインデキシング                                          $ java -jar MarkDuplicates.jar
                                                                     I=FILE.sorted.bam
SNV/Indel    Duplicated reads を除去                Picard              O=FILE.sorted.redup.bam
                                                                     METRICS_FILE=jeter.metrics
               カバレージを計算                          BEDtools            REMOVE_DUPLICATES=true
                                                                     ASSUME_SORTED=true
                                                 SAMtools            VALIDATION_STRINGENCY=SILENT
  集計            SNV/Indel検出

                                                                     # Duplicated reads を除去
                                                                     $ samtools mpileup –Bgf hg19.fa
                                                                     FILE.sorted.redup.bam | bcftools view
                                                                     -vcg - > FILE.vcf
                                                                                                               6
                         Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
 ■エクソーム解析の手順
                                                                                  参考コマンド
   QC                                                            # ソマティックな変異検出
             がん細胞特異的な多型検出                                        $ java -jar VarScan.v2.2.11.jar somatic
            ①ケースとコントロールでカバレージが                                   b2_blood.pileup b2_cancer.pileup
            10以上
            ②Base Qualityの平均が15以上
                                                                 b2.varscan.vcf --output-vcf
            ③癌のリードの10%が変異支持
                                               VarScan
            ④癌のリードの5本以上が変異支持                                     # ソマティックな変異フィルタリング
Mapping     ⑤コントロールと同じ変異                                         $ java -jar VarScan.v2.2.8.jar somaticFilter b2.
                                                                 varscan.vcf.snp --min-coverage 10 --min-avg-
                                                                 qual 15 --min-var-freq 0.1 --min-reads2 5 --
                                                                 output-file b2.varscan.vcf.filterd.snp
            リアライメントして多型を再検出                    GATK
SNV/Indel                                                        # GATK入力用にBAMファイルを並び替え
                                                                 java -jar ReorderSam.jar
                                                                 I=FILE.sorted.redup.mapped.bam
                VarScanとGATKで                  BEDtools
              共通するSNV/Indelを抽出                                   O=$FILE.karyotypic.bam
                                                                 REFERENCE=hg19.karyotypic.fa
  集計
                                                                 # GATKによるSNV検出
                                                                 $ java –jar GenomeAnalysisTK.jar -T
                                                                 UnifiedGenotyper -R hg19.karyotypic.fa -I
                                                                 FILE.karyotypic.realigned.alnRecal.bam -o
                                                                 FILE.gatk.snv.vcf
                                                                                                             7
                        Copyright © Amelieff Co. Ltd. All Rights Reserved
方法
 ■エクソーム解析の手順

                                                                                             参考コマンド
               SNV/ Indelをフィルタリング
   QC        ① Mapping qualities ≧ 30                 SAMtools             # SNV/ Indelをフィルタリング
             ② SNV qualities ≧ 20
             ③ Indel qualities ≧ 50                                        $ awk '/^#/ || (/INDEL/&&$6>=50) ||
                                                                           (!/INDEL/&&$6>=20)' b2.snv.vcf >
                                                                           b2.filtered.snv.vcf
                  Indelをフィルタリング
             ①一方の向きのリードのみが
              支持するIndelは除外                                                 #アノテーション付与/集計
Mapping      ②30base以内にSNVがある                         弊社開発                 $ java -Xmx4G -jar snpEff.jar eff -c
              Indelは除外                                スクリプト                snpEff.config -i vcf -o vcf hg19
                                                                           b2.filtered.snv.vcf > b2.filtered. eff.snv.vcf
             偽遺伝子と反復配列に含まれる場
             合は、変異支持するリードの10%以
             上がユニークなSNV/Indelを抽出
SNV/Indel
                アノテーション付与/集計                          snpEFF

                        情報付与                            弊社開発
                  dbsnv135,1000 genomes                 スクリプト
  集計                    OMIM, GO                      QuickAnnotator


            ※QuickAnnotatorの詳細につきましては、アメリエフのブースへお越しください。

                                                                                                        8                   8
                                  Copyright © Amelieff Co. Ltd. All Rights Reserved
結果

  ・QCおよびマッピングの結果
                             B2_Blood     B2_Cancer      B8_Blood     B8_Cancer       B9_Blood     B9_Cancer    B10_Blood    B10_Cancer
                            SRR290592     SRR290593     SRR290594     SRR290597      SRR290595     SRR290598    SRR290599    SRR290600
フィルタリング率
クリーニング前                     271,286,968 259,326,348 286,222,172 259,677,208 282,187,548 254,273,550 258,459,568 265,407,220
クリーニング後                     260,322,476 248,161,648 274,677,306 248,021,142 273,326,192 244,913,382 252,955,308 257,523,242
                                 95.96%      95.69%      95.97%      95.51%      96.86%      96.32%      97.87%      97.03%
マッピング率
マッピング前                      260,322,476 248,161,648 274,677,306 248,021,142 273,326,192 244,913,382 252,955,308 257,523,242
マッピング後                      228,755,759 206,183,044 241,507,897 197,004,644 242,104,730 202,828,283 210,955,736 220,644,478
                                 87.87%      83.08%      87.92%      79.43%      88.58%      82.82%      83.40%      85.68%
カバレージ
Average of Coverage               12.27        11.88          10.22           8.60         10.59         9.84         8.25         9.07
Averageof Coverage (>=5)          72.88        67.36          42.67          27.06         48.11        41.53        27.08        54.83
Averageof Coverage (>=10)        109.56        93.26          90.71          63.25         94.44        81.35        56.90        95.83




                              クリーニング前                                                クリーニング後

                                                                                                                     9                    9
                                            Copyright © Amelieff Co. Ltd. All Rights Reserved
結果

            B2サンプル

            ・方法2. VarScan出力例     ※VCFフォーマットも出力可能
   QC




Mapping



SNV/Indel



  集計

                                                        Germline, Somatic, LOH, Unknownに分類

                                                                                             10   10
                         Copyright © Amelieff Co. Ltd. All Rights Reserved
結果
B2サンプル

・集計/情報付与
           方法1 . SAMTools                                                   方法2 .VarScan




                                                                                      11   11
                        Copyright © Amelieff Co. Ltd. All Rights Reserved
結果
B2サンプル

・集計/情報付与

           方法1 . SAMTools                                                   方法2 .VarScan
                                          Coverage




                                   Changes by chromosome




                                                                                      12   12
                        Copyright © Amelieff Co. Ltd. All Rights Reserved
結果
            B2サンプル

            ・方法1
            SAMtoolsを用いて、がん細胞と正常細胞から       intersectBedなどで         偽陽性を除外するために
             各々のSNV/Indelを検出してフィルタリング → がん細胞特異的なSNV/Indelを抽出 → GATKでも検出されたSNV/Indelを検出
   QC

              Tumor.vcf      Normal.vcf                   Somatic?                                   Somatic!
                148,724       145,812                     25,224                                      22,102

Mapping                                            約17.0%ががん特異的                                    391,461
            ・方法2                                                                                      GATKと一致/がん特異的
                                                                             偽陽性を除外するために                   約87.6%
                     VarScanを用いてSNV/Indel検出                      →       GATKでも検出されたSNV/Indelを検出


SNV/Indel                                                                                 Somatic!
              Germline    Somatic        LOH        Unknown                                1,813
              128,988     6,170        7,091          158
                                                                                                GATKと一致/がん特異的
                           TOTAL 154,748                                                             約29.4%
  集計                                                                                  391,461
                          約3.99%ががん特異的

                 VarScanは偽陽性(はずれ)が多い?
            GATKおよびSAMtoolsは偽陰性(見落とし)が多い?                                                 実験的に調べる必要
                                                                                               13               13
                                  Copyright © Amelieff Co. Ltd. All Rights Reserved
お知らせ
 「エクソーム解析パイプライン」を構築したサーバーを販売中!
 研究目的に沿ったカスタマイズに対応いたします。




                                                               14   14
           Copyright © Amelieff Co. Ltd. All Rights Reserved

Contenu connexe

Tendances

Webアプリケーション負荷試験実践入門
Webアプリケーション負荷試験実践入門Webアプリケーション負荷試験実践入門
Webアプリケーション負荷試験実践入門樽八 仲川
 
ライブストリーミングの基礎知識その2
ライブストリーミングの基礎知識その2ライブストリーミングの基礎知識その2
ライブストリーミングの基礎知識その2kumaryu
 
AWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAmazon Web Services Japan
 
はじめての datadog
はじめての datadogはじめての datadog
はじめての datadogNaoya Nakazawa
 
Kong Enterprise の紹介
Kong Enterprise の紹介Kong Enterprise の紹介
Kong Enterprise の紹介Yoshito Tabuchi
 
20210526 AWS Expert Online マルチアカウント管理の基本
20210526 AWS Expert Online マルチアカウント管理の基本20210526 AWS Expert Online マルチアカウント管理の基本
20210526 AWS Expert Online マルチアカウント管理の基本Amazon Web Services Japan
 
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic SessionAmazon Web Services Japan
 
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAmazon Web Services Japan
 
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理Yuki Hattori
 
MySQL 5.7 InnoDB 日本語全文検索(その2)
MySQL 5.7 InnoDB 日本語全文検索(その2)MySQL 5.7 InnoDB 日本語全文検索(その2)
MySQL 5.7 InnoDB 日本語全文検索(その2)yoyamasaki
 
ファイルシステム比較
ファイルシステム比較ファイルシステム比較
ファイルシステム比較NaoyaFukuda
 
AWS Black Belt Online Seminar Elastic Load Balancing
AWS Black Belt Online Seminar Elastic Load BalancingAWS Black Belt Online Seminar Elastic Load Balancing
AWS Black Belt Online Seminar Elastic Load BalancingAmazon Web Services Japan
 
Network miner 使ってみた
Network miner 使ってみたNetwork miner 使ってみた
Network miner 使ってみた彰 村地
 
LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説LINE Corporation
 
君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?Teppei Sato
 
Rolling Hashを殺す話
Rolling Hashを殺す話Rolling Hashを殺す話
Rolling Hashを殺す話Nagisa Eto
 
MongoDBの脆弱性診断 - smarttechgeeks
MongoDBの脆弱性診断 - smarttechgeeksMongoDBの脆弱性診断 - smarttechgeeks
MongoDBの脆弱性診断 - smarttechgeekstobaru_yuta
 

Tendances (20)

Webアプリケーション負荷試験実践入門
Webアプリケーション負荷試験実践入門Webアプリケーション負荷試験実践入門
Webアプリケーション負荷試験実践入門
 
DNS再入門
DNS再入門DNS再入門
DNS再入門
 
ライブストリーミングの基礎知識その2
ライブストリーミングの基礎知識その2ライブストリーミングの基礎知識その2
ライブストリーミングの基礎知識その2
 
AWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティスAWSでDockerを扱うためのベストプラクティス
AWSでDockerを扱うためのベストプラクティス
 
abc031
abc031abc031
abc031
 
はじめての datadog
はじめての datadogはじめての datadog
はじめての datadog
 
Kong Enterprise の紹介
Kong Enterprise の紹介Kong Enterprise の紹介
Kong Enterprise の紹介
 
20210526 AWS Expert Online マルチアカウント管理の基本
20210526 AWS Expert Online マルチアカウント管理の基本20210526 AWS Expert Online マルチアカウント管理の基本
20210526 AWS Expert Online マルチアカウント管理の基本
 
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
20190206 AWS Black Belt Online Seminar Amazon SageMaker Basic Session
 
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
 
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理
Azure SecOps! Azure Key Vaultを用いたクラウドのキー管理
 
MySQL 5.7 InnoDB 日本語全文検索(その2)
MySQL 5.7 InnoDB 日本語全文検索(その2)MySQL 5.7 InnoDB 日本語全文検索(その2)
MySQL 5.7 InnoDB 日本語全文検索(その2)
 
ファイルシステム比較
ファイルシステム比較ファイルシステム比較
ファイルシステム比較
 
AWS Black Belt Online Seminar Elastic Load Balancing
AWS Black Belt Online Seminar Elastic Load BalancingAWS Black Belt Online Seminar Elastic Load Balancing
AWS Black Belt Online Seminar Elastic Load Balancing
 
Network miner 使ってみた
Network miner 使ってみたNetwork miner 使ってみた
Network miner 使ってみた
 
Bloom filter
Bloom filterBloom filter
Bloom filter
 
LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説LINEの新卒採用試験 ズバリ問題解説
LINEの新卒採用試験 ズバリ問題解説
 
君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?君はyarn.lockをコミットしているか?
君はyarn.lockをコミットしているか?
 
Rolling Hashを殺す話
Rolling Hashを殺す話Rolling Hashを殺す話
Rolling Hashを殺す話
 
MongoDBの脆弱性診断 - smarttechgeeks
MongoDBの脆弱性診断 - smarttechgeeksMongoDBの脆弱性診断 - smarttechgeeks
MongoDBの脆弱性診断 - smarttechgeeks
 

En vedette

NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析Amelieff
 
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリングNGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリングAmelieff
 
NGS現場の会第2回_アメリエフ株式会社_Qcleaner
NGS現場の会第2回_アメリエフ株式会社_QcleanerNGS現場の会第2回_アメリエフ株式会社_Qcleaner
NGS現場の会第2回_アメリエフ株式会社_QcleanerAmelieff
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料Amelieff
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門Amelieff
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料Amelieff
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料Amelieff
 
Exome解析入門
Exome解析入門Exome解析入門
Exome解析入門Amelieff
 
はじめてのLinux
はじめてのLinuxはじめてのLinux
はじめてのLinuxAmelieff
 
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」Genaris Omics, Inc.
 
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料Genaris Omics, Inc.
 
次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアル次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアルAmelieff
 
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料Amelieff
 
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料Amelieff
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」Genaris Omics, Inc.
 
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料Aya Takeda
 
インセプションデッキ紹介
インセプションデッキ紹介インセプションデッキ紹介
インセプションデッキ紹介You&I
 
SNPデータ解析入門
SNPデータ解析入門SNPデータ解析入門
SNPデータ解析入門Amelieff
 
Ameba流 scrumを浸透させていく方法
Ameba流 scrumを浸透させていく方法Ameba流 scrumを浸透させていく方法
Ameba流 scrumを浸透させていく方法Hirotaka Osaki
 
20140131 万葉帰社日発表 チーム積み重ね 公開版
20140131 万葉帰社日発表 チーム積み重ね 公開版20140131 万葉帰社日発表 チーム積み重ね 公開版
20140131 万葉帰社日発表 チーム積み重ね 公開版tatsuo sakurai
 

En vedette (20)

NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
NGS現場の会第2回_アメリエフ株式会社_RNAseq解析
 
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリングNGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
NGS現場の会第2回_アメリエフ株式会社_SNVフィルタリング
 
NGS現場の会第2回_アメリエフ株式会社_Qcleaner
NGS現場の会第2回_アメリエフ株式会社_QcleanerNGS現場の会第2回_アメリエフ株式会社_Qcleaner
NGS現場の会第2回_アメリエフ株式会社_Qcleaner
 
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
フリーソフトではじめるがん体細胞変異解析入門 第33回勉強会資料
 
フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門フリーソフトではじめるNGS融合遺伝子解析入門
フリーソフトではじめるNGS融合遺伝子解析入門
 
フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料フリーソフトで始めるNGS解析_第41・42回勉強会資料
フリーソフトで始めるNGS解析_第41・42回勉強会資料
 
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料フリーソフトではじめるChIP-seq解析_第40回勉強会資料
フリーソフトではじめるChIP-seq解析_第40回勉強会資料
 
Exome解析入門
Exome解析入門Exome解析入門
Exome解析入門
 
はじめてのLinux
はじめてのLinuxはじめてのLinux
はじめてのLinux
 
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
NGS現場の会 第3回 モーニング教育セッション 配布用資料 「いまさら聞けない NGS超!入門」
 
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
CBI学会2013チュートリアル NGSデータ解析入門 (解析編)配布資料
 
次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアル次世代シーケンス解析サーバーReseq解析マニュアル
次世代シーケンス解析サーバーReseq解析マニュアル
 
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
フリーソフトではじめるメチル化データ解析入門 SeqCap Epiデータ対応_第40回勉強会資料
 
miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料miRNAデータ解析入門_第23回勉強会資料
miRNAデータ解析入門_第23回勉強会資料
 
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
NGS現場の会第4回研究会 モーニング教育セッション 配布用資料 「Windows/Mac環境で始めるNGSデータ解析入門」
 
第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料第3回NGS現場の会モーニング教育セッション 配布用資料
第3回NGS現場の会モーニング教育セッション 配布用資料
 
インセプションデッキ紹介
インセプションデッキ紹介インセプションデッキ紹介
インセプションデッキ紹介
 
SNPデータ解析入門
SNPデータ解析入門SNPデータ解析入門
SNPデータ解析入門
 
Ameba流 scrumを浸透させていく方法
Ameba流 scrumを浸透させていく方法Ameba流 scrumを浸透させていく方法
Ameba流 scrumを浸透させていく方法
 
20140131 万葉帰社日発表 チーム積み重ね 公開版
20140131 万葉帰社日発表 チーム積み重ね 公開版20140131 万葉帰社日発表 チーム積み重ね 公開版
20140131 万葉帰社日発表 チーム積み重ね 公開版
 

Similaire à NGS現場の会第2回_アメリエフ株式会社_がんExome解析

CAメインフレーム システムリソース削減に貢献する製品について
CAメインフレーム システムリソース削減に貢献する製品についてCAメインフレーム システムリソース削減に貢献する製品について
CAメインフレーム システムリソース削減に貢献する製品についてKaneko Izumi
 
RECOMMENDER for Web security engineers - 中級編 -
RECOMMENDER for Web security engineers - 中級編 -RECOMMENDER for Web security engineers - 中級編 -
RECOMMENDER for Web security engineers - 中級編 -Isao Takaesu
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixKodai Terashima
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixKodai Terashima
 
pmacct, kafka, presto, re:dash を使った高速なflow解析
pmacct, kafka, presto, re:dash を使った高速なflow解析pmacct, kafka, presto, re:dash を使った高速なflow解析
pmacct, kafka, presto, re:dash を使った高速なflow解析 Kaname Nishizuka
 
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引きRapidRadioJP
 
2019年度 第2回バイオインフォマティクス実習
2019年度 第2回バイオインフォマティクス実習2019年度 第2回バイオインフォマティクス実習
2019年度 第2回バイオインフォマティクス実習Jun Nakabayashi
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumnnippongenetics
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumnnippongenetics
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumnnippongenetics
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumnnippongenetics
 
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】DeNA
 

Similaire à NGS現場の会第2回_アメリエフ株式会社_がんExome解析 (13)

CAメインフレーム システムリソース削減に貢献する製品について
CAメインフレーム システムリソース削減に貢献する製品についてCAメインフレーム システムリソース削減に貢献する製品について
CAメインフレーム システムリソース削減に貢献する製品について
 
RECOMMENDER for Web security engineers - 中級編 -
RECOMMENDER for Web security engineers - 中級編 -RECOMMENDER for Web security engineers - 中級編 -
RECOMMENDER for Web security engineers - 中級編 -
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbix
 
オープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbixオープンソースでシステム監視!統合監視ソフトウェアZabbix
オープンソースでシステム監視!統合監視ソフトウェアZabbix
 
pmacct, kafka, presto, re:dash を使った高速なflow解析
pmacct, kafka, presto, re:dash を使った高速なflow解析pmacct, kafka, presto, re:dash を使った高速なflow解析
pmacct, kafka, presto, re:dash を使った高速なflow解析
 
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き
[bladeRF + MATLAB/Simulink] SDRデバイス利用の手引き
 
2019年度 第2回バイオインフォマティクス実習
2019年度 第2回バイオインフォマティクス実習2019年度 第2回バイオインフォマティクス実習
2019年度 第2回バイオインフォマティクス実習
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn
 
201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn201910 up!magazine&promotions 2019 autumn
201910 up!magazine&promotions 2019 autumn
 
OpenFlow
OpenFlowOpenFlow
OpenFlow
 
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
DeClang 誕生!Clang ベースのハッキング対策コンパイラ【DeNA TechCon 2020 ライブ配信】
 

NGS現場の会第2回_アメリエフ株式会社_がんExome解析

  • 1. がんゲノムのエクソーム解析 2012年5月24日 アメリエフ株式会社 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 2. 要旨 次世代シーケンサー(NGS)から出力される膨大なデータから、生物学的意味付けまでの一連の解析を、常に 最新の解析ツールにアップグレードできるフレキシブルなパイプラインの構築は、研究の効率化に有効である。 我々は、GATK、SAMtools、VarScanなどを用いて、がん細胞と正常細胞から、ソマティックな変異を検出するた めの、解析パイプラインの構築を行った。 <ソマティック変異を検出する流れ> 【方法1 】 SAMtoolsを用いて、がん細胞と正常細胞から intersectBedなどで 偽陽性を除外するために 各々のSNV/Indelを検出 → がん細胞特異的なSNV/Indelを抽出 → GATKでも検出されたSNV/Indelを検出 Tumor.vcf Normal.vcf Somatic? Somatic! 【方法2】 偽陽性を除外するために SAMtoolsを用いてpileupファイルを出力 → VarScanを用いてSNV/Indel検出 → GATKでも検出されたSNV/Indelを検出 Tumor.pileup Normal.pileup Somatic Germline Somatic LOH Unknown Somatic! ※Pileupを入力することで、各々のマッピング情報を 比較しながらソマティックな変異を検出できる 方法1と2はどちらが有効なのか?? 考慮すべき問題点は? 2 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 3. 方法 ■データ Nature Genetics Volume: 43, Pages: 875–878 Year published: (2011) DOI: doi:10.1038/ng.907 Received 13 May 2011 Accepted 15 July 2011 Published online 07 August 2011 Frequent mutations of chromatin remodeling genes in transitional cell carcinoma of the bladder ・移行上皮癌(TCC)は、膀胱癌の中で発生頻度が最も高い。 ・Discovery screenとして、患者9人のエキソーム解析を行った。 ・Prevalence Screenとして、発見された全ての変異遺伝子に対して、異なったステージとグレードの患者88人の試料を用いてスクリーニングを行った。 ・患者97人のうち59% にクロマチンリモデリングにかかわる遺伝子(UTX、MLL-MLL3、CREBBP-EP300、NCOR1、ARID1A、CHD6)に変異が認められた。 ・UTX は、ステージとグレードのより低い腫瘍において、はるかに高い頻度で変化しているため、膀胱癌における分類と診断において役に立つ可能性 がある。 ・クロマチン制御の異常が膀胱癌の特徴であることを示唆した。 上記のデータのうち、下記の4検体8サンプルを使用した。 ・ Illumina Genome Analyzer IIを使用した。 ・NimbleGen Sequence Capture 2.1M Exome Array(SeqCap EZ Exome発売前の商品)を使用した。 num SRR SRX sample 1 SRR290592 SRX079167 B2_Blood 2 SRR290593 SRX079168 B2_Cancer 3 SRR290594 SRX079169 B8_Blood 4 SRR290597 SRX079172 B8_Cancer 5 SRR290595 SRX079170 B9_Blood 6 SRR290598 SRX079173 B9_Cancer 7 SRR290599 SRX079174 B10_Blood 8 SRR290600 SRX079175 B10_Cancer 3 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 4. 方法 ■ソフトウェア 1. FastQC : FastqファイルのQC QC 2. FastX : Fastqファイルをフィルタリング 3. TagCleaner : 混入しているアダプターを予測 4. compfastq : ペアリードのうち片側のみのリードを除外 Mapping 1. BWA : アライメント&マッピング 2. Picard : 重複リードの除去 1. SAMtools : SNV/Indel検出、BAMファイル操作 SNV/Indel 2. VarScan : Tumor/Normal比較 3. GATK : SNV/Indel検出、カバレージ算出 4. QuickAnnotator :アノテーション付与 集計 1. snpEFF :アノテーション付与/集計 2. 弊社開発スクリプト 4 4 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 5. 方法 ■エクソーム解析の手順 参考コマンド FASTQ形式チェック QC # FASTQデータのクオリティチェック htmlやサマリーが出力される データクオリティチェック(FastQC) $ fastqc -o FILE -f fastq FILE1.fastq # クオリティ20未満の塩基が80%以上のリードを除去 Illumina CASAVA filter [Y] を除去 $ fastq_quality_filter -i FILE1.fastq -o Mapping FILE1.qual.fastq -q 20 -p 80 -Q 33 -v クオリティ20未満が80%以上の リードを除去 # クオリティ20未満の末端をトリム 弊社開発 スクリプト $ prinseq-lite.pl -fastq FILE1.qual.fastq - クオリティ20未満の末端をトリム Qcleaner使用 out_format 3 -log -trim_qual_right 20 - trim_qual_left 20 SNV/Indel 未知の塩基(N)が多いリード除去 # 配列長が20未満のリード除去 $ prinseq-lite.pl -fastq 配列長が短いリード除去 FILE1_prinseq_good_Su1_.fastq - out_format 3 -min_len 20 集計 片側のみのリードを除外 データクオリティチェック(FastQC) ※Qcleanerの詳細につきましてはT38のポスター、または、アメリエフのブースへお越しください。 5 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 6. 方法 参考コマンド ■エクソーム解析の手順 # アライメント $ bwa aln -t 4 hg19.fa FILE1.treated.fastq -f FILE1.sai アライメント QC # マッピング→BAMに変換→ソート BWA マッピング $ bwa sampe -r "@RG¥tID:FILE¥tSM:FILE¥tPL:Illumina" -n SAMファイルを 3 -N 10 -a 500 hg19.fa FILE1.sai FILE2.sai BAMファイルに変換 FILE1.treated.fastq FILE2.treated.fastq | Mapping samtools view -Sb - | samtools sort - SAMtools FILE.sorted BAMファイルをソート # Duplicated reads を除去 BAMファイルをインデキシング $ java -jar MarkDuplicates.jar I=FILE.sorted.bam SNV/Indel Duplicated reads を除去 Picard O=FILE.sorted.redup.bam METRICS_FILE=jeter.metrics カバレージを計算 BEDtools REMOVE_DUPLICATES=true ASSUME_SORTED=true SAMtools VALIDATION_STRINGENCY=SILENT 集計 SNV/Indel検出 # Duplicated reads を除去 $ samtools mpileup –Bgf hg19.fa FILE.sorted.redup.bam | bcftools view -vcg - > FILE.vcf 6 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 7. 方法 ■エクソーム解析の手順 参考コマンド QC # ソマティックな変異検出 がん細胞特異的な多型検出 $ java -jar VarScan.v2.2.11.jar somatic ①ケースとコントロールでカバレージが b2_blood.pileup b2_cancer.pileup 10以上 ②Base Qualityの平均が15以上 b2.varscan.vcf --output-vcf ③癌のリードの10%が変異支持 VarScan ④癌のリードの5本以上が変異支持 # ソマティックな変異フィルタリング Mapping ⑤コントロールと同じ変異 $ java -jar VarScan.v2.2.8.jar somaticFilter b2. varscan.vcf.snp --min-coverage 10 --min-avg- qual 15 --min-var-freq 0.1 --min-reads2 5 -- output-file b2.varscan.vcf.filterd.snp リアライメントして多型を再検出 GATK SNV/Indel # GATK入力用にBAMファイルを並び替え java -jar ReorderSam.jar I=FILE.sorted.redup.mapped.bam VarScanとGATKで BEDtools 共通するSNV/Indelを抽出 O=$FILE.karyotypic.bam REFERENCE=hg19.karyotypic.fa 集計 # GATKによるSNV検出 $ java –jar GenomeAnalysisTK.jar -T UnifiedGenotyper -R hg19.karyotypic.fa -I FILE.karyotypic.realigned.alnRecal.bam -o FILE.gatk.snv.vcf 7 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 8. 方法 ■エクソーム解析の手順 参考コマンド SNV/ Indelをフィルタリング QC ① Mapping qualities ≧ 30 SAMtools # SNV/ Indelをフィルタリング ② SNV qualities ≧ 20 ③ Indel qualities ≧ 50 $ awk '/^#/ || (/INDEL/&&$6>=50) || (!/INDEL/&&$6>=20)' b2.snv.vcf > b2.filtered.snv.vcf Indelをフィルタリング ①一方の向きのリードのみが 支持するIndelは除外 #アノテーション付与/集計 Mapping ②30base以内にSNVがある 弊社開発 $ java -Xmx4G -jar snpEff.jar eff -c Indelは除外 スクリプト snpEff.config -i vcf -o vcf hg19 b2.filtered.snv.vcf > b2.filtered. eff.snv.vcf 偽遺伝子と反復配列に含まれる場 合は、変異支持するリードの10%以 上がユニークなSNV/Indelを抽出 SNV/Indel アノテーション付与/集計 snpEFF 情報付与 弊社開発 dbsnv135,1000 genomes スクリプト 集計 OMIM, GO QuickAnnotator ※QuickAnnotatorの詳細につきましては、アメリエフのブースへお越しください。 8 8 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 9. 結果 ・QCおよびマッピングの結果 B2_Blood B2_Cancer B8_Blood B8_Cancer B9_Blood B9_Cancer B10_Blood B10_Cancer SRR290592 SRR290593 SRR290594 SRR290597 SRR290595 SRR290598 SRR290599 SRR290600 フィルタリング率 クリーニング前 271,286,968 259,326,348 286,222,172 259,677,208 282,187,548 254,273,550 258,459,568 265,407,220 クリーニング後 260,322,476 248,161,648 274,677,306 248,021,142 273,326,192 244,913,382 252,955,308 257,523,242 95.96% 95.69% 95.97% 95.51% 96.86% 96.32% 97.87% 97.03% マッピング率 マッピング前 260,322,476 248,161,648 274,677,306 248,021,142 273,326,192 244,913,382 252,955,308 257,523,242 マッピング後 228,755,759 206,183,044 241,507,897 197,004,644 242,104,730 202,828,283 210,955,736 220,644,478 87.87% 83.08% 87.92% 79.43% 88.58% 82.82% 83.40% 85.68% カバレージ Average of Coverage 12.27 11.88 10.22 8.60 10.59 9.84 8.25 9.07 Averageof Coverage (>=5) 72.88 67.36 42.67 27.06 48.11 41.53 27.08 54.83 Averageof Coverage (>=10) 109.56 93.26 90.71 63.25 94.44 81.35 56.90 95.83 クリーニング前 クリーニング後 9 9 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 10. 結果 B2サンプル ・方法2. VarScan出力例 ※VCFフォーマットも出力可能 QC Mapping SNV/Indel 集計 Germline, Somatic, LOH, Unknownに分類 10 10 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 11. 結果 B2サンプル ・集計/情報付与 方法1 . SAMTools 方法2 .VarScan 11 11 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 12. 結果 B2サンプル ・集計/情報付与 方法1 . SAMTools 方法2 .VarScan Coverage Changes by chromosome 12 12 Copyright © Amelieff Co. Ltd. All Rights Reserved
  • 13. 結果 B2サンプル ・方法1 SAMtoolsを用いて、がん細胞と正常細胞から intersectBedなどで 偽陽性を除外するために 各々のSNV/Indelを検出してフィルタリング → がん細胞特異的なSNV/Indelを抽出 → GATKでも検出されたSNV/Indelを検出 QC Tumor.vcf Normal.vcf Somatic? Somatic! 148,724 145,812 25,224 22,102 Mapping 約17.0%ががん特異的 391,461 ・方法2 GATKと一致/がん特異的 偽陽性を除外するために 約87.6% VarScanを用いてSNV/Indel検出 → GATKでも検出されたSNV/Indelを検出 SNV/Indel Somatic! Germline Somatic LOH Unknown 1,813 128,988 6,170 7,091 158 GATKと一致/がん特異的 TOTAL 154,748 約29.4% 集計 391,461 約3.99%ががん特異的 VarScanは偽陽性(はずれ)が多い? GATKおよびSAMtoolsは偽陰性(見落とし)が多い? 実験的に調べる必要 13 13 Copyright © Amelieff Co. Ltd. All Rights Reserved