Contenu connexe
Similaire à 次世代シーケンス解析サーバーReseq解析マニュアル (20)
次世代シーケンス解析サーバーReseq解析マニュアル
- 5. 解析の準備
ここでは、データ解析を/home/user/analysis で実行します。
以下のコマンドを打って、analysisディレクトリを作成します。
$ cd ← 自分のホームディレクトリへ移動
$ mkdir analysis ← 解析用のanalysisディレクトリを作成
$ cd analysis/ ← 作成したanalysisディレクトリへ移動
cp コマンドを用いて、解析したいFastqファイルを
analysisディレクトリにコピーします。
$ cp /home/share/example/reseq/SRR077861_*.fastq /home/user/analysis
※ディレクトリとはWindowsにおけるフォルダと同じ意味です。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 5
- 6. 解析の実行
tsvファイルを作成し、
端末内に以下のコマンドを入力し解析を実行します。
$ ls -l ← コピーができたかどうかの確認
$ python -u /usr/local/src/amelieff/reseq/reseq.py -s 1 -l SRR077861.tsv
-g hg19 -a > log 2>&1 & ← Reseq 解析プログラムの実行
詳細は別紙 「Reseq解析フロー」をご覧ください。
-a オプションを外すとannoverをご利用になれます。
詳細は「マニュアル別紙 Annovar事前準備」をご覧ください。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 6
- 7. 実行状況の確認方法(1)
実行中のジョブの確認
端末内で、topコマンド
を入力すると実行中の
ジョブが確認できます。
$ top
右の例ではuser の bwa
ジョブが流れています。
このtop画面を終了するときは、qを押します。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 7
- 8. 実行状況の確認方法(2)
出力ファイル・ディレクトリの確認
デスクトップの
userのホーム →
analysis の順に
クリックします。
ディレクトリが5つ、
サマリーファイル
(SRR077861.log)が
1つできていること
を確認します。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 8
- 9. 実行状況の確認方法(3)
サマリーファイルの確認
得られたサマリーファイル(SRR077861.log)を
windowsパソコンにコピーし、Excelで開きます。
サマリーファイルには、5つの解析項目の開始・終了時間と
実行結果の情報が記載されています。
Copyright © Amelieff Co. Ltd. All Rights Reserved.
9
- 10. 実行状況の確認方法(3)
サマリーファイルの詳細
サマリーファイルのヘッダーには、解析の基本情報が書かれます。
###########################################
#RESEQ PIPELINE START: 2012/12/19-13:17:43 ①
# file = SRR077861.tsv ②
# genome = hg19 ③
# bed = /home/genome/hg19/ccds.bed ④
① 解析を始めた時間
② 解析の対象となるFastqファイルのリスト
③ 解析に使用するリファレンスゲノム
④ 集計を行うターゲット領域
(濃縮キットを使用した場合は販売元にお問い合わせください)
Copyright © Amelieff Co. Ltd. All Rights Reserved.
10
- 11. 実行状況の確認方法(3)
サマリーファイルの詳細:Step1(QC結果)
## Step1:1_qc
Num Sample Start End Time(sec)
SRR077861 2012/12/19-13:17:43 2012/12/19-13:17:54 10
Info Result
[SRR077861_1.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%) ①
[SRR077861_1.clean.fastq.gz]Pass_bases/Total_bases 765303/769187(99.50%) ②
[SRR077861_2.clean.fastq.gz]Pass_reads/Total_reads 8641/8707(99.24%)
[SRR077861_2.clean.fastq.gz]Pass_bases/Total_bases 766170/769287(99.59%)
① 全リードのうち、クオリティ・フィルタリングをパスしたリードの割合
② 全塩基のうち、クオリティ・フィルタリングをパスした塩基の割合
Copyright © Amelieff Co. Ltd. All Rights Reserved.
11
- 12. 実行状況の確認方法(3)
サマリーファイルの詳細:
Step2(Mapping結果)
## Step2-4:2_mapping,3_realignment,4_snv/indel,5_annotation
# sample = SRR077861
Step Process Start End Time(sec)
2 Mapping 2012/12/19-13:17:54 2012/12/19-13:18:08 13
Info Result
Mapped_reads/Pass_reads 16768/17282(97.03%) ①
After_duplicate_reads_removed 16691 ②
Target_num 25504 ③
Target_size 937613923 ④
No_covererd_target_num 25503,99.9% ⑤
① クオリティ・フィルタリングをパスしたリードのうち、マッピングされたリードの割合
② 重複リードを除外した後のリード数
③ 実行時に指定したターゲット領域に含まれる領域数
(未指定の場合はCCDSの領域数)
④ ターゲット領域の大きさ(未指定の場合はCCDSの大きさ)
⑤ リードが1本もマッピングされなかったターゲット領域の数と割合
Copyright © Amelieff Co. Ltd. All Rights Reserved.
12
- 13. 実行状況の確認方法(3)
サマリーファイルの詳細:
Step2~3(Mapping~Realignment結果)
Average_depth(x1) 21.7
(x10) 82.8
(x30) 118.7
①
(x50) 141.9
Coverage(x1) 0.00%
Coverage(x10) 0.00%
Coverage(x30) 0.00%
②
Coverage(x50) 0.00%
① カバレージ X 以上のターゲット領域上の平均カバレージ
② カバレージ X 以上でカバーされているターゲット領域の割合
3 Realignment 2012/12/19-13:18:08 2012/12/19-13:35:26 1038
Regions_local_realignment 76 ③
③ ローカルリアライメントを行った領域の数
Copyright © Amelieff Co. Ltd. All Rights Reserved.
13
- 14. 実行状況の確認方法(3)
サマリーファイルの詳細:
Step4~5(SNV/Indel~Annotate結果)
4 SNV/Indel 2012/12/19-13:35:26 2012/12/19-14:25:12 2985
5 Annotate 2012/12/19-14:25:12 2012/12/19-14:39:52 880
SNV 31 ①
Indel 2 ②
Filtered_SNV 17 ③
Filtered_Indel 2 ④
# All_Process_End ⑤
① 検出されたSNV数
② 検出されたInsertion/Deletion数
③ クオリティのフィルタリングをパスしたSNV数
④ クオリティのフィルタリングをパスしたInsertion/Deletion数
⑤ 1つのサンプルの解析が全て終了
Copyright © Amelieff Co. Ltd. All Rights Reserved.
14
- 15. QC結果確認
Fastqファイル毎にQCの
レポートが出力されます。
analysisディレクトリの
1_qc → tmp →
SRR077861_1_QCleaner →
SRR077861_1.clean_fastqc →
fastqc_report.html
の順にクリックします。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 15
- 17. SNV/Indel検出結果の確認
analysisディレクトリの
5_annotation →
SRR077861_small_snpEff_
summary.html
の順にクリックします。
Copyright © Amelieff Co. Ltd. All Rights Reserved. 17