Workflow Variant Calling 01

From Pitagora-Galaxy Wiki
Jump to: navigation, search

Main Page >> Workflows >>

概要

本ワークフローは、NGSから出力されたfastqデータをLAST、BWAの2つのアライメントツールでそれぞれマッピングを行ってBAMファイルを生成し、それぞれのBAMファイルからGATK、もしくはsomatic valiant caller(VarScan)にてバリアントをコールする、というものです。 特に、somatic valiant caller(VarScan)により、正常細胞とがん細胞の2つのfastqデータを比較することでがん細胞特有の変異を見つけ出すことに重点が置かれております。

また、その上で、ツールごと(LASTとBWA)の結果を比較等することにより、アライメントツールの差異による変異コールの違い等を作業者の手元で調べることを可能にするということを目的の一つにしております。

尚、本解析フローは、かずさDNA研究所小原收先生よりご提供頂いており、そもそもは同研究所の皆様、及び土方敦司先生(現長浜バイオ大)により開発されました。 実際の実装は、産総研により行われております。

入力ファイル

fastqファイル(NGSデータ)

通常細胞とがん細胞を比較してsomatic変異をコールする場合は、それぞれのfastqファイルが必要

リファレンス配列のfastaファイル

NGS試薬のBEDファイル

出力ファイル

リキャリブレーションされたBAMファイル

GATKでコールされた変異のvcfファイル

VarScanでコールされた変異のデータファイル(VarScanの各形式)

フロー図

  • fastq→BAM

GWT2015 1.png

※実際の中身はこんな風になっています(LAST)

P1.png



  • BAM→Recaliblated BAM

GWT2015 2.png

※実際の中身はこんな風になっています

P2.png



  • Somatic Variant Caller

GWT2015 3.png

※実際の中身はこんな風になっています(VarScan)

P3.png

テスト方法

後日詳細説明予定