Platform for Drug Discovery


The example of SNP, INDEL calling for non-human biological by using several pipelines


Introduction

Comments


    大まかな流れとしては、BWAでマッピングを行い、samtoolsもしくはGATKで変異を抽出し、snpEffによってコード領域の変異かどうかのアノテーションを行う。
    入力データとしては、下記のデータが必要となる。

  • FASTQ形式のシーケンスファイル(シングルエンドorペアエンド)

  • Maser内部に取り込まれたゲノム以外を用いる場合は、FASTA形式の参照配列

  • 遺伝子領域が定義されたGTFファイル、もしくはGFFファイル


  • 変異の抽出はsamtoolsかGATKを用いることが可能であるが、GATKはファイルチェックが厳しく、小さなデータではエラーになるなどの癖がある。
    非モデル生物では、GATKの機能を活かした補正処理をほとんど行うことができないため、まずはsamtoolsを使ってみることを推奨する。

    マッピング結果をIGVを用いてグラフィカルに確認する手順は、下記を参照。
    P000001200#Comments

Use case


    カイコ、ショウジョウバエなどの生物で動作確認済み。

Related information