Platform for Drug Discovery


BWA



基本情報



ツール名


    BWA

引用元



説明ページリンク



ツールの概要(主要機能)


  • 全ゲノムに対するショートリード(200塩基未満)マッピングプログラム。
  • 同プログラムのbwaswオプションにより実行できる中鎖用マッピングプログラムは別ページBWA-SWに記載。

バージョンごとの違い


  • バージョンごとの特筆すべき違いがあれば記載ください。

機能


機能説明


  • 入力ファイルはFASTQで固定。
  • 出力ファイルはSAM形式で固定。
  • ミスマッチ許容はデフォルト3%。オプションで指定可能。
  • InDelはデフォルトで検出。
  • InDel許容は少なくとも3塩基以上(経験則)。
  • マルチヒットの扱いは、(無視/ランダム抽出/全出力)から選択可能。デフォルトはランダム抽出。

出力形式について

アルゴリズムの説明


  • Burrows-Wheeler Transform (BWT)に基づいた、短鎖用アルゴリズムと長鎖用アルゴリズムを選択することが可能です。

アライメント処理について

  • BWAはSOAP2, Bowtieなどと異なり、マッピングを "アライメント処理"と"マッピング処理"の2ステップに分けています。
  • "アライメント"の響きから、直感的には、マッピングの前にquery内の冗長度を取り除いた上でマッピングすることで、より高速なマッピングが出来るような気がしますが、
  • 計算量的には"アライメント処理"の負荷の方がかなり大きくなっています。
  • また、以下のグラフは、同一データを1~10倍に複製した際に、要した処理時間を表していますが、下図の結果からも明らかなように、特に冗長度が増えたらといって、アライメント処理を事前に行うことで、全体のマッピングに要する時間が短くなるということはないようです。
    • 配列の冗長性と実行時間の関係Image

low quality trimming 機能について



機能表抜粋


  • ツール情報から辿れる機能比較一覧表に行を追加して、その情報をここにも載せてください。

導入ノウハウ


インストール方法


導入時(インストール時)トラブルシューティング


    テンプレート(ツール説明ページ)導入トラブルシューティング掲示板?


使用時ノウハウ


使用方法(実行コマンドオプション)


index作成

  • tool/bwa-0.5.7/bwa index -a bwtsw hg19.fa
  • #アルゴリズム識別子概要
    1is細菌等2G塩基以下の小規模リファレンス用。bwtswより高速。
    2bwtsw高等真核生物等10M塩基以上の大規模リファレンス用。

index作成(color space用)

  • tool/bwa-0.5.7/bwa index -a bwtsw -c hg19.fa

マッピング処理(single end)

  • BWAはマッピング処理を"アライメント処理"と"マッピング処理"の2ステップに分けています。
  • bwa aln -t [スレッド数] [リファレンスファイル] [クエリファイル] > [saiファイル] 2> [ログファイル]
    
    bwa samse [リファレンスファイル] [saiファイル] [クエリファイル] > [出力ファイル]
    
     2> [ログファイル]
  • tool/bwa-0.5.7/bwa aln -t 1 hg19.fa SRR023853.fastq > SRR023853.sai
    
    tool/bwa-0.5.7/bwa samse hg19.fa SRR023853.sai SRR023853.fastq > SRR023853.sam

マッピング処理(single end/color space用)

  • csfastq2pseudoFastqForBwa.pl SRR036757.fastq > SRR036757.pseudo.fastq
    
    tool/bwa-0.5.7/bwa aln -c -t 1 hg19.fa SRR036757.pseudo.fastq
    
     > SRR036757.sai
    
    tool/bwa-0.5.7/bwa samse hg19.fa SRR036757.sai SRR036757.pseudo.fastq
    
     > SRR036757.sam

マッピング処理(pair end)

  • tool/bwa-0.5.7/bwa aln -t 1 hg19.fa SRR027863_1.fastq > SRR027863_1.sai
    
    tool/bwa-0.5.7/bwa aln -t 1 hg19.fa SRR027863_2.fastq > SRR027863_2.sai
    
    tool/bwa-0.5.7/bwa sampe hg19.fa SRR027863_1.sai SRR027863_2.sai SRR027863_1.fastq SRR027863_2.fastq > SRR027863.sam

使用時トラブルシューティング


    テンプレート(ツール説明ページ)使用トラブルシューティング掲示板

参考



Contact us
Copyright © 2009-2017 National Institute of Genetics  [Site Policy] [Privacy Policy]