Platform for Drug Discovery


[日本語]  

blastn for NT database (SE)


Introduction


  • This pipeline is useful for the researcher who deal with metagenome data. It will takes a few days to finish whole analysis for the 1 million 150 bp single-end data.

  • このパイプラインは、ターゲット領域を限定しないメタゲノム解析を行うパイプラインです。FASTQをFASTAに変換した後、blastnによってNTデータベースに相同性検索を行います。その後、出力ファイルをMEGANに入力することで、Taxonomy解析を行うことが可能です。


    Input formatFASTQ
    Library layoutFor single-end read only
    Execution timeAbout a few days for NT


    Results
    • Blast結果
    • MEGANによるTaxonomy解析
    Image
    サンプルごとに含まれる生物群の比較

Table_of_contents

Inputs


    ・入力可能なFASTQについては、このページをご覧ください。

Outputs


    実行例1
    Image

    1. FASTAファイル
    Image
    FASTQ-FASTA変換
    2. Blast結果
    Image
    blastnによる相同性検索結果

How to run this pipeline

Result explanation


    データに依存しますが、およそNTデータベースに対しては1割程度相同配列がヒットするようです。
    Blastの結果からTaxonomy解析などを行う手順につきましては、BlastのアウトプットをMEGANに入力する下記の記述をご参照ください。

Comments


    • 出力されたBlast結果をMEGANに入力し、Taxonomy解析を行う手順
    1.まず、MEGANをインストールします。 ここ からダウンロード可能です。
    お使いの環境にあったインストーラーをダウンロードしてください。(例:64bitのWindowsであれば、MEGAN_windows-x64_4_70_4.exe)

    Image

    2.アカデミックユーザの方は下記のリンクよりライセンスを申請できます。
    http://www-ab2.informatik.uni-tuebingen.de/software/megan/register/
    Image

    3.インストールが終了したら、MEGANを起動します。
    Image

    4.本パイプラインの2番目のアウトプットをダウンロードしておきます。(例:SRR061704.fasta.blastなどのファイル名)
    複数のFASTQを解析した場合には、結果ファイルをそれぞれダウンロードしておきます。
    Image

    Image

    4.まず、1つ目のBlast結果ファイルをインポートするには、「File->Import From Blast...」をクリックします。
    Image

    5.「Step 1: Specify the BLAST (or RDP or Silva or SAM) file to import」
    の下の欄にダウンロードしたBlast結果ファイルの場所を入力します。
    欄の隣のフォルダーアイコンをクリックすると、ファイルの選択ダイアログが表示されますので、それを用いると簡単です。
    Image

    次に「Step 2」でFASTAファイルをオプションで選択することができます。
    FASTAファイルは通常不要ですが、必要な場合には、本パイプラインのアプトプット1番の結果ファイルをダウンロードし、選択してください。
    Image

    最後に「Step 3」で保存するファイル名を入力し、「Apply」ボタンを押してください。
    Image

    6.しばらく待つと、Taxonごとの存在量が円の大きさで表示されていると思います。
    他のサンプルがある場合には、上の4~5をサンプル数分繰り返します。
    Image

    7.サンプル間でバクテリアの増減などを比較するには、「Options->Compare...」をクリックします。
    Image

    比較したいデータセットを選択し、「Apply」ボタンを押します。
    Image

    8.ウィンドウ上部のアイコンをクリックすると、様々なグラフが表示されます。
    また、「File->Export」から数値データを出力することも可能です。
    Image

Use case

  • Example1: 454のデータで、平均400 bp・50万のシングルエンドリード(SRR061688, SRR061704, SRR061718)3組のデータに対し、それぞれ並列してBlastによるアノテーションを行った。計算時間はNTデータベースに対し、およそ3時間。

Related information