Platform for Drug Discovery


解析の実行と実行状況の確認


目次


1データ選択後に1解析を実行する


    1入力パイプラインの場合

  1. 解析を実行するプロジェクトを開きます。
    • Image
  2. 'Project Detail'画面から入力データをクリックした後、赤字で'f(x)'と書かれた解析ボタンをクリックします。
    • Image
    • この場合は、シングルエンドのFastq形式の配列ファイルを選択しています。
  3. パイプラインリストから使用したいパイプラインを選択します。
    • Image
    • カテゴリーリスト(category list)にある'(1)'のような括弧つきの数字は選択可能なパイプラインの数を意味しており、この数は選択された入力データのデータ型に依存します。
    • 今回は、'FastQC (SE)'パイプラインをカテゴリーの'Tools'-'Quality control'-'Sequence QC'から選びます。ここで、'SE'はシングルエンドを意味し、FastQCはBabraham Bioinformaticsが提供する品質制御ツールのことを指します。
    • 入力データを選択しない場合はリストされるパイプラインの数が異なります。
    • Image
      これは入力を選択しない場合のパイプラインのリストのイメージです。4つの異なる入力に対応する4つのFastQCパイプラインがリストされています。
      入力データ型として'fastq (single-end)'が選ばれた場合は、シングルエンドFastq書式用のFastQC (SE)だけがリストされます。
  4. 既に選択されている、この解析実行に用いられる入力データと、プロジェクトを確認して下さい。
    • Image
    • 入力やプロジェクトの選択をやり直すこともできます。
    • 入力やプロジェクトの選択をせずに解析を開始した場合は、このステップでそれらを選ぶ必要があります。

    実行、または、オプションを指定して実行

  • 確認後、デフォルトオプションで直ちに実行する'Run'と、オプションを指定してから実行する'Set option and run'を選ぶごとが出来ます。
  1. デフォルトオプションで直ちに実行する'Run'をクリックした場合
    • Image
    • 'Run'ボタンのクリック後、解析の入出力画面(Analysis Input and Output)から解析状況画面(Analysis Status)に遷移します。これで解析実行処理は終わりです。
    • Image
  2. オプションを指定してから実行する'Set option and run'をクリックした場合
    • Image
    • 'Set option and run'ボタンを押した後、解析オプション画面(Analysis - Option)が表示されます。
    • Image
      *
      (中略)
      *
      Image
    • ここでは、先頭にある選択ボックスでFastQCのバージョンを選ぶ他、下にある自由入力欄でその他のオプションの指定が可能です。
    • 空白で区切ることで複数のオプションを設定できます。使い方はオプション説明文に記載された利用可能なオプションについては参照して下さい。
    • 一方、ファイルパス、('&', '(', ')', ';', '`', '|'等)の特殊文字、オプション説明で予約と書かれたオプションなどは使用できません。
    • 熟練したユーザー以外は、この入力欄に入力しないことをお勧めします。
    • この欄はコマンドラインでツールを使いこなせる熟練したバイオインフォマティシャンからの利用を想定しています。これらの熟練者がチューニングしたカスタムオプションを入力しましょう。そのようなチューニング済みのオプションが参照可能であれば、誰でもこの欄に入力することが出来ます。
    • Image
    • オプション設定後、'Run'ボタンを押します。
    • 'Run'ボタンを押した後、解析オプション画面(Analysis - Option)から解析状況画面(Analysis Status)に遷移します。これで解析実行処理は終わりです。
    • Image
    • 次はパイプラインの実行状況確認を参照下さい。

複数入力選択後の解析実行


    1入力パイプラインを複数回実行する場合

    • 一度に複数実行したい場合、以下の手順を実施します。
    • Image
    • この例では、プロジェクト内に2つのfastq(single-end)データがあります。
    • データアイコンの底にある'Select'ボタンを押します。クリップボードサブウィンドウが表示されます。
    • Image
    • もう一方のデータアイコンの底にある'Select'ボタンを押します。クリップボード内のリストにデータが追加されます。
    • これら一連のデータ選択の操作は、'複数入力パイプラインの場合'と同一であることに注意して下さい。
    • Image
    • 入力が一つのパイプラインを選択します。ここでは'FastQC (SE)'を選びます。
    • Image
    • 入力の'fastq(single-end)'用の選択ボックス内に、'DRR000560.fastq(DS00164687)'と'DRR000561.fastq(DS00164688)'の2データがあることを確認して下さい。
    • 'Set option and run'ボタンか、'Run'ボタンを押します。これらの違いはこちらを参照下さい。
    • Image
    • 'Run'ボタンをクリック後、解析レコードが2つ生成されます。これは、これら一度の操作で2つの実行処理が行われたことを意味します。
    • これらのパイプラインは並列に実行されます。
    • もちろん2以上の入力でも実行できます。
    • 次はパイプラインの実行状況確認を参照下さい。

    複数入力パイプラインの場合

    • 複数入力パイプラインを実行する場合は、以下の手順を実施します。
    • Image
    • この例では、プロジェクト内に2つのfastq(single-end)データがあります。
    • データアイコンの底にある'Select'ボタンを押します。クリップボードサブウィンドウが表示されます。
    • Image
    • もう一方のデータアイコンの底にある'Select'ボタンを押します。クリップボード内のリストにデータが追加されます。
    • これら一連のデータ選択の操作は、'1入力パイプラインを複数回実行する場合'と同一であることに注意して下さい。
    • Image
    • 入力数が2以上のパイプラインを選択します。今回は、Fastqデータマージ用の'mergeFASTQ (SE) [max.10]'を選択します。
    • Image
    • 入力の順番を確認します。
    • 入力選択ボックスをドラッグ&ドロップすることで順番を変えることが出来ます。
      • Image
        ドラッグ&ドロップ操作のイメージ
    • 入力1と入力2には米印'*'があるのに着目して下さい。これは、入力1と入力2が必須だが、入力3~入力10が任意であることを意味します。このパイプラインは2以上の入力を要求するということです。
    • 'Set option and run'ボタンか、'Run'ボタンを押します。これらの違いはこちらを参照下さい。
    • Image
    • 'Run'ボタンをクリック後、解析レコードが1つだけ生成され、その'Input'列に2入力が記載されています。
    • 次はパイプラインの実行状況確認を参照下さい。