Platform for Drug Discovery


[日本語]  

Jellyfish (PE)


Introduction


    This pipeline could compute k-mer distribution. It will help you to check contamination and genome complexity.

    このパイプラインは、アセンブルを行う前に、k-mer分布を調べたい場合に使用します。k-mer分布を調べることで、これからアセンブルしようとするゲノムの複雑さや、リードのクオリティチェック、コンタミの有無などを推定することができます。


    Input formatFASTQ(Illumina, IonTorrent, etc...)
    Library layoutFor paired-end read only
    SpeciesUnspecified
    Execution timeAbout 20 min. (7M paired-end reads[150bp+150bp])

    Result
    Image
    k-mer distribution

Inputs


    ・ファイルはペアエンドのFASTQファイルを1~10サンプルの範囲で入力可能です。
    ・FASTQについては、このページをご覧ください。
    ・アップロードするファイル名にスペース「 」や、カッコ「(」、クオーテーション「'」などといった文字や日本語は使えません。(アップロードできても、解析時にエラーになります。) アルファベット+数字+アンダーバー「_」で名前を付けてください。
    ペアエンドの場合、フォワード側は「xxx_1.fastq」、「xxx_1.fq」、「xxx_1.txt」、「xxx_1_sequence.txt」、「xxx_R1_yyy.fastq」などとなっている必要があり、リバース側は「xxx_2.fastq」、・・・となっている必要があります。
    (例:my_sample_1.fastq, my_sample_2.fastq)


Outputs


    実行例
    Image

    output
    Image
    k-mer distribution

Options


Comments


    k-mer分布のメインピークを基に、ゲノムサイズの推定も可能です。
    その場合は、 {全塩基数(=(リード数) x (リード長))} x {(リード長) - (k-merサイズ(デフォルトは17)) + 1} / (リード長) / (メインピークのカバレッジ) で計算してください。
    大まかには、全塩基数をメインピークのカバレッジで割り算すれば良いです。

Use case


Related information