Platform for Drug Discovery


[日本語]

FAQ


Index


FAQ


はじめに

Pipeline

  • Q. 対応する生物種を増やしてもらえませんか?

    ご要望を、問合せ窓口Image まであげて下さい。全ての要望にお応えはしかねますが、改善を検討します。パイプライン毎に、解析可能な生物種は異なりますのでご注意下さい。
    Genome Explorerが表示できる生物種とゲノムは「対応生物種とゲノム」をご覧下さい。
  • Q. illumina用パイプラインでRoche 454やIon Torrentのデータを解析できますか?

    解析できないとお考え下さい。
    シーケンサの機種によって、データ形式やリード長が異なります。パイプラインを実行しようとしてもデータを選択できないか実行できてもAbortする、または解析は無事に終了したが不適切な結果になるなどの事態が発生します。
  • Q. nAnT-iCAGE、RECLUで解析する際、MAPQ の閾値(初期設定値)は?

    nAnT-iCAGE の CTSS を作成する場合は、MAPQ>20 となります。
    その他は特に MAPQ でのフィルターは行なっていません。

  • Q. 独自のゲノムの場合、 「GATK UnifiedGenotyper」 パイプラインを実行する際のポイントは?

    独自のゲノムで 「GATK UnifiedGenotyper」 パイプラインを実行する場合は、入力データを指定する fasta (nucleotide)箇所に、使用したFASTAファイルが必要です。

  • Q. マッピング解析後にエクソン領域と前後10~20bp程度を取り出して、 「GATK UnifiedGenotyper」 でSNV情報を解析できるパイプラインはありますか?

    Exome領域を指定するパイプラインはありません。
    しかし、別途、Exome 領域の Fasta データを作成すれば 解析可能です。以下のページをご参照下さい。
    SNP_INDEL_calling.html

  • Q. 「RECLU」 の Stability の plot で、green と red は IDR の閾値のみで決定されていますか?

    IDRの閾値のみで決定されています。

  • Q. 以前利用していたパイプライン 「DEGseq calc expression (user annotation)」が見当たらないのですが?

    名称を変更して 「Count up tag counts by DEGseq getGeneExp (user annotation by RefFlat)」 というパイプラインになっています。

  • Q. 真核生物のドラフトゲノム配列から、遺伝子予測を行うパイプラインはありますか?

    現状では、遺伝子予測を行うパイプラインとして「maker」、CDS予測を行うパイプラインに「FrameDP: CDS predictor」があります。

  • Q. Paired End シーケンスにたいして、クロモソームをまたいでマッピングできるパイプラインは?

    「BreakDancer」というパイプラインがあります。以下のページをご参照ください。
    P000001201.html

  • Q. 「Maker」パイプラインで interval ファイルを入れることはできますか?

    現在のところ、interval ファイルを入れることは不可能ですが、以下のようなコマンド引数で複数指定する機能は利用可能です。
    -L chr1:100-200 -L chr2:500-600

  • Q. 検出した SNV に dbSNP の rs numberを付加したいのですが、GATK UnifiedGenotyper のオプションとして「-D,--dbsnp <dbsnp>」 や 「-A,--annotation <annotation>」を入れることはできますか?

    「-A,--annotation <annotation>」 は指定可能です。アノテーションで指定できる項目名は、以下のページをご参照下さい。
    http://www.broadinstitute.org/gatk/guide/tagged?tag=variantannotator%20annotations

  • Q. 登録したデータに対してパイプラインを実行したのですが、Abort になってしまいます、どうすればよいですか?

    以下点を確認してください。
    1. 登録したデータ内にファイルは存在していますか? ⇒ ファイルが無い場合には、再度データを登録し、パイプラインを実行してみてください。
    2. ファイルのサイズは 0 byte ではありませんか? ⇒ 0 byte の場合には、お手持ちのファイルサイズを確認の上、再度データを登録し、パイプラインを実行してみてください。
    3. ファイル名に全角文字は入っていませんか? ⇒ 全角文字が入っていた場合、お手持ちのファイル名から全角文字を無くし、再度データを登録し、パイプラインを実行してみてください。
    上記のどれにも該当しない場合には、問い合わせ窓口Image にご相談下さい。

  • Q. RNA-seqのデータをトランスクリプトームデータにマップし、各遺伝子ごと(もしくは転写産物ごと)にタグ数をカウントできるパイプラインはありますか?

    「Count up tag counts by HTSeq (user annotation by GTF, for single-end or name sorted pair)」 パイプラインにて可能です。
    また、別に、NGS surfer's wikiで、HTSeq を用いたコマンドラインでのカウント方法と、スプライスサイトをまたいだリードの扱いについて記載してあるのでご参照ください。
    https://cell-innovation.nig.ac.jp/wiki/tiki-index.php?page=HTSeq+count

  • Q. 「bam->fasta」 パイプラインで、入力にリファレンス配列指定があり、またオプションにも GENOME_ID の指定がありますが違いや関係性は?

    「bam->fasta」パイプラインでは、リファレンス配列を利用し、samtools mpileup を行っています。リファレンス配列が指定されていなければ、オプション指定された GENOME_IDの配列を利用するという仕組みになっています。

  • Q. 解析にかけるデータの最初と最後の数塩基(指定)を除いてアライメントしたい場合、どうしたらよいですか?

    「Flexbar(SE)」というパイプラインで、リードの最初と最後の数塩基を除外することができます。
    こちらで、前処理した後に、ご希望の解析を行うことができます。

    ■Flexbar(SE)
    P000001395.html

    ※Analysis画面の左にあるカテゴリで、Tools > Preprocessingに存在します。
     オプション指定で、以下を指定すると、リードの左と右の指定した数の塩基を除去することができます。
      -x, --pre-trim-left NUM
       Trim given number of bases on 5' read end before detection.
      -y, --pre-trim-right NUM
       Trim specified number of bases on 3' end prior to detection.

     (例) Additional below parameters will be also added.のオプションで 5'end 3塩基、 3'end 2塩基を除外したい場合の指定例:
       -f i1.8 -u 5 -x 3 -y 2

  • Q. 「Bowtie, eXpress and edgeR」 パイプラインで 利用するカウントデータは est_counts と eff_count どちらを利用していますか?またその理由は?

    eff_countsを用いているのは、eXpressの推奨だからです。

    eff_countsとest_countsの違いは、eXpressが提唱するモデルで、補正をするか否かで、教えて頂いた方法はeXpressの補正を使わず、純粋にターゲットへのリードの張り付きで解析しているようです。

    • est_counts : ターゲットのリード張り付き確率の推定を行う
    • eff_counts : 最尤法を用い長さや配列の偏りを補正した値

    eXpressは、当然ですがeff_countsの利用を推奨しており、Trinity, Bowtie, eXpress and edgeRのパイプラインもこちらを利用しています。

    ■eff_countsの説明箇所
    The estimated number of fragments generated from this target in the sequencing experiment, adjusted for fragment and length biases.
    In other words, his is the expected number of reads from the experiment if these biases did not exist.
    This is the value recommended for input to count-biased differential expression tools.
     ※eXpressのManualページで"Output Files"のセクションをご覧ください。
      http://bio.math.berkeley.edu/eXpress/manual.html

  • Q. エクソーム解析のパイプラインはありますか?

    ヒトのエクソーム解析であれば、下記パイプラインがお勧めです。
    ■BWA, GATK and snpEff + GE (human (hs37d5) only, PE)
    P000001190.html

    ヒト以外の生物種でしたら、複数の解析パイプラインを組み合わせる必要がありますが、下記ページを参考に試してください。
    SNP_INDEL_calling.html
    結果として、SNP, INDELリストである (VCFファイル)を得ることができます。

  • Q. 「MaserのGO analysis for Trinity-eXpress」 パイプラインの結果に表示される GO term で、入力の GO term にないものが入っているのはなぜですか?

    内部的に GO term を付与しているからです。
    GO termは階層構造を持ちますが、入力のGO termより上位の GO termを内部的に追加して解析しています。

  • Q. 「Revigo」 パイプラインの入力画面に表示されるGO termとp-value のリストで、p-value は何に対しての有意差ですか?

    クラスター未分類(発現変動がない遺伝子群)に比べて、注目するクラスター(k)で有意に出現するGO termを、Fisher's exact test で検定した時のP-valueになります。
    GOには、3つのカテゴリがあり各カテゴリごとに検定して P-value の閾値(初期値0.001)以下のものをリストアップします。

  • Q. パイプライン 「Picard MarkDuplicates and GATK IndelRealigner」 で、入力に BAM と VCF データを同時に指定するとエラーになるのはなぜですか?

    BAM では染色体番号を chr1,chr2,...としているのに対し、VCF データでは染色体番号を 1,2,... と chr なし になっており、フォーマットの違いがあるため、エラーとなります。

  • Q. パイプライン「BWA, GATK and snpEff + GE (human (hs37d5) only, PE)」の実行時、実行結果のデータセット「tree and pc image」参照時にエラーとなるのはなぜですか?

    実行結果のデータセット「tree and pc image」は「個体間の類似性解析の結果」を表すもので、入力時、単一の fastq を指定すると結果が得られません。
    よって、入力に複数の fastq を指定することで、「tree and pc image」の結果が得られます。

  • Q. パイプライン「TopHat2, CuffLinks2 and CummeRbund + GE (SE)」において、特定のサンプルの特定の遺伝子に対して、FPKM が一意に決まらないのはなぜですか?

    FPKM の値が、特定のサンプルの特定の遺伝子に対して一意に決まる手法もあれば、一意に決まらない手法もあります。
    Cufflinks では normalization methods として、3種類の手法がサポートされています。
    手法、及び、パイプラインのオプション「1-15 "cuffdiff v2.0.2 option"」での指定方法を以下にまとめます。

    Normalization Method Pipeline options specification method Description
    classic-fpkm --raw-mapped-norm Library size factor is set to 1 - no scaling applied to FPKM values or fragment counts. (default for Cufflinks)
    geometric --geometric-norm FPKMs and fragment counts are scaled via the median of the geometric means of fragment counts across all libraries, as described in Anders and Huber (Genome Biology, 2010). This policy identical to the one used by DESeq. (default for Cuffdiff)
    quartile -N/--upper-quartile-norm FPKMs and fragment counts are scaled via the ratio of the 75 quartile fragment counts to the average 75 quartile value across all libraries.


Maser

  • Q. How do I upload my local huge data?

    SFTPのアップロードを試してみてください。大量にデータがある場合は個別に問合せ窓口Image に相談して下さい。
    個別相談となりますが、ハードディスクで受付ける方法もあります。

    WinSCPを用いたデータのアップロード方法は、「How to install and use WinSCP」のページをご参照下さい。

  • Q. データ登録時に複数のデータファイルを登録できますか?

    登録するデータの型によって、登録可能なファイル名やファイル数が異なります。Data typesの説明ページでご確認下さい。

  • Q. 圧縮したファイルをアップロードしても良いですか?

    3種類の圧縮形式(GZIP形式、BZIP2形式、ZIP形式)をサポートしています。ファイル名で判定していますので登録の際にご確認下さい。
    • GZIP形式 (ファイル名) xxx.gz
    • BZIP2形式 (ファイル名) xxx.bz2
    • ZIP形式 (ファイル名) xxx.zip
    • TAR+GZIP形式 (ファイル名) xxx.tar.gz 又は xxx.tgz
    • TAR+BZIP2形式 (ファイル名) xxx.tar.bz2 又は xxx.tbz2
    【注意】ディレクトリ階層をもつ状態TARやZIPファイルを登録すると解析できません。

  • Q. 独自のゲノムを使用してマッピングできますか?

    BWAとBowtieでマッピングするパイプラインをご用意しています。マッピングは次に示す2ステップで行います。
    1. マッピング対象の配列のINDEXを作成 (Make BWA index 又は、Make bowtie index)
    2. Customゲノム対応のパイプラインで①の結果とNGS配列を指定し実行
      • Single-end配列用:BWA (SE, custom genome) 又は、Bowtie (SE, custom genome)
      • Paired-end配列用:BWA (PE, custom genome) 又は、Bowtie (PE, custom genome)
    尚、独自のゲノムをご利用の場合は現在のところGenome Explorerでマッピング結果を閲覧することができません。マッピング結果(BAM形式)をダウンロードして頂き、IGVなどのビューワをご利用下さい。

  • Q. 入力データの選択で、2つ目以降を選択できません。どうしたら良いですか?

    お使いのブラウザ依存で、複数データ選択で2つ以上データを選択する場合にそのような現象が発生します。(Internet Explorer 9, Safari 6.0で現象を確認)
    ご不便をおかけしますが、当面、以下の対応をお願いします。
    • 他のブラウザ(Chrome又はFireFox)お使い頂く
    • [select]ボタンを連打して2つ目以降のデータを登録頂く

  • Q. ファイルアップロードを行うためのSFTPのパスワードを忘れてしまいました。どうしたら良いですか?

    再発行が可能ですので問い合わせ窓口Image までご連絡下さい。

  • Q. SFTPにてファイルアップロードしたデータでパイプラインを実行したら "No such file or directory" というエラーが出ました。何が原因ですか?

    SFTPでアップロードしたファイルの権限を確認してください。解析パイプラインでは、その他の権限利用者に読める権限が必要です。
    ファイルをSFTPでアップロードした後に、ファイル権限を変更する際には下記サイトをご参照下さい。

    ■ Cyberduckでのファイル権限の変更方法
    http://webmaster.iu.edu/tools-and-guides/maintenance/chmod-ftp.phtml

    ■ WinSCPでのファイル権限の変更方法
    http://winscp.net/eng/docs/ui_properties

GE(Genome Explorer)

  • Q. 表示している画面をブックマークできませんか?

    2014年2月10日現在、その機能は提供していません。
    URLを以下のように組み合わせ、ブラウザのブックマークとすることは可能です。
    ※こちらの「Genome Explorerで特定データの特定箇所を直接開く」にも記載しています。ご参考にして下さい。


    
    http://cell-innovation.nig.ac.jp/public/gbrowser/GenomeBrowser.do?genome=[genome]&dataIdArray=[dataset id]
    &genomePosition=[chromosome]:[position]&scale=[scale]
    
    例
    [genome]    :hg19  (mm9などUCSC Genomeのゲノム)
    
    [dataset id]:DS00069587  (複数指定する場合は、カンマ「,」区切りで指定して下さい。
    
    [chromosome]:chr12
    
    [position]  :54398000 ※表示の中心で、縦の赤線が表示される箇所
    
    [scale]     :16 (8192,4096,2048,1024,512,256,128,64,32,16,8,4,2,1,detail(塩基レベルの表示)の中から選択)


CONG

  • Q. 使えるツールを増やしてもらえませんか?

    ご要望を、問合せ窓口Image まであげて下さい。全ての要望にお応えはしかねますが、改善を検討します。

全般

  • Q.Maserを利用した場合に、論文にはどのように引用すれば良いですか?

    • 本プラットホームで提供するサービスを利用して得られた結果を外部に発表する際には問合せ窓口Image までご一報ください。また下記引用をお願い致します。

       Management and Analysis System for Enormous Reads, Maser (2013).
      URL: http://cell-innovation.nig.ac.jp/index_en.html
    


    • ご利用になった解析パイプラインで用いている解析ツールの論文引用も忘れずにお願いします。

  • Q.Maserで「この接続ではプライバシーが保護されません」と警告が表示されましたが、引き続きMaserを利用することに問題はありますか?


    ※SSL更新手続きの完了に伴い、2015年9月17日より、警告が表示されなくなりました。

    2015年8月23日より、警告が表示されるようになりました。
    警告が表示されるようになった原因は、当サイトのSSL証明書(セキュアなサイトであることを第三者機関に証明して頂くための証明書)の有効期限が過ぎたためです。
    現在、SSL証明書の更新手続きを行っておりますが、Maserそのものは問題なく稼働しております。

    ただし、SSL証明書の有効期限が過ぎてしまったことと、ブラウザのキャッシュに起因して、下記の現象が起こることを確認しております。
    • ページを遷移する度に警告が出る現象
    • 一部情報が表示されない現象

    上記の現象を回避するための方法を、ブラウザ毎に記載します。

    Chromeの場合の回避方法


    1. Chromeを開き、メニューより「シークレット ウィンドウを開く」を選択する(下図の①・②)
    2. 当サイトにアクセスをすると、「この接続ではプライバシーが保護されません」と警告が表示されるが、「詳細設定」をクリックする(下図の③)
    3. 詳細情報が表示されるので、「cell-innovation.nig.ac.jp にアクセスする」をクリックする(下図の④)

    Image

    Image

    Image


    Firefoxの場合の回避方法


    1. Firefoxを開き、当サイトにアクセスをする。
    2. 当サイトにアクセスをすると、「接続の安全性を確認できません」と警告が表示されるが、「危険性を理解した上で接続するには」をクリックする(下図の①)
    3. 詳細情報が表示されるので、「例外を追加」をクリックする(下図の②)
    4. 例外の追加 Window が出現するので、「セキュリティ例外を承認」ボタンをクリックする(下図の③)

    Image

    Image

    Image


    Internet Explorerの場合の回避方法


    1. Internet Explorerを開き、当サイトにアクセスをする。
    2. 当サイトにアクセスをすると、「この Web サイトのセキュリティ証明書には問題があります」と警告が表示されるが、「このサイトの閲覧を続行する」をクリックする(下図の①)

    Image


    Safariの場合の回避方法


    1. Safariを開き、当サイトにアクセスをする。
    2. 当サイトにアクセスをすると、「Web サイト "cell-innovation.nig.ac.jp" の識別情報を検証できません」と警告が表示されるが、「続ける」をクリックする(下図の①)

    Image


  • Q.DDBJに データを登録する場合はどのファイルをアップロードすればよいですか?

    配列データ(fastq)は必須かと思いますが、BAMは論文記載上の必要に応じて登録することになると思います。
    登録内容は、CAGEの本家、RIKEN Omics Science Centerの登録情報をご参考ください。

    ◆ RIKEN Omics Science Centerの登録例
     http://trace.ddbj.nig.ac.jp/DRASearch/study?acc=DRPXXXXXX

    また、DRAのデータ登録については下記ページをご参考下さい。
    ◆ DDBJ Sequence Read Archive Handbook
     http://trace.ddbj.nig.ac.jp/dra/datafile.html

    ※登録上、ご不明な点がありましたら下記フォームよりお問い合わせ下さい。(私共とは別の窓口となります)
     http://trace.ddbj.nig.ac.jp/contact.html?db=dra


Contact us
Copyright © 2009-2017 National Institute of Genetics  [Site Policy] [Privacy Policy]