Platform for Drug Discovery


Bismark base multi sample comparison pipeline(PE, with RefFlat annotation)


Introduction


    多サンプル間のメチル化率の総当たり比較パイプライン。バイサルファイト(Bisulfite)処理後のリードのマップにはBismarkが用いられます。

    Input formatfastq (paired-end), bed, genePred(refFlat)
    Library layoutFor paired-end read only
    SpeciesUnspecified
    Execution timeAbout 5 hours. (3 samples that contain about 4 million reads)


    Results

    Image Image

Table of contents


Inputs


    入力1~10:fastq (paired-end)

    • バイサルファイト処理済みのペアエンドのショートリード配列ファイルをfastq(ペアエンド)形式で指定します。
    • 比較するサンプルごとに2~10ペアを指定します。入力3~10は省略可能です。
    • データ型の説明はこちらをご覧ください。

    入力11:bed (RepeatMasker BED)

    入力12:bed (Known CpG island region info.)

    • サンプル間でメチル化の比較の単位となる領域の情報をBED形式で渡します。
    • この例ではUCSC Table Browserから取得した、既知のヒトCpGアイランド情報を使用しています。結果的に、サンプル間の検定比較の単位はそれぞれのCpGアイランドになります。
    • 場合によってはターゲットメチローム解析のターゲット領域を利用したり、既知情報が不明な場合に固定長で染色体を分割して網羅的に差のある領域を探索するなどの利用も可能です。
    • 既知ヒトCpGアイランド情報の入手方法とアップロード方法はこちら。
    • データ型の説明はこちらをご覧ください。

    入力13:genePred(refFlat) (Annotation by RefFlat)

    • RefFlatアノテーションはUCSCが提供する既知遺伝子情報ファイルで、GTF形式に次いで良く利用される書式の一つです。
    • RefFlatファイルのアノテーションは日々更新されているため出来る限り新しいものを利用するのが好ましいですが、複数のバージョンが混在すると遺伝子の対応付けに支障を来たすため、一連の解析では同じファイルを利用するのが好ましいです。
    • 入手方法とアップロード手順はこちら
    • データ型の説明はこちらをご覧ください。

Pipeline history

Outputs


    Image
    (1) Mapping statistics
    Image
    (2) Raw read level mapping status on Genome Explorer
    Image
    (3) Pileup methylation level on Genome Explorer
    Image
    (4) Whole genome statistics on/off the region
    Image
    (5) Comparison results

    (1) Mapping statistics

    • バイサルファイト処理後リードのゲノムへのマッピングをBismarkで実行した結果のファイル群。
    • クリックしてサブウインドウのダウンロードボタン(黄色い下矢印アイコン)をクリックすると、以下のようなダウンロード用のサブ画面が表示されます。
    • (何某)_bismark_bt2_PE_report.txt
      • マップ率等のマッピング統計が記載されたファイルです。
      • ファイル名はバージョンによって少し異なる場合があるので、ファイルサイズが小さい方という見方が確実です。
    • (何某)_bismark_bt2_pe.sam
      • マッピング結果ファイルそのもので、サイズも大きいので専用のプログラム等で取り扱う他は直接参照する機会はあまりないでしょう。
      • ファイル名はバージョンによって少し異なる場合があるので、ファイルサイズが大きい方という見方が確実です。
      • このデータ型を複数ファイルでマージする単体パイプラインも存在するので、全ゲノムバイサルファイト処理のサンプル等で、複数レーンにまたがる場合は、マッピングを単体で実行した後に、マージするのをお薦めします。
    • 詳しい説明は以下の情報などをご参考に下さい。

    (2) Raw read level mapping status on Genome Explorer

    • 当プロジェクトで開発されたゲノムブラウザGenomeExplorerでメチル化状態の情報を含む生リードレベルのマッピング状況を確認できます。
      • この場合はサンプル数が3つで、関連情報が3つなので、3+3=6個のGenomeExplorer用データアイコンの下の"Select"ボタンを押した後、ポップアップしたサブ画面の"Genome Explorer"ボタンを押すことで、既知遺伝子アノテーション、各サンプルの生リードのメチル化状況、検定の単位となる既知CpGアイランド情報、解析から除外したリピート領域の情報の各トラックが同時にGenomeExplorer上で確認することができます。
    • Image
      How to change Bisulfite reads mapping tracks
      Image
      How to change display mode for annotation tracks
      Image
      After setting display mode
      Image
      Before setting display mode
      • 現在のバージョンではパイプラインの実行直後のGenomeExplorerのトラックの表示モードがBisulfite処理用になっていないので、上の右下の図が表示されます。
      • サンプルごとのバイサルファイト処理後リードのトラックを修飾塩基(メチル化含む)モードで表示するには、上の左上の操作のように表示モードの切り替えを行います。トラック名選択時にキーボードのShiftボタンを押しながら選択すると、複数のトラックの表示を同時に切り替えることができます。
      • 既知遺伝子アノテーションや、既知CpGアイランド等のアノテーショントラックをConnected Boxと呼ぶexon/intron構造が分かる棒状で表現するモードに切り替える為には、上の右上の操作のように表示モードの切り替えを行います。トラック名選択時にキーボードのCtrlボタンを押しながら選択すると、複数の隔たったトラックの表示を同時に切り替えることができます。
    • Image
      Color legend of methylation types, mismatches and InDels
      Image
      How to switch the display presence or absence of methylation for each type
      • GenomeExplorerでは、マッピングプログラムのBismarkが区別するゲノム中のC(あるいは相補鎖のG)が出現するコンテキストを区別して、表示色を変えています。
      • コンテキストごとの着色の有無を切り替えるには、設定画面を呼び出し、表示したくない色のチェックボックスはずしてOKボタンを押します。
      • Bismarkの結果は、メチル化塩基と、それ以外のミスマッチ、InDelの情報を含んでいます。ミスマッチInDelはすべて同じ灰色で表現されるので、メチル化情報と区別できます。塩基多型表示モードでは、ミスマッチの種類や、InDelを別の色で区別することもできます。
    • 着色塩基CG,CHG,CHH,ミスマッチInDelCGのみCHGのみCHHのみ
      チェック状況Image Image Image Image
      広域表示Image Image Image
      1塩基表示Image Image Image Image
      • 哺乳類ではCGのメチル化状況が発現抑制に影響することが良く知られていますが、今回用いたテストデータはヒトの細胞株のデータであり、上の表示箇所ではサンプル間でCGのメチル化状況のみ顕著に異なることが確認できます。

    (3) Pileup methylation level on Genome Explorer

      • 塩基座標ごとにCとメチルCを集計した情報をもとに、GenomeExplorerにデータをロードした結果です。
      • Bismarkのパイプラインでは、生リードマッピング結果より情報量の低下し、C以外のカバレージの情報やミスマッチ,InDelの情報などが省かれます。
      • 生リードのマップ状況よりデータが圧縮されているため、より高速にアクセスできる利点があります。
      • 表示モードの切り替えは、生リードのマップ状況と共通です。

    (4) Whole genome statistics on/off the region

    • Image
    • ファイル共通の列の説明
      #列名説明
      1chrom染色体名。全体統計の場合は"."です。
      2strPosゲノム中の領域の開始座標。全体統計の場合は"."です。
      3endPosゲノム中の領域の終了座標。全体統計の場合は"."です。
      4idエントリーの識別子。全体統計の場合は"Total_count"です。
      5typeCG/CHG/CHH/UNKNOWNまたは、"."です。オプションによってCH/CHG/CHHを区別して集計するか否かが異なります。UNKNOWNは、ゲノム配列に"N"等が含まれてコンテキストが不明な場合のステータスを表します。
      6strandゲノムの順鎖(+)・逆鎖(-)のどちらにマップされた情報の集計かを示します。区別しない場合は"*"。
      7(サンプル名): variant baseサンプルごとのメチル化塩基の数です。方向を考慮しない場合はCだけでなく、相補のGも計上されます。リピート領域に重複した部分は計上されません。
      8(サンプル名): total baseサンプルごとの全Cの数です。方向を考慮しない場合はCだけでなく、相補のGも計上されます。リピート領域に重複した部分は計上されません。
    • 以下の2ファイルがダウンロードできます。
      • (何某).withAnn.stat.txt
        • ユーザーから与えられた調査対象領域(この場合は既知CpGアイランド)のサンプルごとのメチル化状況の全体統計です。
        • 与えられた領域がエントリー間で重複する場合は、同じ座標のメチル化Cや非メチル化Cを重複カウントしません。領域の和集合内での集計と同義です。
        • もし、領域ファイルを既知遺伝子のプロモーター領域、エクソン領域、イントロン領域、遺伝子間領域などの領域ファイルを用意すれば、それらの領域ごとの全ゲノム統計を算出することも出来ます。
      • (何某).withoutAnn.stat
        • ユーザーから与えられた調査対象領域以外の領域(この場合は既知CpGアイランド外)のサンプルごとのメチル状況の全体統計です。
      • 実際このファイルを参照するには、クリックしてダウンロードボタン(黄色の下矢印のアイコン)をクリックした後、上図のように各ファイルにアクセスします。ファイルはタブ区切りのテキストファイルなので、Excelなどスプレッドシートで開けば表示例の表が得られます。
    • Image
      • 現在のバージョンでは自動的にグラフ描画はしませんが、上のグラフのように、全体統計の数値から、メチル化率のグラフを書くことができます。
      • サンプルごとに"variant base"(メチル化塩基数)を"total base"(総塩基数)で割って算出しています。

    (5) Comparison results

      • 与えられた領域(この場合は既知CpGアイランド)ごとの検定結果のリストです。
      • Internet Explorerでは警告メッセージがでて閲覧できないため、google chromeなどのブラウザでの閲覧を推奨します。
      • ブラウザを通じてメモリを大きく使用するため、古いパソコンなどで閲覧する場合は、他のアプリケーションを閉じるなどの対応をとって下さい。
    • Image
      • 簡易フィルタ機能を含むhtml版と、Excel等のスプレッドシートで開くことのできるcsv版が提供されていますが、本質的にはデータの内容は同一です。
      • 以下のように利点と難点がありますので、状況に応じて使い分けて下さい。
        #ファイル名の例利点難点
        1html版(何某).perEntry.tested.html簡易的なフィルタリングが容易に行えます。検定対象のエントリー数が多いと表示でません。
        Internet Explorer非対応。
        データの加工は困難。
        2csv版(何某).perEntry.tested.csvExcel等のスプレッドシート用アプリケーションで開き複雑な絞り込みや、データの加工ができます。
        データサイズが増えても大きな問題ありません。
        開くまでに手間がかかります。
        3共通点-ダウンロードしてオフラインで利用できます。
        ファイルそのものにデータを含んでいます。
    • 列の説明
      #列名説明
      1idエントリーの識別子。
      2typeCG/CHG/CHH/UNKNOWNの種類。オプションによってCH/CHG/CHHを区別して集計するか否かが異なります。
      UNKNOWNは、ゲノム配列に"N"等が含まれてコンテキストが不明な場合のステータスを表します。
      3(サンプルA名) / (サンプルB名) (Up/Down)サンプルBに対するサンプルAの増減および、検定結果を組み合わせた記号。詳しくは下表Up/Down参照。
      4(サンプル名): variant baseサンプルごとのメチル化塩基の数です。方向を考慮しない場合はCだけでなく、相補のGも計上されます。リピート領域に重複した部分は計上されません。
      5(サンプル名): total baseサンプルごとの全Cの数です。方向を考慮しない場合はCだけでなく、相補のGも計上されます。リピート領域に重複した部分は計上されません。
      6(サンプル名): ratio%サンプルごとのメチル化塩基の率です。variant base/total base。html版では%表記、csv版では率で表記されます。
      7(サンプルA名) / (サンプルB名) (difference of ratio)%サンプルAとサンプルBの比の差。ratio A - ratio B。html版では%表記、csv版では率で表記されます。
      8(サンプルA名) / (サンプルB名) (p-value)サンプルAとサンプルBのメチル化Cの頻度のフィッシャーの正確確率検定の結果のp値。
      9(サンプルA名) / (サンプルB名) (q-value)検定結果のBH法による補正後のq値。
      10(サンプルA名) / (サンプルB名) (significance)TRUE/FALSE。検定結果の符号。
      11chrom染色体名。
      12strPosゲノム中の領域の開始座標。
      13endPosゲノム中の領域の終了座標。
      14strandゲノムの順鎖(+)・逆鎖(-)のどちらにマップされた情報の集計かを示します。区別しない場合は"*"。
      15GE linkGenome Explorerへのリンク。
      16UCSC linkUCSC Genome Browserへのリンク。
      17annotation入力として渡されたrefFlat既知遺伝子情報に対する重なり状況を示す列。
    • Up/Down列の意味
      equalメチル化率が、サンプルAとサンプルBで一致する場合
      upメチル化率が、サンプルBに対してサンプルAが高い場合かつ検定結果が有意でない場合
      sigUpupかつ検定結果が有意の場合
      downメチル化率が、サンプルBに対してサンプルAが低い場合かつ検定結果が有意でない場合
      sigDowndownかつ検定結果が有意の場合
      no dataどちらか一方の分母(総数)が0の場合
    • annotation列の意味
      • Image
      • 当該領域の近傍の遺伝子等の情報列です。
      • ":"記号で区切られた要素の意味
        #値の例意味
        1TACSTD2___NM_002353___8475"___"で区切られた、geneSymbol、Accession number,遺伝子とisoformの通し番号で、遺伝子・isoformの識別子。
        1'CDS / ncRNA / 5_prime_UTR / 3_prime_UTRCDS:CoDing Sequenceの略。被翻訳領域であることを示します。
        ncRNA:当該遺伝子またはisoformがncRNAであることを示します。
        5_prime_UTR:5'UTRであることを示します。
        3_prime_UTR:3'UTRであることを示します。
        2exon(1) / intron(1) / upstream / downstreamexon(n):当該遺伝子のn番目のエクソンであることを示します。
        intron(n):当該遺伝子のn番目のイントロンであることを示します。
        upstream:当該遺伝子の一定長以内の上流配列であることを示します。
        downstream当該遺伝子の一定長以内の下流配列であることを示します。
        3ABS_POS(59041856,59042828)当該アノテーションのゲノム上の絶対座標を示します。この場合は59041856が開始座標で59042828が終了座標です。
        4-1REL_POS_FROM_STR(-157,815)当該アノテーション(エクソンやイントロン)の、この領域(CpGアイランド)の開始座標から見た相対座標。
        マイナスの数値は上流にあることを意味します。
        この場合は、CpGアイランド開始位置の157塩基上流からこのアノテーションが始まり、
        同じく開始位置の815塩基下流で終わることを示します。
        4-2REL_POS_FROM_END(-1439,-467)当該アノテーション(エクソンやイントロン)の、この領域(CpGアイランド)の終了座標から見た相対座標。
        マイナスの数値は上流にあることを意味します。
        この場合は、CpGアイランド終了位置の1439塩基上流からこのアノテーションが始まり、
        同じく終了位置の467塩基上流で終わることを示します。
    • GenomeExplorerへのリンク
      • html版からのGEへの遷移
        csv版からのGEへの遷移
      • html版、csv版どちらも、右端近くの"GE link"列からGenome Explorerに遷移することができます。
      • html版ではwebページ上の"Link"ボタンを押せば別画面でサンプル選択済みのGenomeExplorerが起動します。
      • csv版ではLinkマスにあるURLをコピーしてブラウザで開くとURL中のパラメータで指定されたサンプルが選択された状態でGenomeExplorerが起動します。
      • 青緑と、緑の点線矢印にあるように、リンクのあった行が表示されていることが確認出来るかと思います。
      • 上で記載したGenomeExplorerの参照方法のときのように全サンプルのアイコンを選ぶ必要はありません。
      • Genome Explorerでの参照方法は、こちらをご参照ください。
      • 現在のバージョンでは、GenomeExplorerへの遷移の度に、初期表示に戻ってしまうため、複数の領域を逐次的に見たい場合は、GenomeExplorerのsearch機能で、場所だけ移動すると便利です。
    • 開閉式の簡易フィルタと列説明
        • html版では、画面の左上開閉式の簡易フィルタの指定箇所(column filter)と、列の説明文(legend)があり、マウスでクリックするたびに開閉します。
    • 簡易フィルタとソート
      • 簡易フィルタ
        ソート
      • 画面左上の"column filter"をクリックすると開かれる選択ボックスやスライダーを利用すると、結果列をフィルタリングすることができます。
      • フィルタの例
        • CG/CHG/CHHの種類によるフィルタ
        • Up/Downの種類によるフィルタ
        • スライダーにより値の範囲を指定したフィルタ
        • 有意差の有無によるフィルタ
        • 染色体の指定や、ゲノムの位置によるフィルタ
        • アノテーション付けされた遺伝子名や、Accession numberによる部分一致フィルタ
      • html版の結果の任意のカラムラベルをクリックすると、その列で結果のソートが出来ます。
        • p値やq値は指数表記も適切に並べ替えられます。

    How to run this pipeline


      • 解析実行の流れの詳細はこちらをご確認ください。
      • 実行するプロジェクト内に入力となる配列ファイル(2~10個)と、アノテーションファイルをアップロードしておきます。
      • アップロードしたファイルのデータアイコンの下の"Select"ボタンを押した後、"Analysis"ボタンを押します。
      • 選択されたファイルのデータ型に応じた解析の選択肢がリストされるので、その左のメニューから"BS-seq"を選び、このパイプラインを選びます。
      • 選択された入力ファイルの確認と、プロジェクト(ワークスペース)に誤りが無いかを確認します。
        • 特にデータ形式が同じリピート領域情報と、既知CpG領域情報の順番を間違えないよう気をつけて下さい。逆になっていた場合は、ドラッグアンドドロップで置き換えができます。
      • ヒトのデータであれば、そのままデフォルトオプションで"Run"ボタンを押し実行することもできますが、実行条件を変えたい場合や、他の生物種のデータを利用する場合は、"Set option and run"を押して、オプション選択画面に遷移します。
      • オプション選択についての詳細は下のOptionsの項目をご覧ください。

    Options

    • 設定可能な実行オプション値と説明は以下にあります。
    • 特に後半のオプションを変更される場合は、機能ごとに実行可能な単品パイプラインで動作確認を行った後に利用した方が、無駄な待ち時間を減らせる可能性が高いので、検討下さい。
    • #オプション番号オプション名重要性説明
      1パイプライン共通GENOME_IDゲノムのバージョンで、ヒト以外の生物種の配列を指定する場合は必須です。選択肢にない生物はご相談ください。
      2パイプライン共通bismark version-Bisulfite処理後リードをゲノムにマッピングする際に使用するBismarkプログラムのバージョンを指定します。
      3パイプライン共通bowtie2 version-Bismarkの内部エンジンとして使用されるBowtieプログラムのバージョンを指定します。
      4パイプライン共通bismarkSamToGeTsv -dBismarkの結果をゲノムビューワ(GenomeExplorer)で可視化する際に、鎖の方向を考慮するかどうかを指定します。チェック有の場合、順鎖と逆鎖の2トラックが分かれて表示され、チェック無の場合は順鎖方向と逆鎖方向の両方が1トラック内に表示されます。
      5パイプライン共通bismarkSamToGeTsv -mBismarkの結果をゲノムビューワ(GenomeExplorer)の修飾塩基表示モードで可視化する際に、ミスマッチやInDelを表示させるかどうかを指定します。
      6パイプライン共通bismarkSamToMetSamLike -aBismarkの結果をゲノムビューワ(GenomeExplorer)の修飾塩基表示モードで可視化する際に、ゲノム中のコンテキストに関わらず表示させます。下の-z,-x,-cオプションを全て付加した場合と同義です。
      7パイプライン共通bismarkSamToMetSamLike -zBismarkの結果をゲノムビューワ(GenomeExplorer)の修飾塩基表示モードで可視化する際に、ゲノム中のコンテキストがCGかその相補鎖の場合を表示します。このオプションが付加された場合は-aオプションは無視されます。
      8パイプライン共通bismarkSamToMetSamLike -xBismarkの結果をゲノムビューワ(GenomeExplorer)の修飾塩基表示モードで可視化する際に、ゲノム中のコンテキストがCHGかその相補鎖の場合を表示します。このオプションが付加された場合は-aオプションは無視されます。HはG以外の塩基を意味します。
      9パイプライン共通bismarkSamToMetSamLike -cBismarkの結果をゲノムビューワ(GenomeExplorer)の修飾塩基表示モードで可視化する際に、ゲノム中のコンテキストがCHHかその相補鎖の場合を表示します。このオプションが付加された場合は-aオプションは無視されます。HはG以外の塩基を意味します。
      10パイプライン共通samtools version-塩基修飾部位をコールする際に使用するsamtoolsのバージョンを指定します。
      11パイプライン共通methylationCallFromMetSamLike
      min read num
      塩基修飾部位をゲノム座標ごとにコールする際に一定カバレージ以上ない場合を無視します。デフォルトの10が指定された場合、ゲノム座標あたり10リード未満の箇所はコールされません。
      12パイプライン共通methylationCallFromMetSamLike
      directionality
      -塩基修飾部位をゲノム座標ごとにコールする際に順逆の鎖を考慮しません。後のオプションで再度順逆の考慮の有無を聞く箇所があり、このチェックを外すと内部処理で余計なログが発生するので特別な理由がない限りは外さないでください。
      13パイプライン共通Load directionalityBismarkの結果をゲノムビューワ(GenomeExplorer)で可視化する際に、鎖の方向を考慮するかどうかを指定します。"directional"指定の場合、順鎖と逆鎖の2トラックが分かれて表示され、"non-directional"s指定の場合は順鎖方向と逆鎖方向の両方が1トラック内に表示されます。 bismarkSamToGeTsv -dと矛盾しないように設定する必要があります。
      14パイプライン共通BEDTools version-リピート領域の情報のフィルタアウトと、アノテーション情報の付加時に使用するBEDtoolsのバージョンを指定します。
      151.1Common option for output file prefix-サンプルごとの結果をマージ後、マージした出力ファイル群のプレフィックスに使用される文字列です。
      161.2MergeMultiBasalVarInf -l入力したサンプルごとの出力ラベルに利用される文字列で、Bisulfite処理後リードのファイル数分カンマ区切りで指定する必要があります。複数のfastqファイルが単一サンプル由来の場合は、fastqをあらかじめマージするか、こちらのコースパイプラインを利用せず、bismarkの単体実行後にマージすることをお薦めします。
      172.1sumUpVarInfOutWithBed.pl -s塩基修飾の数を指定領域ごとに集約し、サンプル間の比較検定を実行する際に、領域あたり、順鎖、逆鎖の区別を行うかどうかを指定します。チェック有の場合は、指定領域で順鎖方向の情報と、逆鎖方向の情報が別々に集約され、検定されます。デフォルトでは順逆の区別を行いません。
      182.2sumUpVarInfOutWithBed.pl -z全てのサンプルで0カウントの塩基領域を出力に含めません。出力ファイルサイズを圧縮したい場合などに指定します。
      192.3sumUpVarInfOutWithBed.pl -t塩基修飾の数を指定領域ごとに集約し、サンプル間の比較検定を実行する際に、領域あたりゲノムのコンテキストのCG、CHG、CHHを区別するか否かを指定します。チェック有の場合は、CGとCHG、CHHが独立に集約され、検定さるため、1指定領域あたり、3行(向きを考慮する場合は6行)が出力されます。
      203.1standardGenePredToExonIntronBed6 -u既知遺伝子アノテーションを付加する際に、遺伝子の指定領域上流にあることを示す際に利用します。デフォルトでは500塩基上流を含めています。
      213.2standardGenePredToExonIntronBed6 -d既知遺伝子アノテーションを付加する際に、遺伝子の指定領域下流にあることを示す際に利用します。デフォルトでは500塩基下流を含めています。
      223.3standardGenePredToExonIntronBed6 --suppress_exon-既知遺伝子アノテーションを付加する際にexon領域を含めるか否かを指定します。
      233.4standardGenePredToExonIntronBed6 --suppress_intron-既知遺伝子アノテーションを付加する際にintron領域を含めるか否かを指定します。
      243.5standardGenePredToExonIntronBed6 --suppress_CDS-既知遺伝子アノテーションを付加する際に、exon情報に加えCDS(被翻訳領域)かどうかの情報を加えるか否かを指定します。CDSであるか5'UTR、3'UTRに興味がない場合はチェックを外したほうが、アノテーション行がシンプルになります。
      253.6standardGenePredToExonIntronBed6 --suppress_ncRNA-既知遺伝子アノテーションを付加する際に、non-codingRNAであるか否かの情報を含めるか否かを指定します。Non-codingRNAかコーティングRNAかに興味がない場合はチェックを外したほうが、アノテーション行がシンプルになります。
      264.1Load directionalityオプション名上は区別がつきませんが、リピート領域の情報をゲノムビューワ(GenomeExplorer)に取り込む際に、順鎖・逆鎖の区別するか否かを指定します。"directional"指定の場合、順鎖と逆鎖の2トラックが分かれて表示され、"non-directional"s指定の場合は順鎖方向と逆鎖方向の両方が1トラック内に表示されます。 尚、この指定の有無に関わらず、リピート領域からの除外の処理は順鎖・逆鎖の区別は行わずに集約対象から除外されます。
      275.1Load directionalityオプション名上は区別がつきませんが、検定対象となる修飾塩基の集約単位の領域(例えばCpGアイランド)をゲノムビューワ(GenomeExplorer)に取り込む際に、順鎖・逆鎖の区別するか否かを指定します。"directional"指定の場合、順鎖と逆鎖の2トラックが分かれて表示され、"non-directional"s指定の場合は順鎖方向と逆鎖方向の両方が1トラック内に表示されます。
      286.1Gene ID type既知遺伝子領域をゲノムビューワ(GenomeExplorer)に取り込む際に利用される遺伝子ラベルの形式を指定します。"a"指定時はaccession番号のみ、"g"指定時はgene symbolのみ、"c"指定時は、gene symbolとaccession番号と枝番を組み合わせた複合IDが表示されます。
      296.2Load directionalityオプション名上は区別がつきませんが、既知遺伝子領域をゲノムビューワ(GenomeExplorer)に取り込む際に、順鎖・逆鎖の区別するか否かを指定します。"directional"指定の場合、順鎖と逆鎖の2トラックが分かれて表示され、"non-directional"s指定の場合は順鎖方向と逆鎖方向の両方が1トラック内に表示されます。
      307.1MultiVarInfAllCombinationTest q-valueサンプル間の修飾塩基の割合がサンプル間で違うか否かのq-valueの閾値を指定します。
      318.1addAnnotaionOfOverlappingBedEntries --suppress_absolute_pos-遺伝子アノテーション行にアノテーションの絶対座標を表示させるか否かを指定します。付加されたアノテーションの染色体の座標に興味がない場合はチェックを外したほうが、アノテーション行がシンプルになります。
      328.2addAnnotaionOfOverlappingBedEntries --suppress_relative_pos-遺伝子アノテーション行にアノテーションの検定対象領域からの相対座標を表示させるか否かを指定します。付加されたアノテーションの同一染色体上の相対座標に興味がない場合はチェックを外したほうが、アノテーション行がシンプルになります。
      338.3addAnnotaionOfOverlappingBedEntries --suppress_pos_prefix-遺伝子アノテーション行に絶対座標の前の"ABS_POS"、相対座標の"REL_POS_FROM_STR"、"REL_POS_FROM_END"という文字列を含めるか否かを指定します。

    Comments

    • ヒト(hg19)とマウス(mm9)以外にも、シロイヌナズナ、UCSC Genomeに登録されている殆どの生物種に対応しました。

    Use case

    Related information