Platform for Drug Discovery


UCSCからの既知リピート領域情報の取得とMaserへのアップロード方法


Table of contents


このページについて


  • UCSCテーブルブラウザから、特定のゲノムバージョンに対するリピートマスカーアノテーションデータを取得できます。
  • このページでは既知リピート情報をBEDフォーマットで取得する方法を説明します。

UCSCからのリピート情報の取得


  1. UCSC Genome Bioinformaticsのページにアクセスします。
    • Image
    • 左のメニューから"Table Browser"と書かれたリンクを開きます。
  2. ダウンロードデータの種類と書式を指定するために、ダウンロードオプションの選択し情報を記入します。
    • Image
    • ここからもページにアクセスできます。
    • この例では、ヒトのゲノムバージョンはGRCh37/hg19です。
    • 以下を確認して下さい。
      出力書式output formatBED
      出力ファイル名output file"任意の名前.bed.gz"この例では"hg19.RepeatMasker.20131009.bed.gz"
      圧縮の有無file type returnedgzip compressed
    • ファイルフォーマットや、圧縮の有無、ファイル名の接尾辞(拡張子)が一致していない場合、アップロード処理や、解析処理が失敗するので注意が必要です。
  3. "get output"ボタンを押します。
  4. "get BED"ボタンを押してダウンロードを開始します。
    • Image
    • ダウンロード後、指定した名称のリピートデータファイルが得られます。
    • Image

Maserへのデータアップロード


  • Maserにデータをアップロードするために、詳細はこちらのページをご覧ください。
  1. アップロード対象のプロジェクト画面を開き、"Upload My Data"ボタンを押します。
    • Image
    • 今回のような小さいデータのアップロード時はHTTPプロトコルを選択する方が簡単です。
  2. データタイプを選択し、アップロードするデータのプロパティを記入します。
    • Image
    • Data Label:データラベルにはデータ識別のための任意の名前を記入して下さい。
    • Data Type:データタイプにはBEDを選択します。
    • Data File:ご自身のコンピュータ上からダウンロードしたデータを選択します。
  3. アップロードボタンを押します。
    • アップロードボタンを押した後、ファイルアップロードと解凍処理が進みます。
    • 数十秒後アップロードが終了します。
    • "Open Project Detail window"ボタンを押します。
  4. プロジェクト詳細画面(Project Detail)の下の方に、アップロードされたデータのアイコンが確認できます。
    • Image
    • これでアップロードは終了です。