Platform for Drug Discovery


UCSCからの既知遺伝子アノテーション情報の取得とMaserへのアップロード方法


目次

このページについて


  • UCSCゴールデンパスのダウンロードサイトから、特定のゲノムバージョンに対する遺伝子アノテーション情報を取得できます。
  • このページでは既知遺伝子アノテーションデータをrefFlatバージョンのgenePredフォーマットで取得し、Maser上へアップロードする方法を説明します。

UCSCからの遺伝子アノテーションデータの取得


    1. UCSC Genome Bioinformaticsのページにアクセスします。
      • Image
      • 左のメニューから"Downloads"と書かれたリンクを開きます。
    2. リストから興味のある生物種を見つけます。
      • Image
    3. "Annotation database"と書かれたリンクを押します。
      • Image
      • この例ではヒト(hg19,GRCh37)を選択します。
      • 下からは古いバージョンのhg18も選択することができます。
    4. ゴールデンパスのダウンロードサイト上でブラウザの検索機能を用い"refFlat"を検索します。
      • Image
    5. リストから、"refFlat.txt.gz"をダウンロードします。
      • この際、右にあるデータ更新日をメモしておくことをお勧めします。このアノテーションデータは週に数回アップデートされるため、アップデート日がアノテーションのバージョンとして認識されるためです。
      • Image
      • ファイル名を変更し、更新日とゲノムのバージョンが分かるようにしておくことをお勧めします。
      • Image

Maserへのデータアップロード


  • Maserにデータをアップロードするために、詳細はこちらのページをご覧ください。
  1. アップロード対象のプロジェクト画面を開き、"Upload My Data"ボタンを押します。
    • Image
    • 今回のような小さいデータのアップロード時はHTTPプロトコルを選択する方が簡単です。
  2. データタイプを選択し、アップロードするデータのプロパティを記入します。
    • Image
    • Data Label:データラベルにはデータ識別のための任意の名前を記入して下さい。
    • Data Type:データタイプにはgenePred(refFlat)を選択します。
    • Data File:ご自身のコンピュータ上からダウンロードしたデータを選択します。
  3. アップロードボタンを押します。
    • アップロードボタンを押した後、ファイルアップロードと解凍処理が進みます。
    • 数秒後アップロードが終了します。
    • "Open Project Detail window"ボタンを押します。
  4. プロジェクト詳細画面(Project Detail)の下の方に、アップロードされたデータのアイコンが確認できます。
    • Image
    • これでアップロードは終了です。