
UCSCからの既知遺伝子アノテーション情報の取得とMaserへのアップロード方法
目次
このページについて
- UCSCゴールデンパスのダウンロードサイトから、特定のゲノムバージョンに対する遺伝子アノテーション情報を取得できます。
- このページでは既知遺伝子アノテーションデータをrefFlatバージョンのgenePredフォーマットで取得し、Maser上へアップロードする方法を説明します。
UCSCからの遺伝子アノテーションデータの取得
- UCSC Genome Bioinformaticsのページにアクセスします。
- 左のメニューから"Downloads"と書かれたリンクを開きます。
- リストから興味のある生物種を見つけます。
- "Annotation database"と書かれたリンクを押します。
- この例ではヒト(hg19,GRCh37)を選択します。
- 下からは古いバージョンのhg18も選択することができます。
- ゴールデンパスのダウンロードサイト上でブラウザの検索機能を用い"refFlat"を検索します。
- リストから、"refFlat.txt.gz"をダウンロードします。
- この際、右にあるデータ更新日をメモしておくことをお勧めします。このアノテーションデータは週に数回アップデートされるため、アップデート日がアノテーションのバージョンとして認識されるためです。
- ファイル名を変更し、更新日とゲノムのバージョンが分かるようにしておくことをお勧めします。
Maserへのデータアップロード
- Maserにデータをアップロードするために、詳細はこちらのページをご覧ください。
- アップロード対象のプロジェクト画面を開き、"Upload My Data"ボタンを押します。
- 今回のような小さいデータのアップロード時はHTTPプロトコルを選択する方が簡単です。
- データタイプを選択し、アップロードするデータのプロパティを記入します。
- Data Label:データラベルにはデータ識別のための任意の名前を記入して下さい。
- Data Type:データタイプにはgenePred(refFlat)を選択します。
- Data File:ご自身のコンピュータ上からダウンロードしたデータを選択します。
- アップロードボタンを押します。
- アップロードボタンを押した後、ファイルアップロードと解凍処理が進みます。
- 数秒後アップロードが終了します。
- "Open Project Detail window"ボタンを押します。
- プロジェクト詳細画面(Project Detail)の下の方に、アップロードされたデータのアイコンが確認できます。
- これでアップロードは終了です。