Platform for Drug Discovery


データアップロード方法について


目次


プロジェクトの新規作成


  1. 画面上部にある'Project'タブを押します。
    • Image
  2. 'Create New Project'ボタンを押します。
    • Image
  3. このプロジェクトについての情報を記入して下さい。
    • これらすべての記入項目はユーザーからの識別のみに使われます。
    • Image
  4. 'close'ボタンを押します。これでプロジェクトの新規作成手順は終わりです。
    • Image

プロジェクトへのデータアップロード(HTTPS経由で小規模データを扱う場合)


  1. プロジェクトタブのプロジェクトリスト上から、データをアップロードしたいプロジェクトのプロジェクトID(project ID)をクリックして下さい。
    • Image
  2. 'Upload My Data'ボタンを押します。
    • Image
  3. 'Upload via HTTPS'ボタンを押します。
  4. 'Data Label'欄に記入します。
    • Image
    • この'Data Label'はデータの識別のために使われます。
    • 短い名前にすることをお勧めします。ヒストリー画面中のデータのアイコンにあるラベルの表示エリアは先頭10文字しか表示しないので、半角で10文字以上にした場合2データの区別が困難です。
    • Image
      ヒストリ画面のイメージ
      普段は先頭の10文字の'1234567890'が表示されています。
      データアイコンにマウスカーソルをのせると、ラベル全体がツールチップとして表示されます。
  5. リストからデータ型'Data Type'を選択します。
    • Image
    • このシステムは実行可能なパイプラインをこのデータ型に応じて選ぶので、このデータ型は正確に選択して下さい。パイプライン開発者が想定しないデータ型をパイプラインの入力として選ぶことはできません。さらに、データに一致しないデータ型を選んだ場合、実行されたパイプラインは予期しない'Abort'状態で停止するか、正常の'End'状態で終了したとしても、予期しない結果が返されます。
  6. ご自身のコンピューターからアップロードするファイルを選んで下さい。
    • Image
    • 基本的には下記の例外を除き、アップロードできるファイル数は1つです。もし同一サンプルから取られた何レーンかの配列ファイルを持っていてマージしたいと思っている場合は、レーンごとにそれらの配列を登録しマージするパイプラインを実行するようにしてください。
    • 'fastq(paired-end)'や'csfasta+qual(single-end)'のようないくつかのデータセット型では、特定数のファイルのアップロードを要求したり、複数ファイルのアップロードを許可します。'Add file'ボタンを押した後、2つ目以降のファイルを選択して下さい。
    • 要求されるファイル数とファイルの種類はこちらのデータ型説明ページに記載があるのでご参照ください。
  7. 'Upload'ボタンの下にある'Optional Information'の下の項目をデータの識別のために任意で入力することができます。アップロード後にこれらの情報は自由に編集できます。
    • Image
    • 'Application Type'はゲノムビューワのGenome Explorerの初期表示の選択に利用される場合があります。例えば、'Application Type'に'Bisulfite-Seq'を選んだ場合、デフォルトでは修飾塩基モードでデータがロードされます。
    • 'Organism'はマッピング時やビューワへのロード時にゲノムの選択に利用されます。
  8. 必要項目を入力し、アップロード対象のファイルを選んだ後、'Upload'ボタンを押して下さい。
    • Image
  9. 小さいデータのアップロードには数分、大きいデータのアップロードには数時間待ちます。
    • Image
  10. 'Open Project Detail window'ボタンを押して下さい。これでHTTPSによるデータアップロード手順は終了です。
    • Image
  11. Project - Detail画面でアップロードしたデータアイコンを確認して下さい。
    • Image

プロジェクトへのデータアップロード(SFTP経由で大規模データを扱う場合)


  1. プロジェクトタブのプロジェクトリスト上から、データをアップロードしたいプロジェクトのプロジェクトID(project ID)をクリックして下さい。
    • Image
  2. 'Upload My Data'ボタンを押します。
    • Image
  3. 'Upload via SFTP'ボタンを押します。
  4. 専用データ転送アプリケーションのインストールとアップロード
  5. 'Open your folder on the server'ボタンを押し、アップロードされたデータを確認します。
    • Image
  6. アップロードデータを確認後'Next'ボタンを押します。
    • Image
  7. 'Data Label'欄に記入します。
    • Image
    • この'Data Label'はデータの識別のために使われます。
    • 短い名前にすることをお勧めします。ヒストリー画面中のデータのアイコンにあるラベルの表示エリアは先頭10文字しか表示しないので、半角で10文字以上にした場合2データの区別が困難です。
    • Image
      ヒストリ画面のイメージ
      普段は先頭の10文字の'1234567890'が表示されています。
      データアイコンにマウスカーソルをのせると、ラベル全体がツールチップとして表示されます。
  8. リストからデータ型'Data Type'を選択します。
    • Image
    • このシステムは実行可能なパイプラインをこのデータ型に応じて選ぶので、このデータ型は正確に選択して下さい。パイプライン開発者が想定しないデータ型をパイプラインの入力として選ぶことはできません。さらに、データに一致しないデータ型を選んだ場合、実行されたパイプラインは予期しない'Abort'状態で停止するか、正常の'End'状態で終了したとしても、予期しない結果が返されます。
  9. こちらのサーバ上にあるユーザーのディレクトリ上からアップロードしたファイルを選択します。
    • Image
    • ファイルリストが空の場合、こちらの手順に戻って下さい。
    • アップロード用のディレクトリはグループのメンバーでシェアされることに留意下さい。ほとんどのユーザーは単独のグループに属するので関係ありません。
    • 基本的には下記の例外を除き、アップロードできるファイル数は1つです。もし同一サンプルから取られた何レーンかの配列ファイルを持っていてマージしたいと思っている場合は、レーンごとにそれらの配列を登録しマージするパイプラインを実行するようにしてください。
    • 'fastq(paired-end)'や'csfasta+qual(single-end)'のようないくつかのデータセット型では、特定数のファイルのアップロードを要求したり、複数ファイルのアップロードを許可します。2つ以上のファイルをディレクトリにアップロードしておき、ファイルリストからの選択時にそれらをチェックして下さい。
    • 要求されるファイル数とファイルの種類はこちらのデータ型説明ページに記載があるのでご参照ください。
  10. 'Upload'ボタンの下にある'Optional Information'の下の項目をデータの識別のために任意で入力することができます。アップロード後にこれらの情報は自由に編集できます。
    • Image
    • 'Application Type'はゲノムビューワのGenome Explorerの初期表示の選択に利用される場合があります。例えば、'Application Type'に'Bisulfite-Seq'を選んだ場合、デフォルトでは修飾塩基モードでデータがロードされます。
    • 'Organism'はマッピング時やビューワへのロード時にゲノムの選択に利用されます。
  11. 必要項目を入力し、アップロード対象のファイルを選んだ後、'Upload'ボタンを押して下さい。
    • Image
  12. アップロードディレクトリからデータ格納用ディレクトリへの移動のために数秒お待ちください。
    • Image
  13. 'Open Project Detail window'ボタンを押して下さい。これでSFTPによるデータアップロード手順は終了です。
    • Image
  14. Project - Detail画面でアップロードしたデータアイコンを確認して下さい。
    • Image

HTTPSとSFTPの違い


  • HTTPSとSFTPは両方、インターネットを経由してセキュアなデータ転送できる手順です。
  • 2つの違いは下のテーブルに記載しています。
#ポイントHTTPSSFTP
1利用可能なデータサイズインターネットへの接続環境に依存します。
1ギガバイト未満の場合も多いです。
巨大なデータを扱えます。
(数ギガバイト以上)
2データ転送に必要なアプリケーション一般的なウェブブラウザ専用のツールかコマンド
3特徴簡単に利用できます。
ウェブブラウザが自動的にこの方法を使って転送します。
巨大なデータの転送は頻繁に失敗します。
通常ネットワークが不安定でも巨大なデータの転送が可能です。