Platform for Drug Discovery


MotIV


概要


  • モチーフデータベースのJASPARに対するモチーフの検索、および可視化を行う。

文献


メモ


  • モチーフデータベースに関して
    • 検索対象として用いるJASPARのデータベースは、MotIVパッケージと供にインストールされます。
    • データベースファイルの所在は以下にあります。
      • $ ls [Rのホームディレクトリ]/MotIV/extdata/
        
        example_motifs.txt  jaspar2010.txt  jaspar2010_PCC_SWU.scores  observedPWMs.txt
      • Rのホームディレクトリが分からない場合は以下
        Rのプロンプトで
        
        #windowsXPの場合
        
        ##以下実体は"C:\Program Files\R\R-2.14.1"
        
        > R.home()
        
        [1] "C:/PROGRA~1/R/R-214~1.1"
    • モチーフデータベースファイルの書式
      head -n 15 R_HOME/library
      
      /MotIV/extdata/jaspar2010.txt
      
      DE      TFAP2A
      
      0       0       0       185     0
      
      1       0       185     0       0
      
      2       0       185     0       0
      
      3       22      71      46      46
      
      4       19      57      61      48
      
      5       55      44      67      19
      
      6       53      30      91      11
      
      7       19      16      137     13
      
      8       9       78      79      19
      
      XX
      
      DE      Arnt
      
      0       4       16      0       0
      
      1       19      0       1       0
      
      2       0       20      0       0
      • DNAモチーフのフォーマット TRANSFAC-likeフォーマットで記述されている模様。
      • DEのあとがモチーフ名
      • その後に続く文字が、位置、A/C/G/Tの頻度の順。
    • モチーフデータベースのスコアファイルの書式
      $ head -n 5 R_HOME/library/MotIV/extdata/jaspar2010_PCC_SWU.scores
      
      5       5       2.05651028831197        0.539796328129422       38612   0.437042483269765       4.89702458232463
      
      5       6       2.14759700902800        0.565299007523069       32111   0.273911715335984       4.90052132879188
      
      5       7       2.24324290417951        0.582104426639416       36642   0.295411011308359       4.86849195712648
      
      5       8       2.35298403841185        0.575754610594625       51811   0.274550048339947       4.86756847304905
      
      5       9       2.44668517846291        0.577044470831136       54175   0.41549506038298        4.9846379539181
      • このファイルは、E-valueの計算に使用されるスコアのファイルで、読み込んだモチーフDBから本パッケージのgenerateDBScores()によって生成されます。
      • 本パッケージのreadDBScores(),writeDBScores()によってそれぞれファイルへの読み書きが可能です。
      • 生成には大変時間がかかるため、新しいモチーフDBを使用しない限りは、readDBScores()による読み込みを行うのが良いかと思います。

参考


Contact us
Copyright © 2009-2017 National Institute of Genetics  [Site Policy] [Privacy Policy]