|
  |
 |
 |
 |
|
バイオインフォで取り扱われるデータは多岐に渡っています.一つのタンパク質に対して,遺伝子発現データ,局在データ,相互作用ネットワーク,代謝ネットワーク,系統的プロファイルなど様々なデータがあり,それぞれが異なる側面からタンパク質の性質を表現しています.そこで,これらをうまく組み合わせる仕組みを考えれば,予測性能が向上すると考えました(図1).まず,異質データの統合の方法として,それぞれのデータをカーネル行列という共通の書式に変換します.それぞれのデータに重みをつけ,情報幾何学の概念を導入して統計的に最尤な重みを算出するアルゴリズムを開発しました(図2).これを教師つきネットワーク推定に適用した結果,従来法を凌駕する性能が得られることを確認しました. |
|
|
 |
|
|
図1 生体ネットワークの一部が既知と仮定.複数の補助データを選択的に使ってネットワークを推定する. |
|
|
 |
|
|
図2 不完全な隣接行列と複数の補助行列からネットワークを推定する流れ.補助データを選択しながらカーネル行列補完の技術に実現している. |
|
|
|
|
|
文献 |
|
|
[4] Tsuyoshi Kato, Koji Tsuda, Kiyoshi Asai:
Selective integration of multiple biological data for supervised network inference
Bioinformatics Advance Access published on February 22, 2005. Bioinformatics, vol. 21, issue 10, pp.2488--2495, May 15 2005, doi:10.1093/bioinformatics/bti339 |
|
|
|
|
|