INGOR
Yoshinori Tamada
Yoshinori Tamada
超多項目の計測データから項目(因子・変数)間の因果関係をネットワークとして予測する、B-splineノンパラメトリック回帰モデルを用いたベイジアンネットワークの構造推定ソフトウェアである。遺伝子発現データからの遺伝子ネットワークを予測・解析や、健康ビッグデータから健診項目間の関係性や疾病に対する関連性の解析など、多目的に用いることができる。2条件の違いからシステムに差のあるサブネットワークを抽出することや、サンプル(ケース)ごとに個別のネットワークを得ることもできる。
主に、DNAシークエンサなどの遺伝子発現データを元に遺伝子ネットワークを構築するために用いられている。使用可能なデータは遺伝子発現データだけでなく、オミクスデータ全般を利用可能で分子ネットワークを広く解析可能である。遺伝子ネットワーク解析は既存知識に基づくものとデータ駆動型の二種類に大別されるが、本アプリは後者の遺伝子ネットワーク解析を実現するもので、ネットワーク解析により創薬ターゲット探索や疾病・薬剤機序解明につながる仮説を計測データのみから既存知識なしで予測する。入力データ次第で様々な疾患・化合物の解析に使用可能である。
INGORによるネットワーク推定の特徴は数万因子の入力データに対応していることと、入力データの個別のサンプル毎のネットワークを算出可能な点である。前者により、事前に遺伝子を選択せずに丸ごとネットワーク解析可能である。これができるネットワーク推定アプリはほとんど存在しない。また後者により患者毎の解析が可能で、例えば予後の良し悪しや特定の薬剤に対する抵抗性・感受性の違い、そもそもの疾患の有無などのサンプル間の違いを解析することで、数万因子の巨大ネットワークから真に重要な数百程度の重要ネットワークを特定可能である。これは枝毎サンプル毎にECvと呼ばれる値を算出可能な点を応用したもので、他のネットワーク解析ソフトウェアでは実現できない。
主なターゲット疾患の例として、癌が挙げられる。癌は遺伝子ネットワークの病気である。細胞内の遺伝子の制御が異常をきたし、制御が効かなくなり、細胞が増殖する。従って、遺伝子ネットワーク解析と相性がよい。京を用いた過去のプロジェクトの成果は https://tcng.hgc.jp/ にDBとしてまとめてある。
https://www.nature.com/articles/s41598-021-90556-1 SARS-CoV-2に適用した例
https://www.nature.com/articles/s41598-021-02394-w
https://www.mdpi.com/2218-273X/10/2/306
https://ieeexplore.ieee.org/document/5551118 メインで使用しているアルゴリズム
SARS-CoV-2の論文では、重症度の異なる患者の遺伝子ネットワークを比較した。遺伝子ネットワークを解析して重要とみなされた遺伝子が、今まで開発されてきている薬のターゲットとなっていることを確認することが出来た。
https://sign.hgc.jp/ingor/
グラフィカルモデル(鈴木譲・植野真臣編著/共立出版)
INGORはバイナリを提供予定。ECv計算はリクエストがあれば玉田から提供。
前身のSiGN-BNは、https://sign.hgc.jp/signbn/ でバイナリを公開中
Yoshinori Tamada
ネットワークの推定部分は OSS 化を予定しているが当面先になるかもしれない。サブネットワークの推定部分は特許化された部分があり学術利用者には提供中。商用利用は要相談。