arXiv cs.LG

生物情報に基づくニューラルネットワークがオミクスデータから非線形表現を学び、ゲノム予測と解釈性を向上させる

Biology-informed neural networks learn nonlinear representations from omics data to improve genomic prediction and interpretability

http://arxiv.org/abs/2510.14970v1


この記事では、生物情報に基づくニューラルネットワーク(BINNs)が、作物のゲノム予測(GP)と選抜(GS)を改善するために、数千の一塩基多型(SNP)とマルチオミクス測定、および先行する生物学的知識を統合する手法を提案しています。従来の遺伝子型から表現型へのモデルは直接的なマッピングに依存しており、精度が限られるため、育種家は大規模で高コストなフィールド試験を行わざるを得ませんでした。BINNsは、経路レベルの帰納的バイアスをエンコードし、学習中のみマルチオミクスデータを活用することでこの制約を克服し、推論中は遺伝子型データのみを使用します。トウモロコシの遺伝子発現や多環境フィールド試験データに適用した結果、BINNsはサンプル数が限られた状況下で最大56%の精度向上を達成し、GWAS/TWASでは見逃される遺伝子を非線形的に特定しました。また、合成メタボロミクスのベンチマークにおいて、従来のニューラルネットに対して予測誤差を75%削減し、最も重要な非線形経路を特定しました。これらの成果は、BINNsが遺伝子型から表現型への生物学的に関連する表現を学べることを示しており、ゲノム選択や遺伝子編集の優先順位付けに役立つ可能性があります。