arXiv cs.LG

機能を維持しながらタンパク質を縮小する拡散モデル

A Diffusion Model to Shrink Proteins While Maintaining Their Function

http://arxiv.org/abs/2511.07390v1


この記事では、現代医療やバイオエンジニアリングで有用なタンパク質が、長すぎる配列のために実験室での合成や細胞内での融合、体内への輸送が難しいことを指摘しています。一般的に、これらの配列を短くするには高コストで時間がかかる実験が必要です。著者たちは、自然界の配列データベースから学習する新しい手法、SCISORというユニークな離散的拡散モデルを提案しています。SCISORは、自然の配列にランダムに挿入された文字を削除し、機能的な影響を持つリアルなタンパク質の生成を目指します。このモデルは、既存の大規模モデルと競争力のある予測を実現し、長いタンパク質配列を縮小するために使用され、以前の進化的配列モデルよりも機能モチーフをより多く保存することが示されています。