本論文では、バーチャルスクリーニング(VS)における小分子リガンドと特定のタンパク質ポケットの結合を特定する重要性を強調し、従来の深層学習手法が主に構造データに依存してきた課題を指摘します。これに対処するため、S$^2$Drugという2段階のフレームワークを提案します。第1段階では、ESM2ベースのバックボーンを用い、ChemBLでタンパク質配列の事前トレーニングを行い、データサンプリング戦略を活用して冗長性とノイズを低減します。第2段階では、PDBBindでシーケンスと構造情報を融合し、補助的な結合部位予測タスクを導入します。このアプローチにより、タンパク質の結合残基を正確に特定し、3Dの空間配置を把握することで、タンパク質-リガンドマッチングを向上させます。実験結果は、S$^2$DrugがVS性能を改善し、結合部位予測でも優れた結果を示すことを示しています。