本論文では、分子特性予測における重要な化合物がターゲットスペースの希薄な領域に点在している問題に対処するため、新たに提案されたSPECTRAという手法を紹介しています。従来のグラフニューラルネットワーク(GNN)は平均誤差の最適化を行うため、重要なケースでの性能が低下することがあり、既存のオーバーサンプリング手法は分子のトポロジーを歪める可能性がありました。SPECTRAは、SMILESからマルチ属性の分子グラフを再構築し、分子ペアを(融合)グロモフ・ワッサースタイン対応によって整列させ、ラプラシアンの固有値や固有ベクトル、ノード特徴を安定した共有基底上で補間し、物理的に妥当な中間状態を合成するためにエッジを再構築します。また、データが不足している領域に集中した拡張を行うラリティ対応予算スキームを採用しています。このアプローチは、競争力のある全体的な平均絶対誤差(MAE)を維持しつつ、対象領域の誤差を改善することが示されています。