この研究では、分子フィンガープリンティングにおけるハッシュ関数を使用した固定長のベクトル表現について、ハッシュ衝突がどのように異なるサブ構造を同じ特徴で表現するかを検討します。この問題により、分子類似性計算において過剰な推定が生じることが指摘されています。著者らは、標準的な圧縮フィンガープリンツと比較して、正確なフィンガープリンツを使用することで、分子の特性予測とベイジアン最適化の精度が向上するかどうかを調査しました。その結果、正確なフィンガープリンツの使用は、DOCKSTRINGデータセットの5つの分子特性予測ベンチマークにおいて、小さいが一貫した精度向上を示しました。しかしながら、この向上はベイジアン最適化の性能には顕著な改善として現れませんでした。