本論文では、不確実性のもとでの意思決定を最適化問題の解決に基づいて行う意思決定重視の学習を扱っています。特に、従来の手法が最適化ソルバーへの頻繁な呼び出しに依存するため、スケーラビリティに課題があることを指摘し、Dual-Guided Loss(DGL)という新たなアプローチを提案しています。DGLは、最適化と勾配更新を切り離し、ソルバーの依存度を低減しつつ、選択問題に特化した学習目標を設定します。これにより、強力な意思決定alignmentを維持しながら、トレーニングコストを従来の監視学習に近づけます。実験において、DGLが最先端のDFL手法と同等以上の性能を持ちながら、ソルバーの呼び出し回数とトレーニング時間を大幅に削減できることを示しています。