安全が重要な環境での信頼性の高い航行には、正確な危険知覚と原則に基づく不確実性の扱いが必要です。本論文では、COPPOLという整形された知覚から方針への学習手法を提案し、セマンティックセグメンテーションに分布に依存しない有限サンプルの安全保障を統合しています。この方法により、見逃し検出の厳密な境界を持った危険マップが生成され、リスクを考慮したコストフィールドが強化学習の計画に利用されます。2つの衛星由来のベンチマークにおいて、COPPOLは比較ベースラインに比べて危険な領域の検出率を最大6倍向上させ、航行中の危険な違反を約50%削減しました。また、このアプローチは分布の変化に対しても堅牢性を保ち、安全性と効率性を維持します。