本研究では、分類器が信頼できると見なされるために必要な条件である適切なキャリブレーションを実現するための手法を提案します。従来の多クラスキャリブレーションの評価手法は、特定の予測や計算的に難易度の高い変分法に焦点を当てがちですが、本稿ではスケーラブルな評価を中心に議論します。提案するユーティリティキャリブレーションフレームワークは、エンドユーザーに関連する目標や意思決定基準に基づき、キャリブレーション誤差を測定します。このフレームワークは、従来のキャリブレーションメトリックを統合し、特にトップクラスおよびクラス別のキャリブレーションメトリックをより堅牢にする方法を示します。さらに、バイナリ化されたアプローチを超え、より豊かな下流ユーティリティの評価へと拡張することができます。