フィッシングメールはオンラインコミュニケーションにおいて依然として重大な脅威であり、人間の信頼を利用する手法や現実的な表現で自動フィルターを回避しています。本研究では、大規模言語モデル(LLM)を用いたフィッシング検出の信頼性を評価する「信頼性キャリブレーションフレームワーク」(TCF)が提案されます。TCFはキャリブレーション、一貫性、堅牢性の三つの次元からフィッシング検出器を評価する再現可能な方法論です。また、信頼性の安定性を測定するための「クロスデータセット安定性指標」(CDS)も導入されています。実験では、GPT-4が最も高い信頼プロファイルを示し、LLaMA-3-8B、DeBERTa-v3-baseが続くことが確認されました。このフレームワークは、LLMを用いたフィッシング検出におけるモデルの信頼性評価のための透明で再現性のある基盤を提供します。