本研究は、中国で開発された大規模言語モデル(LLM)が生成する肝MRIレポートの信頼性を向上させることを目的としています。これを達成するために、マルチディメンショナル信頼性評価(MDCA)フレームワークを導入し、特定の医療機関におけるプロンプト最適化についてのガイダンスを提供しています。著者らは、複数の先進的なLLMのパフォーマンスを、SiliconFlowプラットフォームを用いて評価し比較しました。この研究は、医療報告の品質向上や教育支援に寄与し、信頼性の高い診断結論を生成するための体系的なガイドラインの策定に貢献することを目指しています。