arXiv cs.AI

プロンプト最適化から多次元信頼性評価へ:中国のLLM生成肝MRIレポートの信頼性向上

From Prompt Optimization to Multi-Dimensional Credibility Evaluation: Enhancing Trustworthiness of Chinese LLM-Generated Liver MRI Reports

http://arxiv.org/abs/2510.23008v1


本研究は、中国で開発された大規模言語モデル(LLM)が生成する肝MRIレポートの信頼性を向上させることを目的としています。これを達成するために、マルチディメンショナル信頼性評価(MDCA)フレームワークを導入し、特定の医療機関におけるプロンプト最適化についてのガイダンスを提供しています。著者らは、複数の先進的なLLMのパフォーマンスを、SiliconFlowプラットフォームを用いて評価し比較しました。この研究は、医療報告の品質向上や教育支援に寄与し、信頼性の高い診断結論を生成するための体系的なガイドラインの策定に貢献することを目指しています。