多面的自己洗練学習によるLLMの医療文脈認識能力の向上

Enhancing the Medical Context-Awareness Ability of LLMs via Multifaceted Self-Refinement Learning

この研究では、大規模言語モデル(LLM)が医療分野での文脈認識能力を向上させる手法、Multifaceted Self-Refinement (MuSeR)を提案しています。LLMは様々なベンチマークで優れた性能を発揮していますが、実際の医療シナリオではコンテキスト認識が不足しています。MuSeRは、意思決定、コミュニケーション、安全性の三つの主要な側面を通じて、自己評価と洗練を行うデータ駆動のアプローチです。具体的には、属性に基づくクエリ生成器を用いて、ユーザーの役割や意図などのさまざまな状況を模擬し、LLMがそれに応じて回答します。LLMは自己評価を行い、答えを改善し、最終的にスーパーバイズドファインチューニングでモデルの文脈認識能力を強化します。評価結果は、HealthBenchデータセットにおいて、LLMの文脈認識が有意に向上したことを示しています。