本研究では、医療における大規模言語モデル(LLM)が、医療Q&Aシステムや役割演技シミュレーションにどのように貢献しているかを探ります。特に、Prompt-Based Role Playing(PBRP)という手法が、異なる臨床的役割をモデルに指示し、専門的行動をシミュレートする際の推論能力への影響を評価します。RP-Neuron-Activated Evaluation Framework(RPNA)を用いて、役割プロンプトが役割特有の認知過程を引き起こすのか、単に言語スタイルを変更するのかを調べました。三つの医療データセットを用いてニューロンアブレーションと表現分析を実施した結果、役割プロンプトは医療推論能力を大幅に向上させず、表面的な言語特徴にのみ影響することが示されました。これにより、現在のPBRP手法が現実の医療実践における認知的複雑さを再現できていないことが明らかになりました。