arXiv cs.AI

エンパシックプロンプティング:マルチモーダルLLM会話のための非言語コンテキスト統合

Empathic Prompting: Non-Verbal Context Integration for Multimodal LLM Conversations

http://arxiv.org/abs/2510.20743v1


本記事では、エンパシックプロンプティングという新しい枠組みを提案しています。これは、ユーザーの感情的な手がかりを捉える商業用顔表情認識サービスを統合し、大規模言語モデル(LLM)との会話を豊かにすることで、非言語的なコンテキストを暗黙に注入するシステムです。従来のマルチモーダルインターフェースと異なり、ユーザーの明示的な操作を必要とせず、テキスト入力に感情情報を自然に加えることで、会話の流暢さを向上させます。このアーキテクチャはモジュール式かつ拡張可能であり、他の非言語モジュールを統合可能です。実験結果では、参加者が会話の流暢さを強調したことから、非言語的入力が整合性のあるLLM出力に統合されることが示されました。この概念実証を超えて、エンパシックプロンプティングは特に医療や教育の分野において、ユーザーの感情的信号が重要であるチャットボットを介したコミュニケーションに応用可能性があります。