arXiv cs.AI

行間を読む:一方的な会話問題

Reading Between the Lines: The One-Sided Conversation Problem

http://arxiv.org/abs/2511.03056v1


本研究では、一方的な会話問題(1SC)を定式化し、特にテレメディスンやコールセンター、スマートグラスなどでの会話AIの制約について論じます。具体的には、(1) 実時間使用のために欠落したスピーカーの発言を再構成すること、(2) 一方的なトランスクリプトから要約を生成することの二つのタスクを扱っています。MultiWOZ、DailyDialog、Candorのデータセットを用いた評価から、一つの将来の発言を知ることや発言の長さに関する情報が再構成の改善に寄与することが示され、プレースホルダープロンプトが幻覚を軽減するのに役立つことがわかりました。また、大きなモデルはプロンプトを用いることで有望な再構成を生成する一方で、小さなモデルはファインチューニングが必要であることも明らかになりました。さらに、高品質な要約は欠落した発言を再構成せずとも生成可能です。プライバシーを考慮した会話AIに向けた新たな挑戦として1SCを提言し、有望な結果を報告します。