計画と取得: 知識グラフにおける強化学習による複雑な推論

Plan Then Retrieve: Reinforcement Learning-Guided Complex Reasoning over Knowledge Graphs

本論文では、知識グラフ質問応答（KGQA）システムにおける推論の質を向上させる新しいアプローチ「Graph-RFT」を提案しています。従来の方法は、知識グラフや大規模言語モデル（LLM）の強力な推論能力を十分に活用できていないことが課題でした。特に、複雑なシナリオでは、外部情報の必要性を判断するメカニズムが欠如し、結果として推論が局所的になりがちでした。Graph-RFTは、計画的で適応的な情報取得を可能にする二段階の強化ファインチューニングフレームワークで、計画からKG検索、ウェブ検索を行う手法を採用しています。この方法は、注文されたサブクエスチョンへの分解や論理的表現を利用して、に求められる情報を効率的に取得し、複数の報酬設計を通じて推論プロセスを最適化します。これにより、知識グラフとウェブ情報の組み合わせを効果的に学習します。