arXiv cs.AI

PlanU: 不確実性の下での計画を通じた大規模言語モデルの意思決定

PlanU: Large Language Model Decision Making through Planning under Uncertainty

http://arxiv.org/abs/2510.18442v1


本稿では、大規模言語モデル(LLM)を活用した意思決定における不確実性への対処法として「PlanU」を提案します。従来のLLMベースの意思決定手法は、LLMの不確実性や環境の不確実性を十分に考慮しておらず、その結果、ストキャスティックな環境での計画行動が困難です。PlanUは、モンテカルロ木探索(MCTS)を通じて不確実性を捉える新しい計画手法であり、MCTSの各ノードのリターンを分位数分布としてモデル化します。また、探索と活用のバランスを取るために、UCC(Upper Confidence Bounds with Curiosity)スコアを導入し、MCTSノードの不確実性を推定します。多くの実験により、PlanUの効果を実証し、LLMを用いた不確実性下での意思決定タスクにおいて優れた性能を示しています。