arXiv cs.AI

SkillGen: 文脈内順次意思決定のためのドメインスキルの学習

SkillGen: Learning Domain Skills for In-Context Sequential Decision Making

http://arxiv.org/abs/2511.14670v1


SkillGenは、大規模言語モデル(LLMs)を用いた文脈内学習(ICL)における順次意思決定のためのフレームワークです。本研究では、効果的なプロンプトの設計のために、意思決定において重要な情報に焦点を当て、ステップごとの粒度を提供し、専門家の注釈への依存を最小限に抑えることが重要であると述べられています。しかし、従来のICL手法はこれらの条件を同時に満たせないことが多いです。SkillGenは、サンプリングされた経路からアクション中心のドメインレベルのグラフを構築し、高い有用性を持つアクションを特定し、コンテキストに応じた詳細なプロンプトを生成します。この方法をALFWorld、BabyAI、ScienceWorldで実験した結果、SkillGenは平均して5.9%から16.5%の進捗率向上を実現しました。