この記事では、APIが利用できない環境において、効率的なAIエージェントの探索方法を提案しています。従来、従ったエージェントはピクセルベースのGUIを介して操作せざるを得ず、これにより効率が制限され、戦略的な計画やスキルの習得が阻害されると指摘しています。この課題に対処するため、著者はKG-Agentという経験駆動型学習フレームワークを提案し、エージェントのインタラクションを状態-行動知識グラフ(SA-KG)に構造化します。このアプローチでは、視覚的には異なるが機能的には類似したGUI状態を関連付け、豊かな経験の近隣を形成することで探索の効率を向上させています。また、長期的な推論を支援するために、グラフのトポロジーに基づいたハイブリッド内因報酬メカニズムを設計し、既知の高価値経路を活用する報酬とターゲット探索を促進する新奇性報酬を組み合わせています。KG-Agentは、Civilization VとSlay the Spireの二つの複雑なGUI環境において評価され、他の最先端の手法に比べて探索効率と戦略的深さが大幅に改善されたことが示されました。