本記事では、コンピュータ利用エージェント(CUA)の研究を進展させるために設計された大規模で包括的なデータセット「GUI-360$^igcirc$」を紹介します。このデータセットは、リアルなCUAタスクの不足、自動収集・アノテーションパイプラインの欠如、GUIの基盤評価と画面解析、アクション予測を総合的に評価する統一されたベンチマークの不足といった三つの課題に対応しています。GUI-360は、LLMを強化したほぼ自動化されたパイプラインを用いて、クエリの収集、環境テンプレートの構築、タスクの実行、バッチ処理、LLMによる品質フィルタリングが行われます。このデータセットには、人気のあるWindowsオフィスアプリケーション内での実行アクションステップが120万件以上収められており、フル解像度のスクリーンショットやメタデータ、途中経路、成功したものと失敗したもののアクション経路が含まれています。また、主なタスクとして、GUIの基盤、画面解析、アクション予測をサポートしており、現代のエージェント設計を反映するハイブリッドなGUI+APIアクションスペースも提供しています。