最近の大規模言語モデル(LLM)エージェントは、思考の連鎖や関数呼び出しを効果的に活用しており、能力の向上に伴い、単なる問題解決ツールを超えて、自ら計画し、即時のタスクをデザインし、広範かつ曖昧な目標に向かって推論できる存在になり得るのかという重要な問いが浮上しています。この問いを探求するために、事前学習したLLMエージェントに独自のタスクを生成する能力を持たせ、知識を蓄積し、環境と広範に相互作用するオープンエンドの実験設定を採用しました。結果として得られたエージェントは、複雑なマルチステップ指示に従い、情報をストックして再利用し、自らタスクを提案・解決する能力を示しましたが、プロンプトデザインに敏感で、タスク生成の繰り返しが見られ、自己表現を形成することはできませんでした。これらの結果は、事前学習したLLMをオープンエンドに適応させる際の可能性と限界を示し、エージェントのメモリ管理や抽象的な長期目標の追求に向けた今後の方向性を指摘しています。