複数のタスクを自律的に学習することは、複雑な環境で動作する多用途の人工エージェントを開発するための重要な能力です。実世界のシナリオでは、タスクが相互に関連していることが多く、ロボットは他のタスクを学習するための前提条件を設定するために、いくつかのタスクを先に達成する必要があります。これまでもロボティクスにおいて相互関連したタスクの習得に取り組むためのさまざまな戦略が使用されてきましたが、このようなシナリオでの自律学習はまだ解決されていない課題です。本研究では、内発的動機付けられたオープンエンド学習の枠組みに基づき、タスク選択のレベルでどのようにこの課題に取り組むことができるかについて説明します。特に、複数の相互関連タスクのシナリオをマルコフ決定過程(MDP)として考慮し、システムがすべてのタスクに対する能力を最大化しようとする様子を探ります。