従来のロボットは運動学の理解が限られ、事前にプログラムされたタスクに制約されているため、ツールの活用が効率的に行えません。本研究では、目的の成果をつかむこと、最適なツールを選択すること、ツールの最適な方向を決定すること、そして正確な操作を実行することというツール使用の基本要素に基づいて、新しいフレームワークを提案します。このフレームワークは、ロボットの逆運動学ソルバーの能力を拡張し、異なる長さのツールを使用した連続的な動作の習得を可能にします。シミュレーションで学習した動作軌道をツールに統合することで、シミュレーションから実際のシナリオへスキルを転送する実用性を示しました。驚くべきことに、拡張された逆運動学ソルバーは1 cm未満のエラー率を実現しており、トレーニングされたポリシーはシミュレーションで8 cmの平均誤差を達成しています。異なる長さの2つのツールを使用しても、ほぼ同等のパフォーマンスを示すことができ、ツール操作の複雑さをマスターするための前進を示唆しています。