本論文では、知覚型強化学習コントローラを用いた脚付きロボットの地形認識における問題点を克服する方法として、フェーズガイド地形横断(PGTT)を提案しています。従来の手法では、オシレーターやIKに基づく歩行パターンが行動空間を制約し、ロボットの適応性を低下させるか、「盲目的」に動作することで地形の予測が難しくなり、ノイズに対して脆弱でした。PGTTは、報酬の設計を通じて歩行構造を強制し、ポリシー学習における帰納バイアスを減少させることで、これらの制約を克服します。このアプローチは、局所的な高さマップ統計に基づいて振り上げの高さを調整し、接触ペナルティを加え、モルフォロジーに依存しない実行を可能にします。実験結果として、PGTTは様々な障害物を克服する性能が他手法を上回り、地形適応型の報酬設計が堅牢なロコモーションを実現する一般的なメカニズムであることが示されました。