本研究では、自動運転における強化学習(RL)のシム・トゥ・リアル転送の課題を解決するための新しいフレームワークを提案します。リアルな車両ダイナミクスの複雑さとシミュレーションとの不一致が主な障壁であり、タイヤ特性や路面状態、空力的影響、車両負荷などの要因が現実の動力学の正確なモデル化を困難にしています。本論文では、仮想車両と実際のシステム間の空間的および時間的整合性をもとに、動作計画を車両制御からデカップリングする方法を示します。まず、キネマティック自転車モデルを用いてシミュレーションでRLエージェントを訓練し、その行動を有限時間の自己車両軌道を生成するエージェントに蒸留します。実際の車両での検証を行い、このアプローチにより、RLベースの動作計画がシミュレーションから現実へロバストに転送できることを示します。