自主運転におけるデータとモデル予算のスケーリングによる持続的な性能向上は未解決の重要な課題です。自己回帰モデルは計画タスクにおいてデータスケーリング効率を示しましたが、自己軌道の予測はスパーススーパービジョンに苦しみ、シーンの進化が自己の動きに与える制約が弱いです。このため、我々はDAP(離散トークン自己回帰プランナー)を導入し、BEV(Bird's Eye View)セマンティクスと自己軌道を共同予測することで、包括的な表現学習を促進し、予測された動態が自己の運動を直接条件付けることを可能にします。また、強化学習に基づくファインチューニングを組み込み、監督された行動クローンの先行知識を保持しつつ報酬に基づく改善を注入します。160Mパラメータのコンパクトな予算にもかかわらず、DAPはオープンループ指標で最先端のパフォーマンスを達成し、NAVSIMベンチマークで競争力のあるクローズドループの結果を提供します。全面的な離散トークン自己回帰の定式化は、自律運転のためのコンパクトでスケーラブルな計画パラダイムを提供します。