この記事では、自動運転の深層強化学習アプローチにおけるオプション(技能)フレームワークの利用について述べています。特に、高速道路での運転タスクに特化したオプションが定義され、安全性や快適性を考慮した縦横の操作を行う方法が探求されています。既存の知識を学習プロセスに組み込むことで、学習された運転行動を適切に制約しやすくなります。さらに、オプションを用いた階層的制御のセットアップや、最新の強化学習技術に基づく実用的なアルゴリズムが提案されています。最終的に、ハイブリッドオプションを用いた柔軟なポリシーは、変動する交通状況において最も良好な性能を示し、従来の連続的な行動に対するポリシーを上回ることが確認されました。