CNOTゲートは量子コンピューティングの基盤であり、量子アルゴリズムに不可欠なエンタングルメントを促進します。特定の量子回路はCNOTゲートのみで構成されるため、これらの使用を最小限に抑えることが重要です。しかし、CNOTゲートの最小化の問題は未解決で、計算の複雑さも完全に把握されていません。本研究では、CNOT最小化のための新しい強化学習アプローチを提案しています。異なる回路サイズ向けに複数の学習エージェントを訓練する代わりに、固定サイズの単一エージェントを使用します。mサイズの行列に対し、サイズの異なる行列は埋込みやガウスストライピングを用いて前処理します。m=8で訓練したエージェントを用いて、3から15までの行列サイズで評価した結果、我々の手法はnの値が増加するにつれて、最先端のアルゴリズムを上回る性能を示しました。