AccelOptは、専門家によるハードウェア特有の最適化知識なしで新しいAIアクセラレータ向けのカーネルを自律的に最適化する自己改善型の大規模言語モデル(LLM)エージェンティックシステムです。AccelOptは、以前のスローファーストカーネルペアから得られた経験や洞察をキュレーションする最適化メモリを用いて、カーネル最適化空間を反復生成を通じて探索します。この記事では、実際のLLMのワークロードから抽出した異なる複雑さを持つAWS Trainiumアクセラレータカーネルのための新たなベンチマークスイート「NKIBench」を開発し、AccelOptの効果を評価します。結果は、AccelOptの能力が時間と共に向上し、Trainium 1および2においてピークスループットの平均割合がそれぞれ49%から61%、45%から59%に増加することを確認しました。さらに、オープンソースモデルを使用することで、AccelOptはClaude Sonnet 4のカーネル改善と同等の効果を得ながら、26倍のコスト効率を実現しています。