この記事では、自動回路発見(ACDC)を効率化する新しい手法「PAHQ」を提案しています。回路発見は、事前学習済みの言語モデル内で重要なサブネットワークを特定するための基盤技術であり、ACDCはその中心的手法です。しかし、これは計算効率が低く、メモリ要求が高いため、大規模な言語モデルへの適用が制限されていました。PAHQでは、各パッチ操作の効率を最適化し、混合精度量子化とアクティベーションパッチングとの間の根本的な整合性を利用します。これにより、調査対象のコンポーネントでは高精度を維持しつつ、その他の部分では精度を安全に低下させることが可能になります。これにより、ACDCの実行時間を最大80%、メモリ消費を最大30%削減できるとされています。さらに、既存の回路発見技術とも容易に統合できるため、メカニスティックな解釈可能性を加速する新たな道を提供します。