H2-キャッシュ：生成拡散モデルの高性能加速のための新しい階層型デュアルステージキャッシュ

H2-Cache: A Novel Hierarchical Dual-Stage Cache for High-Performance Acceleration of Generative Diffusion Models

生成拡散モデルは画像生成において最先端の技術ですが、その反復的なデノイジングプロセスの計算コストが実用的な展開を妨げています。既存のキャッシング技術は推論を加速しますが、速度と忠実度の間でトレードオフが生じ、品質の劣化と高い計算オーバーヘッドが問題となります。そこで本論文では、H2-キャッシュと呼ばれる新しい階層型キャッシングメカニズムを提案します。この手法は、デノイジングプロセスを構造定義ステージと詳細精緻化ステージに機能的に分離できるという洞察に基づいています。H2-キャッシュはデュアル閾値システムを使用し、それぞれのステージを選択的にキャッシュします。効率を確保するために、軽量な特徴要約技術であるプール機能要約（PFS）を導入しました。Fluxアーキテクチャにおける実験では、H2-キャッシュが最大5.08倍の加速を達成し、画像品質を維持したまま、既存のキャッシング手法を長期的かつ定量的に上回る結果を示しています。