arXiv cs.AI

拡散モデルにおけるキャッシュ手法の調査:効率的なマルチモーダル生成に向けて

A Survey on Cache Methods in Diffusion Models: Toward Efficient Multi-Modal Generation

http://arxiv.org/abs/2510.19755v1


本論文では、拡散モデルにおけるキャッシュ手法についての包括的な調査が行われ、効率的なマルチモーダル生成のための新たなアプローチが提案されています。拡散モデルは、優れた生成品質と制御性を持つ現代の生成AIの重要な基盤ですが、その多段階反復プロセスと複雑なバックボーンネットワークは、計算コストと生成遅延を引き起こし、リアルタイムアプリケーションのボトルネックとなっています。既存の加速技術は進展しているものの、適用の限界や高いトレーニングコスト、品質の劣化といった課題が残されています。著者たちは、トレーニング不要でアーキテクチャに依存せず、効率的な推論を可能にする「Diffusion Caching」を提案し、その理論的基盤と進化を体系的にレビューしています。キャッシュの柔軟性を向上させ、サンプリング最適化やモデル蒸留といった他の加速技術との統合を可能にすることで、今後のマルチモーダルおよびインタラクティブなアプリケーションのための統一的かつ効率的な推論フレームワークの道を開くことが期待されています。