最近、インストラクションに基づく画像編集(IIE)が注目を集めていますが、通常は特定の領域のみが変更され、残りの部分はほとんど変わらないことが多いです。しかし、既存のIIEモデルは、この違いを考慮せず、全体に均一な生成プロセスを適用しています。これを受けて提案されたのがRegionEというフレームワークです。このフレームワークは、まず画像を編集された領域と未編集の領域に分割し、未編集区域には1ステップで予測を行い、編集された領域には局所的な反復ノイズ除去を使用します。さらに、計算コストを削減しつつグローバル情報を取り入れるRegion-Instruction KV Cacheや、隣接するタイムステップが強い速度の類似性を示すことを利用した適応型速度減衰キャッシュも提案しています。これにより、RegionEは既存のIIEモデルより2.57倍、2.41倍、2.06倍の加速を達成し、セマンティックおよび知覚的忠実度を維持しながら効率的な画像編集を実現しました。