arXiv cs.LG

QSilk: 微粒安定化と適応量子クリッピングによる詳細フレンドリーな潜在拡散

QSilk: Micrograin Stabilization and Adaptive Quantile Clipping for Detail-Friendly Latent Diffusion

http://arxiv.org/abs/2510.15761v1


本稿では、QSilkという軽量の常時安定化レイヤーを提案します。これは潜在拡散において高周波数の忠実度を向上させつつ、稀な活性化スパイクを抑制する性能を持ちます。QSilkは、サンプルごとのマイクロクランプと呼ばれる極端な値を自動的に制限しながらもテクスチャを失わない機能と、地域ごとに許可される値の幅を適応的に調整する「適応量子クリップ(AQClip)」の二つの技術を組み合わせています。AQClipは、地元構造統計またはモデルの信頼度に基づく注意エントロピーに基づいて動作可能です。CADE 2.5レンダリングパイプラインに統合されることで、QSilkは低ステップ数および超高解像度でクリーンでシャープな結果を生み出します。また、トレーニングやファインチューニングは不要で、ユーザーコントロールも最小限です。提案する技術はSD/SDXLバックボーンで一貫した定性的改善を報告し、CFG/Rescaleとの相乗効果も見せています。