arXiv cs.AI

DP$^2$O-SR: 実世界の画像超解像のための直接的知覚嗜好最適化

DP$^2$O-SR: Direct Perceptual Preference Optimization for Real-World Image Super-Resolution

http://arxiv.org/abs/2510.18851v1


本論文では、実世界の画像超解像(Real-ISR)を改善するための新たなフレームワーク「DP$^2$O-SR」を提案します。これは、事前学習済みのテキストから画像への拡散モデルを活用し、生成モデルを知覚的嗜好に合わせることによって構築されています。各出力の知覚的品質はノイズの影響を受けるため、本手法では多数の出力から最適なペアを構築し、評価することで、構造的な忠実性と自然な外観を保ちながら高品質な画像を生成します。また、モデルの能力に応じた選択比率や階層的嗜好最適化によって、効率的かつ安定的な学習を実現します。実験により、DP$^2$O-SRは、知覚的品質を大幅に向上させることが示され、実世界のベンチマークでも優れた一般化能力を持つことが確認されました。