arXiv cs.AI

CPO: 制御可能な画像生成のための条件選好最適化

CPO: Condition Preference Optimization for Controllable Image Generation

http://arxiv.org/abs/2511.04753v1


本研究では、テキストから画像を生成する際の制御性を向上させるための新しい手法「条件選好最適化(CPO)」を提案します。従来のControlNetやControlNet++は、画像ベースの制御信号を導入し、生成画像と入力制御信号の間でのピクセル単位のサイクル整合性を改善しています。しかし、サンプリングプロセスにおける逆伝播のコストが高いため、ControlNet++は低ノイズのタイムステップのみを最適化し、高ノイズのタイムステップの寄与を無視しています。一方、直接的な選好最適化(DPO)は、モデルの選好を制御性の高い画像にシフトさせようとしますが、生成モデルの不確実性から難しさがあります。CPOでは、生成画像ではなく制御条件に対して選好学習を行い、混乱要因を排除して低分散な学習目的を実現します。大量の実験を通じて、CPOは最先端のControlNet++よりも多くの制御タイプにおいて顕著に制御性を向上させることが示されています。