arXiv cs.AI

赤外データ生成のための拡散モデルの推論時スケーリング

Inference-Time Scaling of Diffusion Models for Infrared Data Generation

http://arxiv.org/abs/2511.07362v1


本研究は、赤外画像生成における拡散モデルの推論時スケーリング手法を探求しています。赤外画像は、低視認性条件下での温度に基づくシーン理解を可能にしますが、高品質な注釈データの不足により、赤外アプリケーション向けのモデル開発が困難とされています。本論文では、限られたデータセットの制約のもと、FLUX.1-devという最先端のテキストから画像への拡散モデルを赤外ドメインに適応させ、少数の赤外画像を用いてファインチューニングを行います。訓練されたバリファイアは、推論中に拡散サンプリングプロセスを案内し、生成品質を向上させるために利用されます。実験の結果、提案手法は生成品質を一貫して改善し、KAISTの多スペクトル歩行者検出ベンチマークデータセットにおいてFIDスコアを10%削減しました。低データ赤外設定において、推論時のガイダンスがドメインギャップを埋める有望な方向であることを示唆しています。