arXiv cs.AI

スパニングツリー自動回帰型視覚生成

Spanning Tree Autoregressive Visual Generation

http://arxiv.org/abs/2511.17089v1


本記事では、画像の中心バイアスや局所性といった先行知識を取り入れつつ、サンプリング性能を維持し、推論時に画像編集に対応できる柔軟な順序を提供するスパニングツリー自動回帰(STAR)モデリングを提案します。従来の自動回帰モデルは、ランダムに順序が入れ替えられたビジュアル生成において性能が低下するか、柔軟性が損なわれる問題がありました。これに対し、STARは画像パッチの位置によって定義された格子内でサンプリングされた均一なスパニングツリーの探索順序を利用し、幅優先探索により性能を効率的に構築します。STARのアプローチは、モデルのアーキテクチャに大きな変更を加えることなく、ポストフィックスの完成能力を保持しつつ、サンプリング性能を保持しています。