本稿では、生成的視覚モデルにおける内部表現の進化を考察し、GAN(敵対的生成ネットワーク)やVAE(変分オートエンコーダ)から拡散ベースのアーキテクチャへの概念的・技術的な移行に焦点を当てています。合成を分散表現の集積と捉え、狭義の合成と広義の合成の違いを提案します。狭義の合成ではコンパクトな潜在空間が生成過程を完全に決定しますが、広義の合成ではモデルの表現作業が層を超えて分散されます。モデルアーキテクチャの詳細な分析と層ごとの表現に介入する実験を通じて、拡散モデルが表現の負担を分散させ、一元的な内部空間の前提に挑戦していることを示します。この観点から、生成AIを単なる内容の合成ではなく、特化したプロセスの構成として再考する必要性を論じています。