arXiv cs.AI

文化記憶の持続性:拡散モデルにおける複合モダリティのアイコニシティの調査

The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

http://arxiv.org/abs/2511.11435v1


本研究では、テキストから画像への拡散モデルにおける一般化と記憶の曖昧さに焦点を当て、「複合モダリティのアイコニシティ」と呼ばれる特定のケースを考察します。これは、画像やテキストが、作品や映画の特定のシーンを思い起こさせるような文化的共有の連想を引き起こす場合を指します。従来の記憶研究が忘却に重きを置く中、本研究では、何が記憶され、どのように記憶されるのかに着目し、文化的参照の認識と再現のバランスを探ります。新しい評価フレームワークを導入し、認識(参照を特定する能力)と実現(模倣または再解釈を通じての描写)を区別します。767のWikidata由来の文化参照を横断する5つの拡散モデルを評価し、既存の類似性ベースの手法と比較して、複製と変換をより効果的に識別できることを示します。最終的に、文化的整合性は訓練データの頻度だけでなく、テキストの独自性や参照の人気、作成日時とも相関することを明らかにしました。この研究は、拡散モデルの価値が何を再現するかだけでなく、文化的知識をどのように変形し再文脈化するかにもあることを示し、单純なテキスト-画像マッチングを超えた豊かな文脈理解を進めます。