属性条件による人間評価を通じた画像生成の多様性ベンチマーキング

Benchmarking Diversity in Image Generation via Attribute-Conditional Human Evaluation

本研究は、テキストから画像へのモデル（T2I）の生成物における多様性の評価を強化するためのフレームワークを提案します。近年の技術進歩にもかかわらず、T2Iモデルは同質的な出力が多く、多様性を欠くことが問題視されています。提案するフレームワークは、個々のコンセプトとその変動要因を評価することで多様性を体系的に測定します。主な成果は、精緻な多様性評価のための新しい人間評価テンプレート、特定された変動要因を含む多様な概念を網羅したプロンプトセット、そして人間の注釈によるモデル比較のための方法論です。また、様々な画像埋め込み手法を多様性測定の観点から厳密に比較します。この研究は、T2Iモデルの多様性をランキングし、特に苦手なカテゴリーを特定するための堅牢な方法論と洞察を提供し、今後のモデル改善や評価指標の開発に道を開くものです。