arXiv cs.AI

ImageGem: 実世界における生成的画像インタラクションデータセットと生成モデルのパーソナライズ

ImageGem: In-the-wild Generative Image Interaction Dataset for Generative Model Personalization

http://arxiv.org/abs/2510.18433v1


本研究では、個々の好みを理解する生成モデルを研究するためのデータセット「ImageGem」を紹介します。従来の生成モデルの発展を妨げる主な要因は、実世界での詳細なユーザー好みのアノテーションが不足していることです。このデータセットは、57,000人のユーザーからの実世界のインタラクションデータを含み、242,000個のカスタマイズされたLoRAの構築、300万のテキストプロンプトの作成、500万の生成画像を実現しています。得られたユーザー好みのアノテーションを用いることで、より良い好みの整合性を持つモデルを訓練しました。また、個々のユーザー好みを活用し、パーソナライズされた画像検索および生成モデルの推薦における検索モデルの性能を調査しました。最後に、ユーザーの好みに合わせてカスタマイズされた拡散モデルを編集するためのエンドツーエンドフレームワークを提案しました。この結果、ImageGemデータセットは生成モデルのパーソナライズに新たなパラダイムをもたらすことを示しました。