HackerNews

Apple: Pico-Banana-400K: テキスト誘導の画像編集のための大規模データセット

Apple: Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing

https://www.arxiv.org/pdf/2510.19808


Pico-Banana-400Kは、テキストガイドによる画像編集を目的とした大規模データセットです。このデータセットは、異なるテーマやスタイルを持つ画像とともに、それに関連するテキスト記述が含まれています。研究者たちは、特に生成モデルや深層学習技術の性能を向上させるために、このデータセットを利用することが期待されています。実際の画像編集タスクにおいて、ユーザーが提供したテキスト情報を用いて画像を編集することが可能となり、より直感的かつクリエイティブなアプローチが実現できるでしょう。このプロジェクトの詳細は、公式のGitHubリポジトリに公開されています。