ピコバナナ400Kは、テキストガイドによる画像編集研究を促進するために設計された約40万のテキスト・画像・編集のトリプレットからなる大規模データセットです。このデータセットには、元の画像(Open Imagesから)、人間のような編集指示、およびNano-Bananaによって生成され、Gemini-2.5-Proによって検証された編集結果が含まれています。35の編集操作が8つの意味カテゴリにわたっており、色調整から高レベルのオブジェクトやスタイルの編集まで多様な変換をカバーしています。データセットは、簡潔で自然な言語の編集指示を生成するGemini-2.5-Flashに基づき、編集後に自動評価される仕組みを持っています。成約データは良質な編集を示すものとして分類されており、約40万の画像編集データが現実の画像から引き出されています。