最近の画像編集技術は大きな進展を遂げ、複雑な指示に基づいて元のコンテンツを操作できるようになっています。しかし、編集に伴う物理的な効果が現実感の生成において重要であり、たとえば物体を削除する際にはその影や反射、近くの物体との相互作用も考慮しなければなりません。既存のモデルやベンチマークは主に指示の完遂に焦点を当てており、これらの物理的効果を見落としています。この記事では、PICABenchという新しいベンチマークを提案し、光学、力学、状態変化にわたる8つのサブディメンションを通じて物理的リアリズムを体系的に評価します。また、人間の注釈と質問を用いた信頼性のある評価プロトコルPICAEvalも提案しています。主流のモデルを評価した結果、物理的リアリズムは依然として難しい課題であり、今後の研究に向けた基盤となることを期待しています。