著者のサイモン・ウィリソンは、「ペリカンが自転車に乗るSVGを生成せよ」という非公式なモデルベンチマークを数年間実施してきました。この試みは奇妙ながらも貴重な示唆を与えています。近年では、エージェントと呼ばれるモデルが自ら作成したものを評価し、改善するループで動作しています。著者は、モデルに自らの出力を見せて修正させる実験を行い、SVGをJPEGに変換して評価、改善を繰り返す手法を採用しました。6種類の多モーダルモデルを使用し、それぞれが独自にイテレーションを止めるタイミングを決定しました。結果として、各モデルは初回の試みから改善され、リアリズムやディテールの追加を行いました。最終的には、モデルはそれぞれ異なるアプローチを採りながら、自己修正を通じて結果を進化させました。