arXiv cs.AI

WebGen-V Bench: LLMに基づくウェブ生成と評価における視覚デザイン向上のための構造化表現

WebGen-V Bench: Structured Representation for Enhancing Visual Design in LLM-based Web Generation and Evaluation

http://arxiv.org/abs/2510.15306v1


本論文では、LLM(大規模言語モデル)を活用したウェブ生成のための新たなベンチマークであるWebGen-Vを提案しています。WebGen-Vは、実データの質を向上させ、評価の詳細度を高めるためのフレームワークであり、主に三つの革新を含んでいます。1つ目は、現実のウェブページを収集するための無限に拡張可能なエージェント型クローリングフレームワークです。2つ目は、コンテンツ、レイアウト、視覚要素を明示的に結び付けた、構造化されたセクション単位のデータ表現です。3つ目は、テキスト、レイアウト、視覚を整列させたセクションレベルのマルチモーダル評価プロトコルです。実験により、ステート・オブ・ザ・アートなLLMとの効果を検証し、各要素の寄与が確認されています。WebGen-Vは、実データの取得からウェブページの生成、構造化されたマルチモーダル評価までの統一的なパイプラインを提供する初めての試みです。