EU-Agent-Bench: EU法の下でのLLMエージェントの違法行為を測定する

本記事では、EU法の文脈における大規模言語モデル（LLM）エージェントの違法行為の潜在的傾向を測定するための新しいベンチマーク「EU-Agent-Bench」を紹介します。このベンチマークは、ユーザーの入力に基づき、適法および非適法な行動の両方を評価し、データ保護、偏見/差別、科学的完全性などの複数のカテゴリを含むシナリオをカバーしています。研究者たちは、エージェントのシステムプロンプトに関連法令を含め、その遵守を求める指示を与えることが法的コンプライアンスにどのように影響を及ぼすかを検討しました。今後は異なる法域や多言語でのエージェントの安全性基準を拡張する研究が期待されています。