HackerNews

新しいプロンプトインジェクション論文:エージェントの二項則と攻撃者の二次移動

New prompt injection papers: Agents rule of two and the attacker moves second

https://simonwillison.net/2025/Nov/2/new-prompt-injection-papers/


この記事では、最近発表されたプロンプトインジェクションに関する二つの論文について紹介しています。最初の論文『エージェントの二項則』は、AIエージェントの安全性に関する実践的なアプローチを提案しており、エージェントがセッション内でプロンプトインジェクションの影響を最小限に抑えるためには、三つの特性のうち二つのみを満たすべきとしています。それは、信頼できない入力を処理できること、敏感なシステムやプライベートデータにアクセスできること、外部と通信できることのいずれかです。また、プロンプトインジェクション攻撃が依然として解決されていない問題であることを強調し、それに対処するためにこの「二項則」を考慮したシステム設計が重要であると述べています。