arXiv cs.AI

CompressionAttack: プロンプト圧縮を利用したLLM搭載エージェントの新たな攻撃面

CompressionAttack: Exploiting Prompt Compression as a New Attack Surface in LLM-Powered Agents

http://arxiv.org/abs/2510.22963v1


この研究は、LLM(大規模言語モデル)を搭載したエージェントがプロンプト圧縮を用いて推論コストを削減する際に生じる新たなセキュリティリスクを指摘しています。圧縮モジュールは効率性を追求するため、安全性が考慮されていないため、敵対的な入力によって操作され、意味のずれやLLMの挙動の変化を引き起こす可能性があります。著者は、プロンプト圧縮を新たな攻撃面として特定し、CompressionAttackというフレームワークを提案しました。このフレームワークは、2つの戦略、すなわち、高圧縮によるHardComと、潜在空間の摂動を利用するSoftComを含んでいます。複数のLLMに対する実験では、攻撃成功率が最大80%に達し、98%の選好変更が確認されました。また、VSCode ClineやOllamaにおけるケーススタディは、現実世界での影響を示しており、現在の防御策が効果的でないことが浮き彫りになり、より強力な保護が求められています。