この研究では、モバイルプラットフォームを操作するための人間に似た能力を持つコンピュータエージェントの安全性を高める方法について述べています。特に、システムの侵害やプライバシー漏洩といったリスクが懸念されており、これらの安全性の問題を検出することが課題とされています。そこで、著者たちはMobileRisk-Liveという動的なサンドボックス環境を導入し、リアルなデータを用いた安全性検出基準を提供します。この基盤の上に、OS-Sentinelという新しいハイブリッド安全検出フレームワークを提案し、フォーマルバリファイアとビジョン・ランゲージモデル(VLM)を組み合わせてリスクを評価します。実験結果では、OS-Sentinelが従来の手法と比較して10%-30%の改善を達成したことが示され、安全かつ信頼性の高い自律モバイルエージェントの開発に向けた重要な示唆を提供しています。