本論文では、分散コンピューティングの継続的な環境において、AI駆動のワークロードのためにリアルタイムで適応的な調整を必要とするシステムの信頼性と一貫性を確保するための課題に対処します。著者たちは、Probabilistic Active Inference Resilience Agent(PAIR-Agent)を紹介し、これによりデバイスログから因果故障グラフを構築し、故障を特定し、能動的推論を通じて自律的に問題を修復します。PAIR-Agentは、障害条件の多様性に対してサービスの継続性と安定性を維持するために、継続的な監視と適応的な再構成を行うことにより、システムのレジリエンスを高めます。理論的検証により、このフレームワークの信頼性と効果が確認されました。