arXiv cs.LG

LUMA-RAG:証明可能に安定したストリーミングアラインメントを持つ生涯多モーダルエージェント

LUMA-RAG: Lifelong Multimodal Agents with Provably Stable Streaming Alignment

http://arxiv.org/abs/2511.02371v1


LUMA-RAGは、継続的な多モーダルデータストリームに対応する生涯多モーダルエージェントのアーキテクチャを提案する。主な課題は、インデックスの新鮮さを維持し、クロスモーダルな意味的一貫性を確保することである。LUMA-RAGは、三つの革新を持つ:1つ目は、動的に埋め込みを管理するストリーミングメモリシステム、2つ目は、Incremental Orthogonal Procrustes更新を使用したモーダル間の一貫性を保つアラインメントブリッジ、3つ目は、整合性のドリフトと量子化誤差を制限する安定性意識型のリトリーバルテレメトリーである。実験では、テキストから画像へのリトリーバルが高い精度を持ち、設計どおりの性能下降が示されたことから、LUMA-RAGが実用的な多モーダルRAGシステムのフレームワークとして確立されたことが示された。