本論文では、GNSSが利用できない厳しい環境における同時定位・地図作成(SLAM)技術に必須の堅牢なループクローズ検出を行うための手法「MPRF」を提案しています。視覚認識は強いテクスチャの欠如により失敗し、LiDAR方法はまばらさや曖昧さの影響を受けやすいという課題があります。MPRFは、視覚とLiDARの両方のモダリティに対し、トランスフォーマーベースの基盤モデルを活用したマルチモーダルパイプラインを構築し、厳しい非構造環境での堅牢なループクローズを実現します。この手法は、2段階の視覚検索戦略と明示的な6自由度ポーズ推定を結合し、DINOv2特徴とSONATAベースのLiDAR記述子を用いて候補のスクリーニングを効率的に行います。実験結果は、S3LIデータセットにおいてMPRFが最新の検索手法に比べて精度を向上させたことを示しています。MPRFは、SLAMバックエンドに適した解釈可能な対応を提供し、精度、効率、信頼性の間に良好なトレードオフを実現します。