本論文では、単眼ビデオから動的シーンを再構築する新しい枠組み「4D3R」を提案しています。従来の手法は静的シーンに対しては有効ですが、動的コンテンツに対しては限界があります。4D3Rは、静的成分と動的成分を分離し、ポーズフリーでのレンダリングを実現するための二段階アプローチを採用しています。初めに3Dの基盤モデルを利用してポーズと幾何学的性質を推定し、次に動作を意識した精緻化を行います。また、動作認識型バンドル調整モジュールを導入し、動的オブジェクトのセグメント化を精密に行うことでカメラポーズの精度を向上させ、効率的な動作認識型ガウススプラッティングを利用し動的運動をモデル化します。このアプローチは、最先端の手法に比べて最大1.8dBのPSNR改善を実現し、計算コストを5倍軽減しました。