arXiv cs.AI

物理的被写界深度モデルと多視点幾何的監視による深度一貫性のある3Dガウススプラッティング

Depth-Consistent 3D Gaussian Splatting via Physical Defocus Modeling and Multi-View Geometric Supervision

http://arxiv.org/abs/2511.10316v1


この記事では、深度が極端に変化するシーンにおける3D再構築の課題に取り組んでいます。従来の手法は、近距離と遠距離領域間の監視信号の不一致により、遠方の深度推定の不正確さと近距離の構造劣化を同時に解決できませんでした。本論文では、被写界深度の監視と多視点の一貫性を統合した革新的な計算フレームワークを提案し、二つの主要要素から成り立っています。まず、被写界深度監視は、スケール再構成された単眼深度推定器を使用して深度の先行情報を生成し、物理的に正確なボケ画像を合成するために被写界深度損失を適用し、深度の忠実性を向上させます。次に、多視点の一貫性監視は、LoFTRに基づく半密な特徴マッチングを用い、視点間の幾何的誤差を最小限に抑え、マッチングされたポイントの最小二乗最適化により深度の一貫性を確保します。この方式により、深度の忠実性が優れており、Waymo Open Datasetで最先端手法より0.8 dBのPSNR向上が示されました。