arXiv cs.AI

3Dガウスおよび拡散ベースの視線リダイレクション

3D Gaussian and Diffusion-Based Gaze Redirection

http://arxiv.org/abs/2511.11231v1


高忠実度の視線リダイレクションは、視線推定器の一般化を向上させるための拡張データ生成において重要です。従来の3Dガウススプラッティング(3DGS)モデルは、微細で連続的な視線の変化を描画するのに苦労しています。本論文では、Diffusion Transformer(DiT)を用いた新しいフレームワークDiT-Gazeを提案し、視線の角度に対する弱い監督と直交制約損失を組み合わせて3D視線リダイレクションモデルを強化します。DiTは高忠実度の画像合成を可能にし、合成された中間視線角度を用いることでなめらかな視線方向の多様性を提供します。さらに、直交制約損失は視線、頭部の姿勢、表情の内部表現の分離を数学的に強制します。実験の結果、DiT-Gazeは知覚品質とリダイレクション精度の両方において新たな最先端を達成し、視線誤差を4.1%から6.353度まで減少させることが示されました。