音声駆動型人間アニメーションモデルは、時間的オート回帰生成中にキャラクターのアイデンティティが徐々に失われる「アイデンティティドリフト」に悩まされることが多い。この問題を解決するために、著者たちは「ルックアヘッド・アンカリング」という手法を提案している。この技術では、現在の生成ウィンドウ内ではなく、未来のタイムステップからのキーフレームを活用し、モデルが即時の音声信号に応じながら未来のアンカーを追求することを可能にする。これにより、キャラクターのアイデンティティを一貫して保持しつつ、自然な動きが維持される。この方法は自己キーフレーミングも可能にし、キーフレーム生成の必要性を排除する。実験では、いくつかの人間アニメーションモデルに適用した結果、リップシンク、アイデンティティ保持、視覚品質において優れた成果を上げたことが確認された。