本記事では、倉庫内におけるボックスの6Dポーズ推定手法「Box6D」を提案しています。従来の手法は、高精度のCADモデルや参照画像に依存しており、環境に対して柔軟性に欠けることが多いのが課題です。Box6Dは、1つのRGB-D観察からボックスの寸法を迅速に推測し、インスタンス特有のモデルではなくカテゴリCADテンプレートを用いてポーズを推定します。深度に基づくプラウスビリティフィルターと早期停止戦略を採用することにより、計算コストを削減しつつ、リアルワールドのストレージシナリオや公開ベンチマークで評価を行い、競争力のある6Dポーズ精度を実現しました。特に、推論時間は約76%短縮されました。この新しいアプローチは、倉庫自動化や物流の分野での活用が期待されています。