Dòng tin
Tất cả
Hướng tới Ước tính Hình học Video Nhất Quán
Towards Consistent Video Geometry Estimation
- ›ViGeo là foundation model transformer để khôi phục hình học không gian dày đặc và nhất quán theo thời gian từ chuỗi video.
- ›Dynamic chunking attention cho phép tiếp xúc với cả context hai chiều và nhân quả trong huấn luyện, thích ứng ở thời gian test mà không cần retraining.
- ›Completion-based data refinement framework huấn luyện video depth completion teacher từ annotations thưa thớt để cải thiện supervision quality.
- ›ViGeo dự đoán depth, surface normals và point maps trong cùng framework với state-of-the-art hiệu suất.
- ›Hoạt động tốt trên online, offline và long-video depth estimation mà chỉ huấn luyện trên public datasets.