Dòng tin
Tất cả
Phát hiện có hệ thống các tấn công Semantic trong xây dựng bản đồ trực tuyến thông qua Diffusion có điều kiện
Systematic Discovery of Semantic Attacks in Online Map Construction through Conditional Diffusion
- ›HD map construction cho autonomous vehicles là yếu tố an toàn-quan trọng, nhưng attacks pixel-level hiện tại bị neutralized bởi adversarial defenses tiêu chuẩn.
- ›MIRAGE sử dụng latent manifold của diffusion models để tìm semantic attacks dạng environmental variations (bóng, đường ướt) mà bypass adversarial defenses.
- ›Hai attacks được kiểm tra: boundary removal loại bỏ 57.7% detections và làm hỏng 96% planned trajectories; boundary injection tạo boundary giả mạo thành công.
- ›Semantic-level perturbations hiệu quả dưới nhiều adversarial defenses, cho thấy defenses hiện tại yếu với các biến thể semantic so với pixel-level perturbations.
JigsawComm: Truyền tải đặc trưng ngữ nghĩa để cảm nhận hợp tác giữa phương tiện hiệu quả
JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception
- ›JigsawComm là framework end-to-end học trích xuất đặc trưng sparse, semantic-aware để các phương tiện tự động chia sẻ thông tin nhìn thấy hiệu quả.
- ›Feature Utility Estimator dự đoán đóng góp của từng agent và loại bỏ dữ liệu trùng lặp giữa các agent.
- ›Giảm payload truyền tải xuống O(1) khi số lượng agent tăng, overhead meta information không đáng kể.
- ›Giảm khối lượng dữ liệu 20-500 lần so với state-of-the-art mà vẫn duy trì hoặc vượt trội về độ chính xác cảm nhận.
Nhận dạng danh tính người không giám sát với điều chỉnh miền và ràng buộc đa camera
Unsupervised domain-adaptive person re-identification with multi-camera constraints
- ›Giải quyết vấn đề person re-identification khi dữ liệu test khác biệt với training data bằng domain adaptation.
- ›Sử dụng self-training kết hợp multi-camera constraints để tinh chỉnh pseudo-labels cải thiện độ chính xác.
- ›Tận dụng thông tin person-pair từ môi trường thực tế mà không cần nhãn danh tính.
- ›Vượt trội các phương pháp trước đó trên các tập dữ liệu công khai và riêng tư với overlapping camera views.
So sánh động lực học: Mạng nơ-ron sâu và Hệ thủy tinh (glassy systems)
Comparing Dynamics: Deep Neural Networks versus Glassy Systems
- ›Dùng phương pháp vật lý thống kê của hệ thủy tinh để phân tích động lực huấn luyện DNN.
- ›Khảo sát độ phức tạp của 'landscape' hàm mất mát và mức tương đồng với hệ glassy.
- ›Phát hiện quá trình huấn luyện chậm dần do số hướng 'phẳng' tăng lên.
NFC đa dải tần cho hệ thống cảm biến thị giác không dây tốc độ cao
Multiband NFC for High-Throughput Wireless Computer Vision Sensor Network
- ›Đề xuất hệ thống NFC sử dụng multiple frequency bands để đạt thông lượng truyền tải cao.
- ›Giải quyết nhu cầu truyền tải dữ liệu tốc độ cao cho các ứng dụng AR/VR và thị giác máy tính.
Phát hiện đối tượng nổi bật RGB-D bằng học chuyển giao đa phương thức
RGB-D Salient Object Detection Based on Discriminative Cross-modal Transfer Learning
- ›Đề xuất dùng CNN để cải thiện phát hiện đối tượng nổi bật dựa trên thông tin độ sâu (depth).
- ›Xử lý vấn đề thiếu dữ liệu nhãn cho modality depth bằng chuyển giao từ ảnh RGB.
- ›Tận dụng dữ liệu phụ trợ từ modality nguồn để huấn luyện hiệu quả hơn.