Dòng tin

6 nội dung mới nhất

Tất cả

Fei-Fei LiarXivPaper·18 ngày trước

Systematic Discovery of Semantic Attacks in Online Map Construction through Conditional Diffusion

›HD map construction cho autonomous vehicles là yếu tố an toàn-quan trọng, nhưng attacks pixel-level hiện tại bị neutralized bởi adversarial defenses tiêu chuẩn.
›MIRAGE sử dụng latent manifold của diffusion models để tìm semantic attacks dạng environmental variations (bóng, đường ướt) mà bypass adversarial defenses.
›Hai attacks được kiểm tra: boundary removal loại bỏ 57.7% detections và làm hỏng 96% planned trajectories; boundary injection tạo boundary giả mạo thành công.
›Semantic-level perturbations hiệu quả dưới nhiều adversarial defenses, cho thấy defenses hiện tại yếu với các biến thể semantic so với pixel-level perturbations.

Fei-Fei LiarXivPaper·6 tháng trước

JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception

›JigsawComm là framework end-to-end học trích xuất đặc trưng sparse, semantic-aware để các phương tiện tự động chia sẻ thông tin nhìn thấy hiệu quả.
›Feature Utility Estimator dự đoán đóng góp của từng agent và loại bỏ dữ liệu trùng lặp giữa các agent.
›Giảm payload truyền tải xuống O(1) khi số lượng agent tăng, overhead meta information không đáng kể.
›Giảm khối lượng dữ liệu 20-500 lần so với state-of-the-art mà vẫn duy trì hoặc vượt trội về độ chính xác cảm nhận.

Fei-Fei LiarXivPaper·hơn 3 năm trước

Unsupervised domain-adaptive person re-identification with multi-camera constraints

›Giải quyết vấn đề person re-identification khi dữ liệu test khác biệt với training data bằng domain adaptation.
›Sử dụng self-training kết hợp multi-camera constraints để tinh chỉnh pseudo-labels cải thiện độ chính xác.
›Tận dụng thông tin person-pair từ môi trường thực tế mà không cần nhãn danh tính.
›Vượt trội các phương pháp trước đó trên các tập dữ liệu công khai và riêng tư với overlapping camera views.

Yann LeCunarXivPaper·khoảng 8 năm trước

Comparing Dynamics: Deep Neural Networks versus Glassy Systems

›Dùng phương pháp vật lý thống kê của hệ thủy tinh để phân tích động lực huấn luyện DNN.
›Khảo sát độ phức tạp của 'landscape' hàm mất mát và mức tương đồng với hệ glassy.
›Phát hiện quá trình huấn luyện chậm dần do số hướng 'phẳng' tăng lên.

Fei-Fei LiarXivPaper·khoảng 9 năm trước

Multiband NFC for High-Throughput Wireless Computer Vision Sensor Network

›Đề xuất hệ thống NFC sử dụng multiple frequency bands để đạt thông lượng truyền tải cao.
›Giải quyết nhu cầu truyền tải dữ liệu tốc độ cao cho các ứng dụng AR/VR và thị giác máy tính.

Fei-Fei LiarXivPaper·hơn 9 năm trước

RGB-D Salient Object Detection Based on Discriminative Cross-modal Transfer Learning

›Đề xuất dùng CNN để cải thiện phát hiện đối tượng nổi bật dựa trên thông tin độ sâu (depth).
›Xử lý vấn đề thiếu dữ liệu nhãn cho modality depth bằng chuyển giao từ ảnh RGB.
›Tận dụng dữ liệu phụ trợ từ modality nguồn để huấn luyện hiệu quả hơn.