Dòng tin

1 nội dung mới nhất
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·4 ngày trước
ChildVox: Benchmark Ngôn ngữ Âm thanh Lớn cho Mô tả Âm thanh trong Thời thơ ấu
ChildVox: A Speech, Audio, and Large Audio-Language Model Benchmark in Understanding and Characterizing Sound across Childhood
  • ChildVox là benchmark cho mô tả các tín hiệu âm thanh mà trẻ em sử dụng giao tiếp, từ sinh đến tuổi học sinh.
  • Tích hợp 20+ sub-task trên 17 bộ dữ liệu tập trung vào trẻ em, bao gồm âm thanh sinh lý, phát âm không ngôn ngữ, âm tiết chính tắc, và ngôn ngữ nói.
  • Đánh giá các mô hình audio/speech foundation (tự giám sát, ASR-oriented, large audio-language models) trên phân loại, mô hình hóa, đánh giá chất lượng giọng nói.
  • Kết quả cho thấy các mô hình hiệu suất cao trong nhận dạng tín hiệu âm thanh trẻ em, hỗ trợ đặc trưng hóa mức độ ngôn ngữ và theo dõi sản xuất giọng nói.