Dòng tin

1 nội dung mới nhất
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·4 ngày trước
Hướng tới Nghiên cứu Sâu Đa phương tiện Có thể Xác minh: Khung Multi-Agent cho Tạo Báo cáo Xen kẽ
Towards Verifiable Multimodal Deep Research: A Multi-Agent Harness for Interleaved Report Generation
  • Ptah là hệ thống multi-agent quản lý từ câu hỏi người dùng đến báo cáo web qua các giai đoạn planning, research, và writing.
  • Các agent chuyên biệt xây dựng kế hoạch nhận thức hình ảnh, thu thập bằng chứng theo claim, duy trì Visual Working Memory, soạn thảo báo cáo multimodal.
  • Agent verifier đóng vai trò acceptance function, thực thi kiểm chứng thực tế, tính trung thực trích dẫn, và tính nhất quán đa phương tiện.
  • PtahEval mở rộng các benchmark hiện có với đánh giá cấp hình ảnh và cấp trình bày, tạo báo cáo đáng tin cậy hơn baseline.