Dòng tin

1 nội dung mới nhất
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·4 ngày trước
Khám phá Quy trình Hợp tác: Tự động Tối ưu hóa cho Các Tình huống Xã hội Tuần tự
Discovering Cooperative Pipelines: Autoresearch for Sequential Social Dilemmas
  • Agent AI tự động thiết kế lại pipeline của hệ thống tổng hợp chính sách (policy synthesis) dựa trên LLM cho bài toán xã hội multi-agent.
  • Hệ thống khám phá các quy trình vượt trội hơn baseline thủ công, giảm variance đáng kể, và tối ưu hơn phương pháp prompt-only.
  • Các pipeline được khám phá phụ thuộc vào mục tiêu: chỉ dưới mục tiêu maximin, agent researcher mới tự động chèn cơ chế công bằng tường minh.
  • Researcher agent đọc mã, chỉnh sửa system prompts, chạy evaluations để quyết định giữ lại hoặc cải tiến các thành phần.