Dòng tin

5 nội dung mới nhất
Bản tin hôm nay

Thứ Bảy 13 Th6, 2026 · 294 nội dung
Điều Quan Trọng Nhất Hôm Nay
  • Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.
Tất cả
DAIR.AI
DAIR.AIXBài đăng·3 ngày trước
Self-Harness: Những Scaffold Có Thể Tự Cải Thiện
  • Khái niệm Self-Harness cho phép scaffold/harness của agent tự cải thiện từ các lần chạy riêng của nó, thay vì giữ nguyên như một wrapper được duy trì thủ công
DAIR.AI
DAIR.AIXBài đăng·16 ngày trước
Các mô hình mạnh hơn không phải lúc nào cũng cần harness nhẹ hơn
  • Niềm tin phổ biến cho rằng harness có cấu trúc tốt luôn cải thiện độ tin cậy, và mô hình mạnh hơn cần ít hướng dẫn cấu trúc hơn, nhưng nghiên cứu này thử nghiệm giả thuyết đó.
DAIR.AI
DAIR.AIXBài đăng·18 ngày trước
/goal thực sự tuyệt vời!
  • Lệnh /goal là cách hiệu quả để tận dụng tối đa coding agents ngày nay.
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·24 ngày trước
Tối ưu hóa Prompt Phản ánh thông qua Gọi Hàm LLM
  • Giới thiệu RPT (Reflective Prompt Tuning), framework tự động tối ưu prompt bằng function calling.
  • LLM optimizer gọi diagnostic function để phát hiện các mẫu lỗi lặp lại và sinh báo cáo cấu trúc.
  • Sử dụng báo cáo và lịch sử trước đó để cải tiến prompt qua mỗi lần lặp.
  • Cải thiện hiệu suất lên tới 12.9% và tối ưu confidence calibration trên các tác vụ reasoning.
Riley Goodside
Riley GoodsideXBài đăng·khoảng 1 tháng trước
Ghi chú: Cho ChatGPT tự viết trình tạo SVG D'ni hiệu quả hơn dùng các sơ đồ sẵn có
  • Các biến thể prompt đơn giản không hoạt động; phải yêu cầu ChatGPT tự sinh mã SVG để tạo ký tự D'ni.