Dòng tin

5 nội dung mới nhất

Bản tin hôm nay

Thứ Bảy 13 Th6, 2026 · 294 nội dung

Điều Quan Trọng Nhất Hôm Nay

›Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.

Tất cả

DAIR.AIXBài đăng·3 ngày trước

›Khái niệm Self-Harness cho phép scaffold/harness của agent tự cải thiện từ các lần chạy riêng của nó, thay vì giữ nguyên như một wrapper được duy trì thủ công

DAIR.AIXBài đăng·16 ngày trước

›Niềm tin phổ biến cho rằng harness có cấu trúc tốt luôn cải thiện độ tin cậy, và mô hình mạnh hơn cần ít hướng dẫn cấu trúc hơn, nhưng nghiên cứu này thử nghiệm giả thuyết đó.

DAIR.AIXBài đăng·18 ngày trước

AK (_akhaliq)HF PapersPaper·24 ngày trước

›Giới thiệu RPT (Reflective Prompt Tuning), framework tự động tối ưu prompt bằng function calling.
›LLM optimizer gọi diagnostic function để phát hiện các mẫu lỗi lặp lại và sinh báo cáo cấu trúc.
›Sử dụng báo cáo và lịch sử trước đó để cải tiến prompt qua mỗi lần lặp.
›Cải thiện hiệu suất lên tới 12.9% và tối ưu confidence calibration trên các tác vụ reasoning.

Riley GoodsideXBài đăng·khoảng 1 tháng trước

›Các biến thể prompt đơn giản không hoạt động; phải yêu cầu ChatGPT tự sinh mã SVG để tạo ký tự D'ni.