Dòng tin
Bản tin hôm nay
Thứ Bảy 13 Th6, 2026 · 294 nội dung
Điều Quan Trọng Nhất Hôm Nay
- ›Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.
Tất cả
FrontierCode: Benchmark mới đo lường mã duy trì được - hơn nửa SWEBench là rác không thể merge
- ›METR Evals phát hiện rằng hơn nửa kết quả SWEBench là code không thể merge, chứng tỏ sự hạn chế của benchmark cũ