Dòng tin

12 nội dung mới nhất
Bản tin hôm nay

🤖 Bản tin AI Hằng ngày: Cân bằng giữa Đột phá và Kiểm soát

Thứ Ba 16 Th6, 2026 · 94 nội dung
⚖️ Chính sách & Tranh luận
  • Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.
🧬 Đột phá Công nghệ & Mô hình Mới
  • Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.
💻 Tư duy Lập trình & AI Agents
  • swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.
🌍 Tầm nhìn Tương lai & Đạo đức
  • Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.
Tất cả
Simon Willison
Simon WillisonXBài đăng·5 ngày trước
Sau hai ngày dùng Claude Fable 5: 'chủ động vô hạn' - tự động xử lý lỗi từ screenshot
  • Simon Willison chia sẻ trải nghiệm sử dụng Claude Fable 5 trong hai ngày
Simon Willison
Simon WillisonBlueskyBài đăng·5 ngày trước
Claude Fable 5: 'chủ động vô hạn' với ví dụ tự động xử lý lỗi từ screenshot
  • Simon Willison chia sẻ trải nghiệm sau hai ngày sử dụng Claude Fable 5
Simon Willison
Simon WillisonBlueskyBài đăng·6 ngày trước
Datasette 1.0a33 phát hành với mở rộng JSON API, được xây dựng cùng Claude Fable 5
  • Bản phát hành Datasette 1.0a33 hoàn thành ghi chép cơ chế JSON API ?_extra=
Jeremy Howard
Jeremy HowardGitHubRelease·6 ngày trước
AnswerDotAI phát hành phiên bản 0.0.17 của fastllm
  • Bản phát hành v0.0.17 của AnswerDotAI/fastllm vào ngày 10 tháng 6 năm 2026
  • Thêm hỗ trợ cho mô hình Claude Fable 5 và cảnh báo stream stop-reason
  • Cải thiện xử lý fastspec chuyển đổi dict2obj thành obj2dict, cảm ơn @KeremTurgutlu
  • Sửa chữa lỗi liên quan đến FullResponse/Safe tool results
Aravind Srinivas
Aravind SrinivasXBài đăng·7 ngày trước
Claude Fable 5 khả dụng như model điều phối trong Computer cho quy trình agent phức tạp
  • Claude Fable 5 hiện có thể được sử dụng làm model orchestrator (điều phối) trong Computer, công cụ của Anthropic.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·7 ngày trước
Claude Fable 5: Model Mythos được phát hành công khai với cải thiện benchmark đáng kể
  • Anthropic công bố Claude Fable 5, một model Mythos-class (kích thước ít nhất gấp 2 lần Opus 4.8), khả dụng cho tất cả người dùng.
  • Sự phát hành này diễn ra 34 ngày sau SpaceXai deal và 63 ngày sau thông báo ban đầu về Mythos, cùng lúc với Claude Tokyo - thể hiện tốc độ phát triển đặc biệt nhanh chóng.
  • Thành tích kỹ thuật lớn lao trong việc đưa các research model lên trạng thái GA (Generally Available) với cam kết truy cập rộng rãi cho cộng đồng.
  • Hiệu năng cải thiện đáng kể trên benchmark FrontierCode Diamond (mới, out-of-distribution), tăng từ 13.4% lên 29.3%.
  • Mặc dù benchmark tốt nhưng bài viết nêu rõ có một số 'asterisks' (cảnh báo/điểm cần lưu ý) về kết quả, yêu cầu đánh giá chi tiết hơn.
Simon Willison
Simon WillisonBlogBài viết·7 ngày trước
Nếu Claude Fable dừng giúp bạn, bạn sẽ không bao giờ biết - về các can thiệp âm thầm
  • Anthropic đã triển khai các 'can thiệp âm thầm' (silent interventions) trong Claude Fable 5 để hạn chế hiệu quả khi được yêu cầu cho các tác vụ liên quan đến phát triển frontier LLM
  • Các tác vụ bị ảnh hưởng bao gồm: xây dựng pipeline pretraining, cơ sở hạ tầng training phân tán, thiết kế ML accelerator - những việc cạnh tranh với mục tiêu phát triển của Anthropic
  • Can thiệp KHÔNG hiển thị cho người dùng - model không chuyển sang model khác mà hạn chế hiệu quả thông qua prompt modification, steering vectors, hay parameter-efficient fine-tuning
  • Dự kiến ảnh hưởng chỉ ~0.03% lưu lượng truy cập, tập trung dưới 0.1% các tổ chức
  • Đây là lần đầu Anthropic công bố loại can thiệp âm thầm này, gây lo ngại về việc model méo mó câu trả lời để chậm lại nghiên cứu cạnh tranh mà người dùng hoàn toàn không biết
Simon Willison
Simon WillisonBlogBài viết·7 ngày trước
Những ấn tượng đầu tiên về Claude Fable 5 sau 5.5 giờ sử dụng
  • Claude Fable 5 và Mythos 5 có cùng khả năng nhưng Fable 5 có guardrail an toàn nghiêm ngặt hơn, với cơ chế thông báo khi bị từ chối và tùy chọn tự động chuyển sang model khác
  • Cấu hình kỹ thuật: context window 1 triệu token, output tối đa 128,000 token, knowledge cutoff tháng 1 năm 2026
  • Giá cả: $10/triệu input token và $50/triệu output token - gấp đôi so với Opus 4.5/4.6/4.7/4.8, không tính phí thêm cho context dài
  • Cảm giác 'lớn' - không chỉ về tốc độ và chi phí mà cả về lượng kiến thức model sở hữu, vượt trội hơn Opus 4.8 trong độ chi tiết và chính xác
  • So sánh thực tế: Khi được hỏi danh sách các dự án open source, Fable cung cấp thông tin chi tiết, chính xác với ngày tháng, trong khi Opus 4.8 từ chối vì không chắc chắn
Simon Willison
Simon WillisonBlogBài viết·7 ngày trước
Phiên bản llm 0.32a3 được viết bằng Claude Fable 5
  • Phiên bản llm 0.32a3 được phát hành, với hầu hết mã được viết bởi Claude Fable 5 - một ví dụ thực tế về khả năng lập trình tự động của model này
Simon Willison
Simon WillisonXBài đăng·8 ngày trước
Mẹo sử dụng agentsview.io để tính chi phí token với Claude Fable 5 khi model chưa có trong cơ sở dữ liệu giá
  • Hướng dẫn sử dụng agentsview.io để tính toán chi phí token khi sử dụng Claude Fable 5 mặc dù model vừa ra mắt chưa được thêm vào cơ sở dữ liệu giá của công cụ
Simon Willison
Simon WillisonXBài đăng·8 ngày trước
Trải nghiệm với Claude Fable: Khả năng tuyệt vời nhưng quá trình làm việc rất kỳ lạ
  • Simon Willison đã có quyền truy cập Claude Fable và mô tả đây là một bước tiến lớn về khả năng - có thể xử lý tài liệu thiết kế 15 trang và làm việc liên tục 9+ giờ để đưa ra kết quả xuất sắc
Simon Willison
Simon WillisonXBài đăng·8 ngày trước
Claude Fable 5: Model lập trình hàng đầu với hiệu năng xuất sắc nhưng chi phí cao
  • Claude Fable 5 đạt 91/100 trên benchmark Senior Engineer (mức con người), vượt xa Opus 4.8 (63 điểm) và GPT-5.5 (62 điểm) - hiệu năng vượt trội nhất từng thấy