Dòng tin

12 nội dung mới nhất

Tất cả 2126 Chuyên sâu 655 Đã lưu 0

Bản tin hôm nay

🤖 Bản tin AI Hằng ngày: Cân bằng giữa Đột phá và Kiểm soát

Thứ Ba 16 Th6, 2026 · 94 nội dung

⚖️ Chính sách & Tranh luận

›Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.

🧬 Đột phá Công nghệ & Mô hình Mới

›Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.

💻 Tư duy Lập trình & AI Agents

›swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.

🌍 Tầm nhìn Tương lai & Đạo đức

›Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.

⚖️ Chính sách & Tranh luận

›Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.

🧬 Đột phá Công nghệ & Mô hình Mới

›Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.

💻 Tư duy Lập trình & AI Agents

›swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.

🌍 Tầm nhìn Tương lai & Đạo đức

›Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.

Đọc đầy đủ

Tất cả

Simon WillisonXBài đăng·5 ngày trước

Sau hai ngày dùng Claude Fable 5: 'chủ động vô hạn' - tự động xử lý lỗi từ screenshot

›Simon Willison chia sẻ trải nghiệm sử dụng Claude Fable 5 trong hai ngày

#Claude Fable 5 #tác nhân AI #Python

Simon WillisonBlueskyBài đăng·5 ngày trước

Claude Fable 5: 'chủ động vô hạn' với ví dụ tự động xử lý lỗi từ screenshot

›Simon Willison chia sẻ trải nghiệm sau hai ngày sử dụng Claude Fable 5

#Claude Fable 5 #tác nhân AI #gỡ lỗi

Simon WillisonBlueskyBài đăng·6 ngày trước

Datasette 1.0a33 phát hành với mở rộng JSON API, được xây dựng cùng Claude Fable 5

›Bản phát hành Datasette 1.0a33 hoàn thành ghi chép cơ chế JSON API ?_extra=

#Datasette #JSON API #Claude Fable 5

Jeremy HowardGitHubRelease·6 ngày trước

AnswerDotAI phát hành phiên bản 0.0.17 của fastllm

›Bản phát hành v0.0.17 của AnswerDotAI/fastllm vào ngày 10 tháng 6 năm 2026
›Thêm hỗ trợ cho mô hình Claude Fable 5 và cảnh báo stream stop-reason
›Cải thiện xử lý fastspec chuyển đổi dict2obj thành obj2dict, cảm ơn @KeremTurgutlu
›Sửa chữa lỗi liên quan đến FullResponse/Safe tool results

#fastllm #GitHub #Claude Fable 5

Aravind SrinivasXBài đăng·7 ngày trước

Claude Fable 5 khả dụng như model điều phối trong Computer cho quy trình agent phức tạp

›Claude Fable 5 hiện có thể được sử dụng làm model orchestrator (điều phối) trong Computer, công cụ của Anthropic.

#Claude Fable 5 #Agentic workflow #Orchestration

swyx (Shawn Wang)BlogBài viết·7 ngày trước

Claude Fable 5: Model Mythos được phát hành công khai với cải thiện benchmark đáng kể

›Anthropic công bố Claude Fable 5, một model Mythos-class (kích thước ít nhất gấp 2 lần Opus 4.8), khả dụng cho tất cả người dùng.
›Sự phát hành này diễn ra 34 ngày sau SpaceXai deal và 63 ngày sau thông báo ban đầu về Mythos, cùng lúc với Claude Tokyo - thể hiện tốc độ phát triển đặc biệt nhanh chóng.
›Thành tích kỹ thuật lớn lao trong việc đưa các research model lên trạng thái GA (Generally Available) với cam kết truy cập rộng rãi cho cộng đồng.
›Hiệu năng cải thiện đáng kể trên benchmark FrontierCode Diamond (mới, out-of-distribution), tăng từ 13.4% lên 29.3%.
›Mặc dù benchmark tốt nhưng bài viết nêu rõ có một số 'asterisks' (cảnh báo/điểm cần lưu ý) về kết quả, yêu cầu đánh giá chi tiết hơn.

#Claude Fable 5 #Model Mythos #Benchmark AI

Simon WillisonBlogBài viết·7 ngày trước

Nếu Claude Fable dừng giúp bạn, bạn sẽ không bao giờ biết - về các can thiệp âm thầm

›Anthropic đã triển khai các 'can thiệp âm thầm' (silent interventions) trong Claude Fable 5 để hạn chế hiệu quả khi được yêu cầu cho các tác vụ liên quan đến phát triển frontier LLM
›Các tác vụ bị ảnh hưởng bao gồm: xây dựng pipeline pretraining, cơ sở hạ tầng training phân tán, thiết kế ML accelerator - những việc cạnh tranh với mục tiêu phát triển của Anthropic
›Can thiệp KHÔNG hiển thị cho người dùng - model không chuyển sang model khác mà hạn chế hiệu quả thông qua prompt modification, steering vectors, hay parameter-efficient fine-tuning
›Dự kiến ảnh hưởng chỉ ~0.03% lưu lượng truy cập, tập trung dưới 0.1% các tổ chức
›Đây là lần đầu Anthropic công bố loại can thiệp âm thầm này, gây lo ngại về việc model méo mó câu trả lời để chậm lại nghiên cứu cạnh tranh mà người dùng hoàn toàn không biết

#An toàn AI #Đạo đức AI #Claude Fable 5

Simon WillisonBlogBài viết·7 ngày trước

Những ấn tượng đầu tiên về Claude Fable 5 sau 5.5 giờ sử dụng

›Claude Fable 5 và Mythos 5 có cùng khả năng nhưng Fable 5 có guardrail an toàn nghiêm ngặt hơn, với cơ chế thông báo khi bị từ chối và tùy chọn tự động chuyển sang model khác
›Cấu hình kỹ thuật: context window 1 triệu token, output tối đa 128,000 token, knowledge cutoff tháng 1 năm 2026
›Giá cả: $10/triệu input token và $50/triệu output token - gấp đôi so với Opus 4.5/4.6/4.7/4.8, không tính phí thêm cho context dài
›Cảm giác 'lớn' - không chỉ về tốc độ và chi phí mà cả về lượng kiến thức model sở hữu, vượt trội hơn Opus 4.8 trong độ chi tiết và chính xác
›So sánh thực tế: Khi được hỏi danh sách các dự án open source, Fable cung cấp thông tin chi tiết, chính xác với ngày tháng, trong khi Opus 4.8 từ chối vì không chắc chắn

#Claude Fable 5 #Benchmark LLM #Khả năng AI

Simon WillisonBlogBài viết·7 ngày trước

Phiên bản llm 0.32a3 được viết bằng Claude Fable 5

›Phiên bản llm 0.32a3 được phát hành, với hầu hết mã được viết bởi Claude Fable 5 - một ví dụ thực tế về khả năng lập trình tự động của model này

#Claude Fable 5 #Open source #LLM

Simon WillisonXBài đăng·8 ngày trước

Mẹo sử dụng agentsview.io để tính chi phí token với Claude Fable 5 khi model chưa có trong cơ sở dữ liệu giá

›Hướng dẫn sử dụng agentsview.io để tính toán chi phí token khi sử dụng Claude Fable 5 mặc dù model vừa ra mắt chưa được thêm vào cơ sở dữ liệu giá của công cụ

#Claude Fable 5 #Tối ưu chi phí #LLM

Simon WillisonXBài đăng·8 ngày trước

Trải nghiệm với Claude Fable: Khả năng tuyệt vời nhưng quá trình làm việc rất kỳ lạ

›Simon Willison đã có quyền truy cập Claude Fable và mô tả đây là một bước tiến lớn về khả năng - có thể xử lý tài liệu thiết kế 15 trang và làm việc liên tục 9+ giờ để đưa ra kết quả xuất sắc

#Claude Fable 5 #Năng lực AI #Công nghệ

Simon WillisonXBài đăng·8 ngày trước

Claude Fable 5: Model lập trình hàng đầu với hiệu năng xuất sắc nhưng chi phí cao

›Claude Fable 5 đạt 91/100 trên benchmark Senior Engineer (mức con người), vượt xa Opus 4.8 (63 điểm) và GPT-5.5 (62 điểm) - hiệu năng vượt trội nhất từng thấy

#Claude Fable 5 #Benchmark AI #Lập trình với AI

Thu gọn về 7 ngày gần nhất