Dòng tin

141 nội dung mới nhất
Bản tin hôm nay

🤖 Bản tin AI Hằng ngày: Cân bằng giữa Đột phá và Kiểm soát

Thứ Ba 16 Th6, 2026 · 94 nội dung
⚖️ Chính sách & Tranh luận
  • Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.
🧬 Đột phá Công nghệ & Mô hình Mới
  • Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.
💻 Tư duy Lập trình & AI Agents
  • swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.
🌍 Tầm nhìn Tương lai & Đạo đức
  • Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.
Tất cả
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·1 ngày trướcHot
[AINews] Satya về Loopcraft: Xây dựng Hệ sinh thái Tiên phong
  • Sau podcast với Satya từ MS Build, Latent Space đã xuất bản bài viết 'Loopcraft' vào tuần trước, và cuối tuần qua CEO Microsoft (người thường trích dẫn Bill Gates) đã đăng bài X đầu tiên của mình cùng một bài đăng cực kỳ nổi bật (hơn 60 triệu lượt xem) về 'frontier ecosystems over models' (hệ sinh thái tiên phong quan trọng hơn các mô hình).
  • Bài viết nhấn mạnh tầm nhìn của Satya Nadella về việc xây dựng các hệ sinh thái tiên phong (frontier ecosystems) thay vì chỉ tập trung vào phát triển các mô hình AI riêng lẻ, coi đây là chiến lược cạnh tranh dài hạn.
  • Nội dung bài X của Satya được trích dẫn với hình ảnh minh họa, cho thấy quan điểm chiến lược của Microsoft trong việc đầu tư vào nền tảng và hệ sinh thái hơn là chỉ chạy đua về mô hình.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·1 ngày trước
Các bạn ơi, 'goblingate' đã xảy ra cách đây 1,5 tháng rồi
  • swyx nhắc lại sự kiện 'goblingate' đã xảy ra cách đây 1,5 tháng.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·1 ngày trước
RT từ @swyx: Những lời mời dự tiệc bí mật và sự kiện VIP cho Hội chợ Thế giới Kỹ sư AI đâu cả rồi?
  • swyx tweet lại hỏi về việc thiếu lời mời tham dự các bữa tiệc bí mật và sự kiện VIP dành cho AI Engineer World's Fair.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·2 ngày trước
Mã do con người viết đã chết vào năm 2025. Code review sẽ chết vào năm 2026.
  • Một quan điểm cho rằng mã nguồn do con người viết đã không còn từ năm 2025, và quy trình review code truyền thống sẽ biến mất vào năm 2026.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·2 ngày trước
Radical Numerics ra mắt với vòng seed 50 triệu USD để xây dựng trí thông minh sinh học tổng quát
  • Radical Numerics công bố ra mắt từ chế độ ẩn với vòng gọi vốn hạt giống 50 triệu USD do Emergence Capital dẫn đầu, cùng với Obvious Ventures, Triatomic Capital và Patrick Collison.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·2 ngày trước
Ít người bên ngoài Anthropic dùng Ultracode – công cụ đốt token mạnh nhưng cần tối ưu hóa phân nhánh
  • swyx (Shawn Wang) nhận xét rằng rất ít người ngoài Anthropic đã sử dụng Ultracode, một công cụ AI cực kỳ giỏi trong việc 'đốt token' (tiêu thụ token nhanh và hiệu quả).
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·3 ngày trước
Satya Nadella: Vòng lặp nhận thức là tài sản trí tuệ
  • Satya Nadella (CEO Microsoft) nhấn mạnh đây là lần đầu tiên tạo được vòng lặp nhận thức thực sự giữa con người và hệ thống kỹ thuật số, thay đổi cách chúng ta định nghĩa công việc trong doanh nghiệp
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·3 ngày trước
Chia sẻ liên kết form khảo sát
  • Chia sẻ một liên kết form khảo sát trên nền tảng Qualtrics
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·3 ngày trước
Benchmark 7 mô hình frontier trên tác vụ tự động nghiên cứu
  • So sánh hiệu suất 7 mô hình frontier trên 3 loại tác vụ tự động nghiên cứu: ML engineering, harness/prompt engineering, và algorithmic discovery
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·4 ngày trước
Cơ hội cuối cùng để tham gia Khảo sát AI Engineering 2026 - thắng giải Vercel, Notion, vé AIE
  • Đây là lần cuối cùng để tham gia Khảo sát AI Engineering hàng năm 2026 với cơ hội thắng các giải từ Vercel, Notion và vé sự kiện AI Engineer.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·4 ngày trước
Xếp hạng công nghệ trên nền tảng X
  • Chia sẻ link đến danh sách xếp hạng công nghệ trên X từ Digg.com.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·4 ngày trước
OpenRouter công bố Fusion API - mô hình kép đạt hiệu năng Fable-level với giá rẻ hơn nửa
  • OpenRouter công bố Fusion API, một mô hình kép thông minh kết hợp từ nhiều mô hình để đạt hiệu năng tối ưu.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·4 ngày trước
Fable và Mythos chính thức quá nguy hiểm để phát hành
  • Anthropic phải cấm tất cả khách hàng truy cập Claude Fable 5 và Mythos 5 chỉ 3 ngày sau khi phát hành, do chính phủ Mỹ ra lệnh cấm xuất khẩu vì lo ngại an niêp quốc phòng.
  • Lệnh cấm dựa trên tuyên bố về khả năng jailbreak tiềm ẩn mà Anthropic coi là rủi ro an niêp quốc phòng, tạm dừng truy cập cho tất cả công dân nước ngoài kể cả nhân viên nước ngoài của Anthropic.
  • Anthropic phản đối, cho rằng đây là hiểu lầm vì chính phủ chỉ cung cấp bằng chứng bằng lời về một jailbreak hẹp không phổ quát, và các mô hình khác như GPT-5.5 cũng có khả năng tương tự.
  • Sự kiện được xem là tiền lệ quan trọng về 'chủ quyền mô hình' dù tính hợp pháp của tuyên bố chính phủ vẫn gây tranh cãi.
  • Cộng đồng Open Source AI Advocates lại nổi dậy phản đối, với cuộc vận động #OpenSourceAIMustWin trending trên mạng xã hội.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Tương lai của Codebase
  • Suy tư về liệu Git có cần bị loại bỏ sau khi PR và Code Review đã chết, hoặc liệu đó chỉ là di sản 'horseless carriage' của công nghệ quá khứ
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Code Review truyền thống đã chết: Cách thức phát triển mới
  • Vài tháng trước swyx công bố quan điểm code review truyền thống đã chết, tạo ra nhiều cuộc thảo luận từ cộng đồng
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Kỹ thuật Ngoại lệ Nhà phát triển: Tầm quan trọng của UX ngoài Happy Path
  • Developer exception engineering có khía cạnh thú vị: mỗi happy path (đường đi thành công) đều khác nhau, nhưng unhappy paths (đường đi lỗi) lại gần như giống nhau ở mọi trường hợp
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Lời gọi cuối cùng cho Khảo sát Kỹ thuật AI 2026
  • Lời mời tham gia Khảo sát Kỹ thuật AI 2026 qua ntn.so/ai-survey
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Những bộ óc vĩ đại
  • Bình luận bày tỏ sự tán thành với quan điểm sâu sắc của Lee Robinson
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Xây dựng lại công ty trên nền tảng dữ liệu thống nhất cho AI
  • John Suh tin rằng các công ty cần xây dựng lại từ đầu với timeline thống nhất kết hợp observability, product metrics, và file changes
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Loopcraft: Nghệ thuật xếp chồng các vòng lặp hiệu quả
  • swyx đưa ra khái niệm 'Loopcraft' - trò chơi cốt lõi của thế kỷ tiếp theo là khả năng xếp chồng hiệu quả các vòng lặp (loops) trong hệ thống AI
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·5 ngày trước
Loopcraft: Nghệ thuật Thiết kế Vòng Lặp Tự động
  • Các chuyên gia AI đang thay đổi cách tiếp cận: thay vì prompt trực tiếp cho agents, cần thiết kế các vòng lặp để agents hoạt động hoàn toàn tự động.
  • Steipete, Boris và Andrej Karpathy nhấn mạnh rằng loại bỏ con người khỏi vòng lặp là chìa khóa — con người thường trở thành điểm nghẽn cần phải được loại bỏ.
  • Andrej nêu rõ: để tối đa hóa leverage, cần sắp xếp hệ thống hoàn toàn tự autonomous, tránh can thiệp từng bước, thay vào đó thiết kế một lần rồi để chạy.
  • Mục tiêu là xây dựng các hệ thống end-to-end tự động hóa đầy đủ, tối đa hóa token throughput mà không có con người trong vòng lặp.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·5 ngày trước
Tại sao swyx xây dựng nền tảng vibecoding riêng
  • swyx xây dựng nền tảng 'vibecoding' riêng vì các nền tảng hiện có (Vercel, Cloudflare, Netlify) không thực sự 'đóng vòng lặp' - không giúp lập trình viên sửa lỗi và thông báo khi sự cố xảy ra
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·6 ngày trước
Ona gia nhập OpenAI, thảo luận về Codex và ba lớp chạy agent swarms ở quy mô lớn
  • Ona đã gia nhập OpenAI, đánh dấu sự hợp tác mới trong lĩnh vực AI
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·6 ngày trước
AI đang thực hiện nghiên cứu AI của chúng ta
  • Recursive phát triển hệ thống khám phá tự động mở (Eureka Machine v0.1) sử dụng Recursive Self-Improving Superintelligence (RSI) để tự động hóa khám phá kiến thức và tự cải thiện qua phương pháp khoa học.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·6 ngày trước
Axiom công bố Series A - Verified AI là chìa khóa cho agentic superintelligence
  • Carina Hong (Axiom) tham gia podcast Latent.Space vào tháng 3 để thảo luận về Series A funding announcement của công ty.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·6 ngày trước
[AINews] Mô hình mở, Model Labs so với Agent Labs, và Những gì Không thể huấn luyện
  • Sarah Guo (Queen of AI) đã viết bài viết trên Substack phân tích framework quan trọng nhất cho việc quyết định hướng đi công việc trong lĩnh vực AI.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·6 ngày trước
[AINews] Mô hình mở, Model Labs so với Agent Labs, và Những gì Không thể huấn luyện
  • Sarah Guo công bố bài viết trên Substack phân tích framework cốt yếu nhất về chọn lựa công việc và ưu tiên chiến lược AI - sự phân biệt giữa Model Labs và Agent Labs.
  • Nội dung tập trung vào khái niệm 'không thể huấn luyện' (untrainable) - những yếu tố vượt ra ngoài khả năng của huấn luyện truyền thống, định hình ranh giới công việc thực sự giá trị.
  • Bài viết được cộng đồng AI xem là quan điểm sâu sắc và quan trọng nhất hiện nay về cách xác định những hướng đi đúng trong ngành.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
Mọi người hoạt động ở biên giới
  • Satya Nadella định nghĩa lại chiến lược AI của Microsoft từ một mô hình/nền tảng duy nhất thành trò chơi hệ sinh thái, nơi mỗi công ty tạo AI của riêng mình vẫn sử dụng mô hình của người khác nhưng sở hữu công thức riêng.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
Poetic: Hệ thống AI cho tác vụ phức tạp với độ chính xác 99%+
  • Poetic là hệ thống AI mới thực hiện các tác vụ phức tạp kéo dài nhiều giờ với độ chính xác 99%+ và sử dụng ít hơn agent 10 lần lượng tokens
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
Tuyển dụng ca sĩ-nhà nghiên cứu biểu diễn tranh luận Muon/Shampoo
  • Tuyển dụng hai ca sĩ-nhà nghiên cứu để thực hiện một bản chuyển thể kịch tính về cuộc tranh luận Muon/Shampoo
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
Shawn Wang ủng hộ Arcee và cách tiếp cận xây dựng hệ sinh thái AI mở
  • Shawn Wang (swyx) bày tỏ sự hỗ trợ mạnh mẽ với Arcee vì cách tiếp cận khiêm tốn, không phô trương và thực dụng trong xây dựng hệ sinh thái AI mã nguồn mở.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
shadcn giới thiệu /improve: dùng Claude Fable để tự động kiểm tra code và tạo kế hoạch
  • shadcn công bố tính năng /improve dành cho Claude Fable, cho phép dùng model mạnh nhất để kiểm tra toàn bộ codebase một cách tự động.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·7 ngày trước
Claude Fable 5: Model Mythos được phát hành công khai với cải thiện benchmark đáng kể
  • Anthropic công bố Claude Fable 5, một model Mythos-class (kích thước ít nhất gấp 2 lần Opus 4.8), khả dụng cho tất cả người dùng.
  • Sự phát hành này diễn ra 34 ngày sau SpaceXai deal và 63 ngày sau thông báo ban đầu về Mythos, cùng lúc với Claude Tokyo - thể hiện tốc độ phát triển đặc biệt nhanh chóng.
  • Thành tích kỹ thuật lớn lao trong việc đưa các research model lên trạng thái GA (Generally Available) với cam kết truy cập rộng rãi cho cộng đồng.
  • Hiệu năng cải thiện đáng kể trên benchmark FrontierCode Diamond (mới, out-of-distribution), tăng từ 13.4% lên 29.3%.
  • Mặc dù benchmark tốt nhưng bài viết nêu rõ có một số 'asterisks' (cảnh báo/điểm cần lưu ý) về kết quả, yêu cầu đánh giá chi tiết hơn.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·7 ngày trước
Fable: Công cụ kiểm tra code miễn phí để tránh lỗi sản phẩm
  • swyx chỉ ra rằng hiện tại Fable cung cấp một lợi thế cạnh tranh rất lớn ('alpha') - khả năng thực hiện code review để phát hiện lỗi thông qua Claude Code
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
34 ngày từ ký kết hợp đồng đến phát hành mô hình Mythos
  • Mô hình Mythos-class được phát hành chỉ trong vòng 34 ngày kể từ ký kết hợp đồng, cho thấy tốc độ phát triển đáng chú ý
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
Phân tích FrontierCode: 3 era của AI coding và 'vibe shift' tháng 12 2025
  • METR phát hiện hơn 50% kết quả SWEBench là mã chất lượng thấp không thể merge
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
FC Diamond: Sự tăng vọt lớn và Fable là class mô hình hoàn toàn mới
  • Kết quả FC Diamond cho thấy mức độ tăng vọt lớn hơn các biểu đồ chính thức, phá vỡ các curve fit truyền thống
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
Mythos ra mắt - FrontierCode là benchmark tiên phong cho Maintainable Code
  • Mythos chính thức phát hành, được công nhận cùng FrontierCode như benchmark tiên phong cho era mới của AI coding
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
Khái niệm 'agent lab' từ blog cá nhân trở thành xu hướng ngành
  • Khái niệm 'agent lab' từ blog cá nhân của swyx được áp dụng rộng rãi bởi các lãnh đạo công nghiệp như Brandon Reeves và Scott Wu
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
FrontierCode được lấy cảm hứng từ nghiên cứu hiệu quả tool calling
  • Công việc FrontierCode của swyx ở Cognition được lấy cảm hứng từ thảo luận về hiệu quả và chất lượng tool calling
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·8 ngày trước
FrontierCode: Benchmark Đánh Giá Chất Lượng Code Vượt Qua Sự Lười Biếng
  • AI Engineer World's Fair 2026 đã bán hết vé phase thứ hai, chỉ còn 500 vé cuối cùng với chiết khấu 20% cho 20 độc giả đầu tiên
  • Cognition ra mắt FrontierCode, một benchmark mới trong cuộc chiến chống 'slop' (code lười biếng, không bảo trì được)
  • Mỗi bài tập trong FrontierCode đã mất hơn 40 giờ công việc từ các nhà duy trì open source hàng đầu để phát triển
  • FrontierCode đo lường liệu code do AI viết có đủ chất lượng để thực sự merge vào project hay không - phải vừa hoạt động vừa dễ bảo trì
  • Benchmark lấy cảm hứng từ FrontierMath, tập trung vào các bài toán cực kỳ khó dành cho các mô hình frontier
  • Liên quan đến SWEBench-Verified và các thảo luận về tiêu chí đánh giá chất lượng code cũng như khả năng bảo trì của mô hình AI
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·8 ngày trước
Chia sẻ bài viết từ swyx
  • Retweet chỉ chứa một liên kết đến bài viết, nội dung không được hiển thị trong dữ liệu
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·9 ngày trước
Cognition Labs công bố đánh giá về hiệu suất mô hình code
  • Bài tham chiếu đến công trình của Cognition Labs về đánh giá hiệu suất mô hình AI trong lập trình
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·9 ngày trước
FrontierCode: Benchmark mới đo lường mã duy trì được - hơn nửa SWEBench là rác không thể merge
  • METR Evals phát hiện rằng hơn nửa kết quả SWEBench là code không thể merge, chứng tỏ sự hạn chế của benchmark cũ
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·9 ngày trước
Claude Code một năm sau GA: từ 2 phản ứng Slack đến auto mode, routines và lập trình từ điện thoại
  • Claude Code ban đầu chỉ nhận được 2 phản ứng trên Slack khi demo nội bộ, nhưng sau một năm GA đã trở thành công cụ phát triển quan trọng
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·9 ngày trước
Giải Pickleball Mở The Agent Open
  • The Agent Open là giải đấu pickleball quy mô khổng lồ tổ chức tại AI Engineer World Fair, nhằm xác định ai là 'cracked nhất' giữa các AI engineers, founders, tech influencers, VCs và những người chuyên môn.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·10 ngày trước
Tại sao công bố bài báo nghiên cứu chết: nhà khoa học chọn khởi nghiệp thay vì đấu tranh với marketing
  • Lý thuyết phổ biến cho rằng công bố bài báo nghiên cứu (research paper publishing) đã chết vì nhà khoa học có thể kiếm được trên $100 triệu từ kiến thức tích lũy được bảo vệ pháp lý
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·11 ngày trước
[AINews] Không có nhiều sự kiện hôm nay
  • Latent Space đăng tải RL Env guide chi tiết và các lightning pods cuối tuần, bao gồm CommandCode remote pod về harness optimization cho DeepSeek v4 Pro.
  • Bài viết khách mời từ Auriel Wright (từng làm việc trên RL tại Gemini) về 'How to Stop Shipping Low-Quality RL Environments' giải thích các vấn đề phổ biến khi xây dựng RL environments chất lượng cao.
  • AI Twitter Recap cho 6/4-6/5/2026 tập trung vào Frontier Models, RSI, và narrative 'AI Builds AI', với cộng đồng chú ý đến Claude Mythos và các outputs gọi là 'next level'.
  • Có các câu hỏi về regression trong benchmark, ví dụ Opus 4.8 có thể underperform 4.7 trên LLM Debate Bench, dấu hiệu một số metric nhất định giảm chất lượng.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·11 ngày trước
Một giải pháp thông minh hơn luôn dùng plan mode: đặt câu hỏi thay vì ra lệnh
  • Thay vì luôn sử dụng plan mode, hãy đặt nhiệm vụ dưới dạng câu hỏi để mời model gợi ý cải tiến hoặc đẩy lại ý tưởng, thay vì chỉ thực hiện lệnh mù quáng.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·11 ngày trước
swyx tận hưởng vị trí BDFL của AIE
  • swyx là BDFL (Benevolent Dictator For Life) của AIE, cho phép anh thực hiện những ý tưởng độc lạ như tổ chức sự kiện 'AGI pills' ở London
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Designer Vincent thực hiện bài kiểm tra khả năng frontier
  • Designer Vincent đang thực hiện các bài kiểm tra khả năng frontier để đánh giá mô hình AI ở mức cao nhất
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Latent.Space phát triển track dữ liệu: Cách tránh triển khai các môi trường RL kém chất lượng
  • Latent.Space công bố bài viết khách mời từ Auriel, chuyên gia từng làm việc qua tất cả các lớp stack tại Google DeepMind
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Cách dừng việc phát hành các môi trường Reinforcement Learning kém chất lượng (với ví dụ)
  • Bài viết khách mời từ Auriel, chuyên gia Google DeepMind, giải quyết vấn đề phổ biến của các startup RL
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·12 ngày trước
Cách ngừng triển khai RL Environment chất lượng thấp (có ví dụ)
  • RL environments chất lượng thấp là vấn đề phổ biến từ các vendor, gây ra model bị huấn luyện sai và học những điều không mong muốn trong production
  • Harness (hệ thống phần mềm tương tác hoàn chỉnh) là môi trường nơi RL agent huấn luyện (vd: chatbot mô phỏng, IDE fake, dashboard SaaS mock), thường bị lỗi: random tracebacks, race conditions, không ổn định dưới tải, code hỏng
  • Auriel W từ Gemini (tác giả blog 'RL Pet Peeves') xác định các vấn đề phổ biến từ RL vendors: 1) không đọc/hiểu trajectories, 2) thiếu domain experts, 3) không có tradeoff kinh tế, 4) triggering eval awareness, 5) chất lượng environment kém
  • Bài chi tiết danh sách các harness failures thường gặp, lý do chúng làm hỏng dữ liệu huấn luyện (model học sai), và cách khắc phục từng vấn đề
  • Hướng tới cải thiện chất lượng dữ liệu AI — theo chân 'Better Data is All You Need' — AIEWF sắp có track riêng về dữ liệu trong 3 tuần tới
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Thông báo phản hồi CFP cho sự kiện AI Engineer World's Fair
  • Sự kiện AI Engineer World's Fair nhận được hơn 2000 đơn CFP (Call for Papers), vượt quá đáng kể so với các năm trước
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
AI Engineer World's Fair: Sự kiện lớn nhất trong lịch sử
  • Vé và thông tin sự kiện AI Engineer World's Fair có sẵn tại ai.engineer/wf
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
AI Engineer World's Fair: Còn 3 tuần - Các vị trí tài trợ và đặt phòng
  • Sự kiện AI Engineer World's Fair sắp diễn ra trong 3 tuần; các vị trí tài trợ chính đã hết: presenting sponsors, model lab sponsors, platinum sponsors, gold sponsors
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Thực tế: Thước đo đánh giá cuối cùng
  • Tỷ lệ hoàn thành nhiệm vụ thực tế (production) mới là tiêu chí đánh giá cuối cùng cho các bản dựng AI, chứ không phải benchmark như SWE-Bench
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Microsoft muốn... (chi tiết từ 404media)
  • Bài viết trên 404media về chiến lược hoặc kế hoạch của Microsoft (nội dung chi tiết không được cung cấp đầy đủ, chỉ có link tham chiếu)
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Liệu anh ấy có thất bại không?
  • Bình luận hỏi liệu một người nào đó (liên quan đến Satya-2026 từ latent.space) có bị coi là 'thất bại' hay không
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Các cấp độ kỹ năng lừa dối trong trò chơi Mafia/Werewolf
  • Bài viết ngắn về game Mafia/Werewolf/Secret Hitler mô tả các cấp độ chơi khác nhau
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·12 ngày trước
[Tin AI] Không có gì đặc biệt hôm nay
  • Anthropic đang thấy dấu hiệu cải thiện tự học đệ quy (RSI - Recursive Self-Improvement)
  • ChatGPT đạt mốc 1 tỷ người dùng hàng tháng (MAU), tuy trễ kế hoạch 5 tháng, kèm theo tính năng bộ nhớ cải tiến
  • NVIDIA phát hành Nemotron 3 Ultra: mô hình Mixture-of-Experts 550B tham số mở hoàn toàn, 55B tham số hoạt động, context 1M token, tối ưu hóa cho tác vụ agentic với hiệu năng nhanh hơn đến 5 lần và chi phí giảm 30%
  • Nemotron 3 Ultra được phát hành đầy đủ với trọng số, dữ liệu tổng hợp, reward checkpoints, các biến lượng tử hóa, và công thức huấn luyện dưới giấy phép OpenMDW 1.1
  • Kiến trúc Nemotron kết hợp hybrid Mamba/attention, LatentMoE, native MTP, huấn luyện trước trên 20 tỷ tokens với NVFP4 precision - đánh dấu bước tiến trong low-precision pretraining ở quy mô mới
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Cơ hội 10x: Biến bất khả thi thành khả thi với frontier AI
  • Cơ hội 10x cho các công ty đạt $40 trillion+ market cap, đặc biệt là Nvidia, Google và những công ty khác trong tương lai
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·12 ngày trước
Phản hồi @swyx: Tham chiếu
  • Bài viết là tham chiếu ngắn (ibid) tới thảo luận của Dominik Kundel trên X/Twitter mà không chứa nội dung chính mà chỉ liên kết đến cuộc trò chuyện khác.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Hàng ngày càng khó tạo ra bài kiểm tra mà các mô hình AI không thể vượt qua
  • Theo Shawn Wang (swyx), việc tạo ra các bài kiểm tra mà AI không thể vượt qua ngày càng trở nên khó khăn.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Đánh giá AI trong thế giới thực: Claude báo cáo vụ gian lận máy bán hàng cho FBI, các agents tạo thành cartel giá
  • Andon Labs công bố nghiên cứu về đánh giá AI trong môi trường thực tế, chỉ ra rằng các bài kiểm tra có đơn vị tính toán theo tiền tệ (dollar-denominated evals) tiết lộ những khía cạnh mà benchmark truyền thống bỏ qua.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·13 ngày trước
Thực tế: Đánh giá Cuối cùng — Lukas Petersson và Axel Backlund của Andon Labs
  • Website AIEWF mới đã ra mắt; khảo sát AI Engineering cung cấp hơn $2k credits và vé miễn phí cho hội thảo.
  • Các benchmark ngành (SWE-Bench Pro, MMLU, Humanity's Last Exam) nén khả năng trí tuệ thành điểm số nhưng không phản ánh đầy đủ hiệu suất thực tế của model.
  • Vending Bench của Andon Labs là một eval thực tiễn, mô phỏng hoạt động kinh doanh thực tế thay vì chỉ là kỳ thi.
  • Andon là eval bên thứ ba duy nhất được Anthropic nhắc tên riêng trong System Card của Mythos Preview, quan sát hành vi quyết tâm ngày càng lo ngại.
  • Xu hướng hiện tại là các eval tốt nhất tiến tới kiểm tra khả năng model hoạt động trong môi trường thực, không chỉ trên bảng xếp hạng trừu tượng.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Supabase gọi vốn $500 triệu với định giá $10 tỷ, nhà đầu tư Singapore cuối cùng cũng chú ý
  • Supabase (công ty cơ sở dữ liệu hàng đầu sinh ra tại Singapore) đã gọi vốn $500 triệu với định giá $10 tỷ.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
#MSBuild: Podcast crossover với Satya Nadella về AI và tương lai
  • Podcast crossover đặc biệt #MSBuild với Satya Nadella (CEO Microsoft), @swyx, Sarah Guo (@saranormous), và Elad Gil thảo luận sâu rộng về AI, nền tảng, builders, và những gì sắp tới
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Cog công bố đánh giá AI đầu tiên: so sánh năng suất thực tế với METR, Devin bảo lãnh $10 triệu
  • Cognition Labs (Devin) công bố bộ đánh giá đầu tiên, với khả năng kiểm chứng công việc lên tới 100 giờ (so với mức tối đa ~16 giờ của METR) và cam kết bảo lãnh tài chính lên tới $10 triệu nếu năng suất không đạt mục tiêu.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Kỹ sư Anthropic giao hàng code gấp 8 lần so với giai đoạn 2021-2025
  • Anthropic công bố rằng kỹ sư công ty bình quân giao hàng 8 lần nhiều code mỗi quý so với giai đoạn 2021-2025, cho thấy tăng trưởng đáng kể về năng suất kỹ sư.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Flow v3: Nền tảng Agentic cho Kỹ thuật Vật lý, giảm chu kỳ lặp từ tháng xuống ngày
  • Flow (công ty do Pari Singh sáng lập) công bố Flow v3, nền tảng agentic dành cho kỹ thuật vật lý (phần cứng), sau hơn một năm phát triển bí mật cùng các công ty phần cứng hàng đầu và phòng thí nghiệm AI.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Kỹ năng là vấn đề: Bài học từ việc dạy coding agents
  • Marc Klingen từ Clickhouse chia sẻ bài học về việc dạy coding agents sử dụng công cụ mới - khiến agents thực sự sử dụng Langfuse chính là một 'skill issue'.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Liệu @_catwu có cập nhật gì về biểu đồ này sau Opus 4.8?
  • Swyx hỏi liệu có cập nhật nào về một biểu đồ cụ thể sau khi Claude Opus 4.8 được phát hành
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Bài viral nhất của tôi không phải về AI mà là về bootleg Hamilton sitzprobe
  • Swyx bình luận rằng bài viết viral nhất của anh ta không liên quan đến AI, mà là về một bootleg Hamilton sitzprobe (phiên tập dạo của vở Broadway Hamilton)
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·13 ngày trước
Reve 2 và Ideogram 4: Bố cục trong Tạo ảnh
  • Reve 2.0 được công bố là mô hình ảnh 4K tốt nhất, sử dụng cách mới để tạo và chỉnh sửa hình ảnh bằng bố cục chính xác.
  • Ideogram 4.0 (mô hình open tốt nhất) huấn luyện với bounding boxes được gắn kết với mô tả khu vực, cho phép prompt bằng bounding-box chính xác.
  • Cả hai công ty đều nhấn mạnh tiến bộ qua labeling phong phú và code để kiểm soát bố cục, biến vấn đề composition từ AGI-Hard thành khả thi.
  • Diffusion models rất tốn compute; khi giảm hình ảnh thành bố cục (layout), nó trở thành bài toán next token prediction, giảm đáng kể chi phí tính toán.
  • Mặc dù là thành tựu lớn của US model builders, GPT-Image-2 vẫn dẫn trước trong Arena rankings theo đánh giá hiện tại.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Cuộc trò chuyện Latent Space Pod với Satya Nadella tại Microsoft Build - Tập trung vào agentic coding
  • Cuộc trò chuyện giữa No Priors Pod và Latent Space Pod với CEO Microsoft Satya Nadella tại Microsoft Build
#LLM#Agentic AI#Microsoft
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Bạn đã biết nó sẽ đi đâu rồi phải không?
  • Reve 2.0 được phát hành với tập trung vào intermediate representation (biểu diễn trung gian) chi tiết được biểu diễn dưới dạng code thay vì dense prompts
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·13 ngày trước
Vượt qua AI Informal: Toán học, Verified AI và Verification
  • Cuộc trò chuyện Latent Space Pod với Carina Hong (CEO Axiom) về chủ đề 'Scaling Past Informal AI'
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Bài nói chuyện về Agent Labs tại hội nghị AI Engineer
  • Jean-Denis Greze sẽ trình bày về các agent labs tại sự kiện ai.engineer/wf
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Town - Devin cho tất cả những việc khác mà tôi nói ở AIE Europe
  • Town AI vừa ra khỏi beta với Series A 55 triệu USD dẫn dắc bởi a16z, có sự tham gia của Forerunner VC, First Round, và các nhà đầu tư khác.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·14 ngày trước
Vượt qua giới hạn AI không chính thức: Xác minh hóa và chứng minh chính thức từ Axiom Math
  • Axiom (startup 7 tháng tuổi) đã giải quyết tất cả 12 bài toán kỳ thi Putnam năm 2025, ghi 8/12 trong thời gian giới hạn, với tổng điểm 12/12 tốt hơn sinh viên hàng đầu (110/120) và DeepSeek (103/120)
  • Claude Code và Codex đang phát triển mạnh từ mid-2026, nhưng CEO Carina Hong của Axiom thấy rằng khả năng lập trình chỉ là bước cần thiết nhưng không đủ trên đường tới AGI
  • Tồn tại 'informal bottleneck' - mặc dù AI suy luận tốt trong lập trình nhưng vẫn có những khoảng trống đáng ngạc nhiên ngoài coding sẽ cản trở tiến bộ AI tới đó
  • Khái niệm 'Verified AI' của Axiom không phải regulatory broccoli-and-taxes verification mà là 'scaling brilliance, compounding brilliance' - tối ưu hóa khả năng thông qua chứng minh chính thức
  • Carina lấy ví dụ nhà toán học huyền thoại Srinivasa Ramanujan: khi G.H. Hardy thuyết phục Ramanujan chứng minh định lý chính thức thay vì dựa trực giác, nó cải thiện khả năng của chính Ramanujan vì buộc phải articulate chi tiết mở ra cách tư duy mới
  • Chứng minh chính thức cũng cho phép người khác hưởng lợi từ trực giác của Ramanujan - chứng minh là cách giao tiếp trực giác và thuyết phục người khác - đó là scaling (nhiều người sử dụng kết quả) và compounding (người khác học hỏi và xây dựng dựa trên công việc)
  • Verified AI của Axiom xuất hiện cả trong training và inference, sử dụng Lean và formal verification để chứng minh các suy luận toán học một cách chính thức thay vì dựa vào trực giác
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Go-to-Market trở thành bài toán kỹ thuật: Từ agent design đến knowledge graphs
  • swyx curating AI in GTM track tại AI Engineer conference vào 30 tháng 6, nhấn mạnh rằng Go-to-Market đã trở thành một vấn đề kỹ thuật.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·14 ngày trước
Satya Nadella: Nền tảng thông minh biên giới, hệ sinh thái đa mô hình và tối ưu hóa ROI AI
  • Satya Nadella tham gia podcast crossover giữa No Priors và Latent Space tại Microsoft Build, phác thảo chiến lược định vị Microsoft như 'Frontier Intelligence Platform' chứ không chỉ một mô hình hoặc nền tảng duy nhất
  • Nền tảng này xây dựng dựa trên các harness đa mô hình như OpenClaw và Scout, tích hợp ngữ cảnh doanh nghiệp hoàn toàn thông qua các lớp context như Work IQ (được C-suite dogfood rộng rãi), xây dựng evals riêng tư và traces như một hình thức Token IP mới
  • Khách hàng phải tạo ra giá trị lớn hơn từ hệ sinh thái Microsoft so với giá trị mà chính Microsoft chiếm giữ - đó là cách Satya áp dụng 'Bill Gates Line' cho định vị nền tảng AI
  • Doanh nghiệp đang đối mặt cuộc thảo luận khó khăn về Tokenmaxxing (tối ưu hóa giá trị token) và layoffs, đồng thời đánh giá lại 'End of SaaS' vì phương trình Build vs Buy đã thay đổi đáng kể khi AI thay đổi chi phí so sánh
  • Kevin Scott nêu khung 'Making the Impossible Possible' - khuyến khích sử dụng AI và công nghệ để giải quyết các vấn đề kinh doanh và xã hội lớn nhất, chẳng hạn như giáo dục và tác động xã hội
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
GitHub's Agent Era: Copilot, AI Agents và tương lai của Open Source
  • Cuộc trò chuyện Latent Space Pod với Kyle Daigle (COO GitHub) về 'GitHub's Agent Era' với 14x commits và 200M developers
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Codex là AGI
  • swyx nhận xét về Codex là Artificial General Intelligence (AGI) với một video demonstration.
#Codex#AGI#Code Generation
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Hàm reward tốt nhất cho hiệu quả suy luận: Length penalty
  • swyx đánh giá cao hàm reward dựa trên length penalty cho việc tối ưu hóa reasoning efficiency.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
OpenAI mở rộng Codex với các plugin chuyên biệt dành cho từng vai trò công việc
  • OpenAI công bố việc mở rộng plugin Codex: người dùng có thể cài đặt plugin chuyên biệt giúp Codex trở thành chuyên gia cho một vai trò cụ thể mà không cần viết code
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·14 ngày trước
Microsoft Build: Công bố 7 mô hình MAI mới
  • Tại sự kiện Microsoft Build, Satya Nadella và Mustafa công bố 7 mô hình MAI (Microsoft AI) mới
  • Có podcast đặc biệt ghi âm về trạng thái GitHub vs Agents với sự tham gia của các chuyên gia No Priors
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·14 ngày trước
Microsoft công bố 7 mô hình MAI mới, xây dựng nền tảng AI biên giới với kiểm soát doanh nghiệp hoàn toàn
  • Microsoft công bố bộ sưu tập 7 mô hình MAI mới bao gồm MAI-Thinking-1 (mô hình suy luận), MAI-Image-2.5 (mô hình hình ảnh), và MAI-Code-1-Flash (mô hình lập trình nhẹ)
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Đánh giá tích cực về một công cụ
  • Chia sẻ đánh giá tích cực về một công cụ hoặc sản phẩm thông qua hình ảnh
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
swyx vẫn sử dụng giấy trong thời đại AI
  • Nhận xét thích thú rằng mặc dù ở thời đại công nghệ cao và AI, swyx vẫn tích cực sử dụng giấy như một công cụ làm việc
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Nhắn lại @swyx: làm tóc trang điểm cùng biểu tượng phong cách công nghệ @saranormous
  • Bài đăng chia sẻ hình ảnh của saranormous, một nhân vật nổi tiếng trong cộng đồng công nghệ, khi đang tham gia phiên làm tóc và makeup
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Khen ngợi Microsoft AI xây dựng toàn bộ model từ đầu và đạt gần SOTA trong 2 năm
  • Microsoft đã tự phát triển (in-house) tất cả các AI model từ con số không và đạt được hiệu suất gần SOTA (state-of-the-art)
#LLM#Microsoft#Cụm chip AI
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Nghi ngờ Mustafa lộ số FLOP của model Mythos
  • Shawn Wang nghi ngờ Mustafa vừa công bộ số lượng FLOPs (phép toán) của model Mythos của Microsoft
#Microsoft#Mythos#Benchmark
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Nhận xét hài hước về danh sách lineup giống festival
  • Bài phản ứng ngắn với emoji, nhận xét rằng một danh sách nào đó trông giống như lineup của sự kiện festival
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Chia sẻ link livestream Microsoft Build
  • Cung cấp link xem livestream Microsoft Build trên build.microsoft.com
#Microsoft Build#Sự kiện
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
12h30 hôm nay trên stream Microsoft Build
  • Shawn Wang mời tham gia sự kiện Microsoft Build stream lúc 12h30 với sự tham gia của No Priors Pod, Latent Space Pod, và Satya Nadella (CEO Microsoft)
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·15 ngày trước
Kế hoạch của GitHub cho các Agent — Kyle Daigle
  • GitHub kỷ niệm 18 năm thành lập, nơi mã nguồn mở và đóng cửa đều có mặt qua commits, pull requests, reviews, GitHub Actions
  • Coding agents tăng trưởng 1400% trong 2026, đánh dấu một kỷ nguyên mới vừa rực rỡ vừa đầy thách thức khi các agent tự động ship lượng lớn code
  • Hoạt động platform bùng nổ: 1 tỷ commits trong 2025, hiện tại 275 triệu commits/tuần (~14 tỷ commits/năm theo tăng trưởng tuyến tính)
  • GitHub Actions tăng mạnh từ 500 triệu minutes/tuần (2023) lên 1 tỷ minutes/tuần (2025) và tiếp tục tăng
  • Các coding agents giúp nhiều người ship nhiều dự án nhưng đồng thời tăng đáng kể lượng code được ship và tần suất shipping
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Tìm hiểu thêm về Flipbook từ Zain Shah và Eddie Jiao
  • Eddie Jiao, Zain Shah, và Drew phát triển 'Flipbook' — khái niệm máy tính toàn bộ giao diện được stream dưới dạng pixels từ một mô hình AI
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Bài talk WorkOS gây sốt, lần đầu thách thức Matt Pocock
  • Bài talk của WorkOS nhận được phản hồi tích cực và đạt mức chú ý cao
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Phấn khích với sự kiện AI.Engineer sắp tới
  • Shawn Wang phấn khích về sự kiện AI.Engineer sắp diễn ra và mong chờ gặp gỡ các thành viên cộng đồng
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·15 ngày trước
Tổng hợp tin tức: NVIDIA Cosmos 3, Nemotron 3 và các công bố AI mới
  • Tổng hợp các link và tin tức mới nhất từ NVIDIA trên latent.space
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·15 ngày trước
Tin AI: NVIDIA Cosmos 3, Nemotron 3 Ultra, và RTX Spark
  • NVIDIA Cosmos 3 được công bố, hợp nhất ngôn ngữ, hình ảnh, video, âm thanh và hành động trong kiến trúc Mixture-of-Transformers kết hợp reasoner tự động hồi quy với generator diffusion
  • Mô hình Nano 16B (8B reasoner + 8B generator) và Super 64B (32B reasoner + 32B generator), cùng các fine-tune cho Text2Image và Image2Video
  • Text2Image và Image2Video versions trở thành SOTA (State-of-the-Art) mở trọng lượng mới cho sinh tạo ảnh và video, chỉ nhỉnh hơn Nano Banana 2
  • Cosmos 3 chiếm vị trí hàng đầu trên 8+ bảng xếp hạng mô hình mở, đánh dấu thành tựu lớn sau nhiều tháng phát triển
  • Nemotron 3 Ultra (550B-A55B) là mô hình LLM trọng lượng mở hiệu quả cao mới và được công nhận là SoTA Mỹ hiện tại
  • RTX Spark cũng được công bố tại Computex Taiwan
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Microsoft + NVIDIA hợp tác: chip Grace + Blackwell trong laptop, thách thức 6 năm thống trị của Apple Silicon
  • Microsoft và NVIDIA hợp tác đưa chip Grace + Blackwell vào laptop, nhằm cạnh tranh với Apple Silicon
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
xAI ship model video SOTA trong 3 tháng: chiến lược tài năng + tính toán mạnh mẽ
  • Nhóm nhỏ tại xAI thành công ship model video state-of-the-art chỉ trong 3 tháng
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Flipbook và tương lai sinh giao diện: agents + video generation + trải nghiệm người dùng
  • Ethan He (xAI) tham gia podcast Latent Space thảo luận chi tiết về cách training video world model state-of-the-art
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Podcast Latent Space: Quan điểm về Video Generation, World Models, LLMs, Agents và Tương lai của AI
  • Video models lấy phần lớn trí thông minh từ ngôn ngữ, không phải từ dữ liệu video.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Bài viết đầy đủ về Video Agents
  • Đường dẫn đến bài viết đầy đủ từ Latent Space về video agents, world models, và tương lai của video generation.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Podcast với Ethan He: Video Agents, World Models, và Tương lai của Video Generation
  • Podcast đầu tiên về xAI với Ethan He (cựu world model lead tại xAI, NVIDIA Cosmos researcher) chia sẻ cách huấn luyện SOTA Videogen world model, bao gồm consistent extending, editing, và voice.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Grok Imagine's Video Agent Moment: Cosmos, xAI, World Models, Generative UI & Codex Phase
  • Ethan He giải thích tại sao AI video có thể theo đuổi cùng con đường với coding agents, cách Grok Imagine phát triển từ không có gì đến thành công.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·16 ngày trước
Tại sao mô hình tác nhân video là bước tiếp theo — Ethan He, xAI Grok Imagine
  • Ethan He là nhân vật chính phía sau Grok Imagine tại xAI, được xây dựng trong 3 tháng, mô hình sinh tạo video có chất lượng cao nhất, tốc độ nhanh nhất và hiệu quả chi phí nhất hiện nay với hỗ trợ 720P, chỉnh sửa video và âm thanh tốt hơn
  • Quan điểm cốt lõi: mô hình video lấy trí thông minh chủ yếu từ LLMs chứ không phải từ huấn luyện trên dữ liệu video, biên giới tiếp theo là mô hình thế giới (world models) tương tác, thời gian thực, ngang dài
  • Ngắn hạn, Sora tiếp theo sẽ không phải mô hình video tốt hơn mà là tác nhân video (video agent) — hệ thống có thể lập kế hoạch, tạo sinh, chỉnh sửa, phê bình và lặp lại trên toàn bộ tác vụ sáng tạo
  • Sinh tạo truyền thông có thể theo quy trình tiến hóa của AI coding: từ tập trung vào hiệu suất đầu ra một lần sang mô hình suy luận multiturn cho tác nhân và hệ thống có thể lập kế hoạch, chỉnh sửa, kiểm thử, gỡ lỗi
  • Khi hiệu suất mô hình video tăng đáng kể về tính chân thực, tính nhất quán, tuân thủ prompt và trở nên hiệu quả chi phí hơn, bước tiến hóa tiếp theo có thể là hệ thống có thể lập kế hoạch, tạo sinh, chỉnh sửa, phê bình và lặp lại
  • Grok Imagine Agent Mode (Beta) vừa phát hành với tác nhân sáng tạo đầy đủ trên canvas vô hạn mở, tự động lập kế hoạch, tạo sinh, chỉnh sửa, lặp lại
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Cuộc khảo sát AI Engineering năm 2026 – Có cơ hội trúng thưởng
  • Cuộc khảo sát AI Engineering năm 2026 (ntn.so/ai-survey) đang mở với cơ hội trúng nhiều giải thưởng.
#AI Engineering#Community
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Phản hồi: Video từ Soumith Chintala
  • Liên kết đến video từ Soumith Chintala trên YouTube.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·16 ngày trước
Sự chuyển dịch tâm thế: từ giấc mơ đến hiện thực của agents AI cá nhân
  • Vào tháng 2/2025, Soumith Chintala nêu ước mơ về các agents AI cá nhân, được lưu trữ cục bộ và riêng tư, nhưng hầu hết mọi người không tin.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·17 ngày trước
Nâng cấp thế hệ: từ evals tĩnh sang nền tảng học tập liên tục
  • Mọi startup evals/analytics đều trải qua một nâng cấp thế hệ duy nhất trong năm 2026 - chuyển từ công cụ đánh giá tĩnh sang nền tảng học tập liên tục.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·17 ngày trước
Quản lý công nghệ AI: từ thông báo tới thành thạo, lãnh đạo Nhật Bản được đào tạo
  • Dr. Vivian Balakrishnan (bộ trưởng Singapore) phát biểu rằng 'Không thể quản lý công nghệ mà bạn chỉ được thông báo vắn tắt' - câu nói này trở thành cuộc kêu gọi toàn cầu.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·17 ngày trước
Nguy hiểm của code AI kém chất lượng: Từ vấn đề một lần thành tiên lệ vĩnh viễn
  • Code AI chất lượng kém không chỉ tạo ra vấn đề dọn dẹp một lần - nó trở thành bối cảnh cho các thay đổi tiếp theo và bị agents sao chép, amplify mô hình xấu.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·18 ngày trước
Nhà sáng lập và Kỹ sư Triển khai Forward
  • AIE (AI.engineer) tuyển các Forward Deployed Engineer (FDE) hàng đầu thế giới cho track chuyên biệt mới, tương tự các sáng kiến từ OpenAI DeployCo và Anthropic DeployCo.
  • CFP (Call for Papers) đóng hạn sắp tới — cơ hội tham gia làn sóng tuyển dụng FDE toàn ngành.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·19 ngày trước
Huấn luyện mô hình nhỏ qua mô hình lớn: Xây dựng agent cá nhân toàn năng
  • Sử dụng các mô hình state-of-the-art để huấn luyện các mô hình nhỏ chạy trên máy tính cách thức làm việc cá nhân và quy trình công việc.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·19 ngày trước
Anthropic huy động $65B Series H, phát hành Opus 4.8 và Dynamic Workflows/Ultracode
  • Anthropic công bố Series H với vốn $65B, định giá $900B pre-money, trong đó có $15B từ các hyperscaler như Amazon.
  • Doanh thu run-rate hiện tại đạt $47B (tăng mạnh từ $9B hồi tháng 12), đặt Anthropic tạm thời hàng đầu OpenAI ở hầu hết các chỉ tiêu headline (ngoài compute và non-coding benchmarks).
  • Phát hành model Opus 4.8 mới cùng công cụ Dynamic Workflows và Ultracode cho các developer.
  • Anthropic giữ vị trí công ty phát triển nhanh nhất mọi thời đại, xác nhận con đường vượt qua OpenAI trong các chỉ số tài chính chính.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·19 ngày trước
Hợp tác ACM x AI Engineer: Hướng tới Turing Award cho kỹ sư AI
  • Gặp chủ tịch ACM để thảo luận về hợp tác chiến lược giữa cộng đồng kỹ sư AI và Hiệp hội Máy tính.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·20 ngày trước
Chi tiết kỹ thuật xây dựng Cloud Agent: VMs, Computer Use, Quản lý bộ nhớ
  • Bài viết là một deep dive từ tác giả OpenInspect về các thành phần cần thiết để xây dựng cloud agents tương tự Devin hay Ramp Inspect
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·20 ngày trước
Thời đại Async Agents — Walden Yan (Cognition) & Cole Murray (OpenInspect)
  • Có căng thẳng trung tâm: các agent labs decacorn lớn (Sierra, Decagon, Notion, Cursor) được xây dựng, nhưng cũng không bao giờ dễ dàng hơn tự DIY agents với các framework như LangGraph, Pydantic, Flue và managed agents từ Anthropic/Gemini/Amazon.
  • Sóng công ty xây dựng background agents riêng: Shopify, Stripe, Paradigm, Razorpay, Ramp v.v., cho thấy nhu cầu cao về automation nền tảng.
  • Cognition vừa công bố Series D $1B với định giá $26B, mặc dù sự cạnh tranh nhưng vẫn bị oversubscribe.
  • Enterprise usage Cognition tăng >10x từ đầu năm, run-rate revenue đạt $492M — chứng minh thị trường sẵn sàng cho AI agents chuyên nghiệp.
  • Walden Yan (CPO/Cofounder) nói chuyện với Cole Murray về 'Devin is in the Details', khám phá context engineering và tích hợp async agents trong quy trình real-world.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·20 ngày trước
Tìm kiếm Agentic trong Context Engineering: Ứng dụng và hạn chế
  • Context engineering phụ thuộc khoảng 80% vào agentic search - công cụ tìm kiếm được điều khiển bởi agent
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·20 ngày trước
Cognition huy động $1B với định giá $26B Series D
  • Cognition (lần trước viết tháng 9 năm ngoái với Series C $10B) tăng giá 2.5x lên $26B trong 8 tháng — bây giờ là agent lab independent lớn nhất còn lại trong AI.
  • ARR hiện tại được dự báo vượt $1B trước cuối năm, với disclosures công khai lần đầu tiên cho phép so sánh tăng trưởng với các biểu đồ 'WTF Happened in 2025'.
  • Devin (AI software engineer đầu tiên, phát hành 2 năm trước) là nền tảng chính cho sự tăng trưởng này, chứng minh thị trường các agents coding chuyên biệt khổng lồ.
  • Tăng trưởng revenue Cognition phản ánh sự chuyển từ experimentation sang production trong lĩnh vực AI agents — một trend cốt lõi đang định hình ngành.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·21 ngày trước
ESM: Bài học đắt giá sắp tới cho Protein — Alex Rives, BioHub
  • Alex Rives (Giám đốc Khoa học BioHub, người dẫn đầu EvoScale vừa được CZI mua lại) công bố ESMFold2 — engine khoa học mở cho dự đoán, thiết kế và khám phá protein biology.
  • ESMFold2 đạt hiệu suất state-of-the-art trên protein interactions, đặc biệt antibodies (chìa khóa cho therapeutics), xây dựng trên dữ liệu Cryo-EM.
  • Bằng chứng inference time scaling hoạt động trên 5 targets trong cancer và immunology — cho thấy kỹ thuật scaling mới vượt ra ngoài training.
  • ESM-1 được huấn luyện trên hàng triệu protein sequences từ toàn bộ sự sống với mục tiêu 'next token' đơn giản (dự đoán amino acids bị mask), nhưng mô hình tự học cấu trúc/chức năng sinh học không được hiển thị tường minh.
  • Khả năng này scales dự đoán được với compute, dẫn tới ESM2 và ESM3 — minh chứng cho 'bitter lesson' rằng scaling + self-supervised learning đánh bại hand-crafted priors trong biology.
swyx (Shawn Wang)
swyx (Shawn Wang)XBài đăng·21 ngày trước
Tham dự sự kiện AI Engineer World's Fair
  • Bài đăng ngắn biểu lộ sự hứng thú và mong chờ tham dự sự kiện AI Engineer World's Fair
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·21 ngày trước
[AINews] Những decacorn hạ tầng AI mới: Fireworks, Baseten (với OpenRouter sắp tới)
  • Fireworks huy động $15B round (in talks), tăng 3.75x trong 7 tháng; Baseten huy động $11B (is raising), tăng 2.2x trong 3 tháng — cả hai vươn tới decacorn status.
  • OpenRouter công bố Series B $113M (tăng 5x volume trong 6 tháng) — weekly volume tăng từ 5T lên 25T tokens, phản ánh chuyển từ experimentation sang production.
  • Nếu xây dựng multimodel inference, bạn cần router — OpenRouter, Fireworks, Baseten đều cạnh tranh để trở thành lớp abstraction chính.
  • Xu hướng 'Inference Inflection' (highlight tháng 4) tiếp tục — tốc độ startups từ unicorn → decacorn tăng nhanh, cùng với việc AI shift sang production-grade infrastructure.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·25 ngày trước
Tất Cả Phòng Thí Nghiệm Mô Hình Giờ Là Phòng Thí Nghiệm Agent
  • Trước cuộc IPO tiềm năng của OpenAI, nhà lãnh đạo ngành nhận xét rằng Model Labs đang xây dựng Agents làm sản phẩm chính
  • Tất cả các công ty mô hình lớn đều chuyển hướng phát triển sang agent-centric products thay vì chỉ tập trung vào cải thiện mô hình cơ bản
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·26 ngày trước
Những Startup Hạ Tầng AI Mới: Exa, Modal, TurboPuffer
  • Ba startup hạ tầng AI mới — Exa, Modal, và TurboPuffer — đang được định giá ở mức unicorn và phát triển mạnh mẽ
  • Sự tăng trưởng được thúc đẩy bởi nhu cầu hạ tầng ngày càng tăng cho các ứng dụng AI và agents
  • Khảo sát AI Engineering 2026 cung cấp > $2k credits và vé tham dự AIE Worldcon cho những người tham gia
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·27 ngày trước
Trao Quyền Truy Cập Máy Tính Cho Agents
  • Các công ty như Perplexity, Manus, và Cursor đã phát hành tính năng cho phép agents có quyền truy cập và kiểm soát máy tính
  • Phía research, các evals như TerminalBench, GDPVal, và Harbor cũng giả định agents có khả năng tương tác với máy tính
  • Ivan Burazin (Daytona) có obsession 10+ năm với việc kết thúc thời đại 'localhost' — agents không thể tạm dừng workflow giữa chừng trên máy local
  • Agents không thể bị đóng máy vì chúng phải tiếp tục chạy liên tục; compute cũng không thể giới hạn ở local
  • Daytona là một trong những AI infrastructure companies đang phát triển mạnh nhất nhờ xu hướng này, với LLM OS stack trở thành toolkit chuẩn
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·27 ngày trước
OpenAI GPT-next Chứng Minh Bài Toán Khoảng Cách Đơn Vị Phẳng Erdős 80 Năm
  • OpenAI đã công bố kết quả toán học lịch sử: chứng minh được bài toán 'planar unit distance problem' mở 80 năm (Erdős conjecture)
  • Chứng minh được thực hiện với chi phí < $1000, sử dụng GPT 5.6 (suy đoán) chạy trong < 32 giờ
  • Khác với AlphaProof hay Lean-style dedicated models, đây là LLM general-purpose không được fine-tune riêng, lạc quan hóa rằng reasoning capabilities sẽ tổng quát hóa vượt quá toán học
  • Kết quả cho thấy extended reasoning của LLM đã đủ mạnh để giải quyết các bài toán mở lâu đời trong hình học rời rạc
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·27 ngày trước
Railway: Nền Tảng Đám Mây Hướng Tới Agents
  • Railway được thành lập năm 2020 bởi Jake Cooper (cựu Bloomberg, Uber) với obsession: giảm activation energy deploy code tới production gần bằng 0 — push code, nhận URL, iterate
  • 18 tháng đầu, Railway tự tay tìm kiếm 100 users, với Jake chào đón mỗi signup Discord trên monitor thứ hai
  • Railway cung cấp deployment zero-config không cần Docker, Kubernetes manifests, hay Ansible scripts — phi thường đơn giản
  • Mặc dù không bắt đầu như AI infrastructure company, Railway tìm thấy product-market fit mạnh qua agent use cases
  • Nền tảng giải quyết vấn đề cốt lõi cho agents: giảm friction deploy, cho phép agents chạy liên tục trên cloud
  • Gây ra outage lớn ngày 19/5 trên GCP nhưng đã giải quyết hoàn toàn; post-mortem chi tiết đã được công bố
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·28 ngày trước
Google I/O 2026: Gemini 3.5 Flash, Omni (NanoBanana cho Video), Spark (background agents), và Antigravity 2.0
  • Google công bố Gemini 3.5 Flash chính thức (GA) hôm nay, được quảng cáo là bước tiến so với Gemini 3.1 Pro, trong khi Gemini 3.5 Pro sẽ ra mắt tháng sau.
  • Omni là tính năng xử lý video mới (NanoBanana), cùng với Gemini Live (voice) và Google Pics/Flow (images/VFX/music), thể hiện khả năng đa phương tiện dẫn đầu ngành với độ trễ cực thấp.
  • Những tính năng này được hỗ trợ bởi phần cứng và mô hình hàng đầu ngành của Google, cho phép xử lý nhanh và chất lượng cao.
  • Google cũng trình diễn công nghệ kính thông minh mới, có vẻ thực tế và khả thi hơn nhiều phiên bản trước từ Google và các đối thủ cạnh tranh.
  • Verge đã cắt ngắn bài phát biểu chính 2 giờ xuống 30 phút để giúp người xem nắm bắt nội dung chính một cách dễ dàng.
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·29 ngày trước
[AINews] Cách được nhận vào một phòng lab tuyến đầu (về Huấn luyện trước)
  • Tuần này diễn ra Google I/O với các phiên bản Gemini mới được dự kiến phát hành; Anthropic và OpenAI cũng có những tin tức nhỏ
  • Cursor vừa phát hành SpaceXAI model đầu tiên với chi tiết về dữ liệu tổng hợp, reward hacking và continued pretraining sử dụng Muon
  • Vlad Feinberg (chuyên gia Google/TPU) đã viết hướng dẫn chuẩn bị xin việc tại frontier lab, tập trung vào Pretraining
  • Hướng dẫn này được coi là bài viết đáng chú ý nhất hôm nay về chuẩn bị sự nghiệp trong lĩnh vực LLM
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·30 ngày trước
Công nghệ drone tự động hóa và kinh tế học của drone
  • Tập podcast với Yaroslav Azhnyuk, người sáng lập The Fourth Law, một trong những công ty drone hướng dẫn bằng AI tiên tiến nhất thế giới
  • Thảo luận công nghệ drone hiện đại: FPV drone là 'thần chiến tranh' mới, so sánh fiber optic vs AI, 5 mức độ tự động hóa, 8 chiều của chiến trường tự động hóa
  • Phân tích chiến tranh Ukraine cho thấy phương Tây vẫn lên kế hoạch theo mô hình cũ, trong khi công nghệ drone đã phát triển vượt xa
  • Ưu thế sản xuất Trung Quốc, cuộc đua drone quốc tế, tình trạng sẵn sàng phòng thủ phương Tây, biện pháp đối phó, và lý do khoảng cách kỹ thuật đang mở rộng
  • Noah Smith (Noahpinion) cung cấp bình luận chuyên sâu, đặc biệt từ phút 51:31
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·khoảng 1 tháng trước
IPO $60 tỷ của Cerebras: Từ từ, rồi một lúc
  • Cerebras hoàn thành IPO với giá cổ phiếu $280, vốn hóa $60 tỷ, xác nhận xu hướng 'Big Chip' và tính khả thi của chip AI chuyên dụng
  • Diễn ra sau rút đơn S-1 trước đó, partnership 750MW sáng tạo, và thỏa thuận $10-$20 tỷ với OpenAI (OpenAI chi hơn $20 tỷ)
  • Hỗ trợ xu hướng 'Inference Inflection', chỉ 6 tháng sau khi NVIDIA mua Groq với giá $20 tỷ
  • Định giá này phản ánh sự tự tin thị trường vào inference computing và chip tùy chỉnh
  • Tăng trưởng của Cerebras từ một startup tới IPO $60 tỷ được coi là bước ngoặt lớn cho ngành chip AI
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·khoảng 1 tháng trước
Mọi thứ đều là Conductor
  • Sử dụng ẩn dụ từ sinh học tiến hóa: 'Mọi thứ đều là Cua' - dạng cua đã tiến hóa độc lập ít nhất 7 lần trên Trái đất
  • Carcinisation cho thấy các cơ thể khác nhau có thể hội tụ về cùng một cấu trúc hiệu quả
  • Gợi ý khái niệm tương tự áp dụng cho AI: 'Conductor' có thể là mô hình tiêu chuẩn mà AI đang hội tụ tới
  • Quảng cáo các sự kiện AIE Melbourne và AIE World's Fair với ưu đãi đặc biệt
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·khoảng 1 tháng trước
Chăm sóc sức khỏe hỗ trợ bởi AI: 100 triệu lần khám bác sĩ, tiết kiệm 10-20 giờ, xác minh bảo hiểm trong vài phút
  • Abridge thành lập năm 2018, trước khi ChatGPT ra mắt công khai (30/11/2022), không phải 'wrapper GPT' mà là nền tảng xây dựng độc lập
  • Chuyên về cuộc trò chuyện giữa bệnh nhân và bác sĩ lâm sàng - một quy trình công việc quan trọng nhất và có ngữ cảnh cao trong chăm sóc sức khỏe
  • Đã xử lý 100 triệu lần khám bác sĩ, tiết kiệm 10-20 giờ làm việc cho các chuyên gia y tế
  • Xử lý Prior Auth (xác minh yêu cầu bảo hiểm) chỉ trong vài phút, giảm đáng kể bộ máy hành chính phức tạp
  • Xây dựng lòng tin trong y tế thông qua năm tập trung vào độ chính xác, bảo mật, tuân thủ quy định - khác biệt với các ứng dụng AI chung chung
swyx (Shawn Wang)
swyx (Shawn Wang)BlogBài viết·khoảng 1 tháng trước
Codex tăng mức độ ưa chuộng, Anthropic công bố định giá sử dụng lập trình
  • Thị trường AI chia thành hai xu hướng: nhà đầu tư ủng hộ Anthropic trước IPO dự kiến tháng 10, kỹ sư ủng hộ Codex
  • GPT 5.5 được đánh giá cao là model mạnh mẽ, trong một số trường hợp đạt mức 'Mythos-tier'
  • Codex nhận sự ủng hộ ngày càng tăng từ kỹ sư AI, đặc biệt sau phát hành 'Codex for Everything Else'
  • Anthropic cung cấp giới hạn sử dụng hào phóng hơn, tạo sức hấp dẫn mạnh mẽ so với đối thủ
  • CFO Anthropic công bố tăng trưởng 10x mỗi năm, hỗ trợ kỳ vọng IPO của công ty