Điều Quan Trọng Nhất
Hôm nay là ngày bước ngoặt: Google I/O 2026 công bố Gemini 3.5 Flash GA (vượt xa Gemini 3.1 Pro), cùng Omni (video generation tối ưu) và Spark Agents — trong khi Anthropic vừa đóng Series H $65B, định giá $900B, với doanh thu run-rate tăng gấp 5x lên $47B. Thị trường AI đang chuyển từ thử nghiệm sang production, từ mô hình sang agents, và từ ngôn ngữ sang hành động.
Google I/O 2026: Trio Sản Phẩm Chính
Gemini 3.5 Flash & Omni
Gemini 3.5 Flash công bố GA hôm nay — bước tiến lớn so với 3.1 Pro; Omni (gọi là "NanoBanana cho Video") cho phép chỉnh sửa video/ảnh bằng hội thoại tự nhiên, giữ nhất quán nhân vật và vật lý. Cả hai đều tối ưu hóa chi phí-hiệu suất tốt nhất trong ngành. https://www.latent.space/p/ainews-google-io-2026-gemini-35-flash
Spark Agents & Antigravity 2.0
Google giới thiệu Spark — background agents tự động cho tác vụ hàng ngày (quản lý email, lịch, công việc trực tuyến). Antigravity 2.0 cập nhật VFX/creative tools; hạn ngạch hàng tuần tăng gấp 3 lần. https://nitter.net/OfficialLoganK/status/2057912550633947436
NVIDIA: Từ 1000 Repos Đến 550B Models
NVIDIA vượt quá 1.000 kho lưu trữ công khai (820 mô hình, 249 bộ dữ liệu) trên Hugging Face; LocateAnything trending #1. Cosmos 3 (world models omnimodal) và Nemotron 3 Ultra (550B-A55B) chứng tỏ cam kết dài hạn với open-source AI; mô hình nhỏ gọn vẫn đạt hiệu suất frontier-level, nhanh gấp 5 lần, rẻ hơn 30%. https://nitter.net/NVIDIAAI/status/2061310473874858453
Anthropic: Từ $65B Funding Đến Dynamic Workflows
Anthropic huy động Series H $65B, định giá $900B pre-money — doanh thu tăng từ $9B (tháng 12) lên $47B (hôm nay). Phát hành Claude Opus 4.8, Dynamic Workflows, và Ultracode — agents với khả năng lập kế hoạch động, chỉnh sửa code thực tế, và chạy liên tục. https://www.latent.space/p/ainews-anthropic-raises-965b-series
Agents Đang Thống Trị: Cognition $1B Series D
Cognition huy động $1B với định giá $26B Series D (tăng 2.5x trong 8 tháng) — ARR dự báo vượt $1B trước cuối năm. Devin (AI software engineer) chứng minh thị trường agents coding khổng lồ; sự tăng trưởng này phản ánh chuyển từ thử nghiệm sang production-grade agents. https://www.latent.space/p/ainews-cognition-raises-1b-in-26b
Perplexity: Agents Với "Search as Code"
Perplexity chuyển từ function calling sang "Search as Code" — agents viết Python để gọi trực tiếp stack tìm kiếm thay vì lặp tool calls. Đồng thời mở mã Bumblebee (security scanner cho lập trình viên) và Unigram tokenizer (giảm CPU 5-6 lần). Perplexity Computer tiết kiệm 120 giờ làm việc cho một dự án 12 tuần. https://nitter.net/AravSrinivas/status/2061575845056278971
Robotics & Physical AI: Từ Lý Thuyết Sang Hành Động
Boston Dynamics Spot
Boston Dynamics trang bị Spot (robot 4 chân) với Gemini Robotics từ Google DeepMind — chuyển từ tuân lệnh cứng sang suy luận độc lập. Spot tự diễn giải môi trường, quyết định retry, phát hiện lỗi — embodied reasoning thực sự. https://nitter.net/rowancheung/status/2046245892328743221
MIT Artificial Muscles
MIT phát triển cơ nhân tạo dùng sợi điện — không cần motor hay pin, chỉ cần trường điện. Đủ mạnh nâng tạ, đủ nhẹ để bắt tay con người. Ứng dụng: giả chi, ngoài khung xương, robot công nghiệp. https://nitter.net/rowancheung/status/2046970416942690479
Code Agents Tăng Năng Suất (Nhưng Cần Audit)
Coding agents tăng lượng code sinh ra 7-17x (từ Copilot lên agents), nhưng releases thực tế chỉ tăng 30% do bottleneck con người. Ethan Mollick thử Claude Opus viết 3000 dòng HVM5 trong 5 giờ — nhưng phải dành 15 giờ audit vì không thể tin tưởng 100%. Bài học: AI cần hỏi khi bị kẹt, không phải tự động hoàn toàn. https://nitter.net/emollick/status/2061659432233161023
Model Convergence: Tools Quan Trọng Hơn Models
Opus 4.8 không cải tiến đáng kể so với GPT 5.5 — ngành đã bước vào giai đoạn iPhone. Thay đổi thực sự không phải mô hình cơ bản mà công cụ xung quanh: Claude Code với dynamic workflows, Codex desktop thay đổi trò chơi. Trong 6 tháng tới, người dùng không quan tâm mô hình nào — AI trở thành công cụ thay thế. https://nitter.net/mreflow/status/2060738333161267439
Inference Inflection: Decacorns Hạ Tầng
Fireworks ($15B), Baseten ($11B), OpenRouter (Series B $113M) vươn tới decacorn status — weekly token volume tăng từ 5T lên 25T trong 6 tháng. Nếu xây multimodel inference, bạn cần router. Inference computing thành xu hướng, chi phí suy diễn giảm 15-20 lần so với training. https://www.latent.space/p/ainews-new-ai-infra-decacorns-fireworks
Video Agents: Bước Tiếp Theo Của Sinh Tạo Truyền Thông
Grok Imagine (xAI) chứng minh mô hình video lấy trí thông minh chủ yếu từ LLMs chứ không phải scaling video data. Biên giới tiếp theo: video agent models — hệ thống có thể lập kế hoạch, tạo sinh, chỉnh sửa, phê bình và lặp lại. Grok Imagine Agent Mode vừa phát hành canvas vô hạn với tác nhân sáng tạo đầy đủ. https://www.latent.space/p/video-agents
Bioscience & Research: ESMFold2 & MirrorCode
Protein Folding
ESMFold2 (BioHub) đạt SOTA dự đoán protein interactions, xây dựng trên scaling + self-supervised learning (không hand-crafted priors). Chứng minh "bitter lesson" biology: scaling đánh bại domain expertise. https://www.latent.space/p/esmfold2
Software Reverse Engineering
MirrorCode benchmark đánh giá khả năng AI reverse-engineer code từ execute-only access. Claude Opus 4.6 tái triển khai gotree (16K dòng Go) — ước tính 2-17 tuần cho kỹ sư con người. https://importai.substack.com/p/import-ai-453-breaking-ai-agents
Policy & Alignment: Anthropic Thành Lập Team AI & Pháp Quyền
Anthropic thành lập team chuyên biệt về AI và vấn đề luật pháp/nhà nước pháp quyền — công bố vị trí tuyển dụng đầu tiên. Thảo luận: AI sẽ ảnh hưởng như thế nào đến quyền hành pháp, tòa án, bầu cử? https://nitter.net/mattbotvinick/status/2061429461103395276
Open Source Models: MiniMax-M3 & Bernini
MiniMax-M3 sắp tới trên open-weight — kết hợp 3 khả năng frontier: coding, agentic, multimodal. ByteDance phát hành Bernini (text-to-video) sánh ngang Nano Banana 2. Sự bùng nổ open-source mô hình: 1 trong 3 đội AI chạy open-weights (tháng 4), tăng từ 1 trong 5 cách đây 9 tháng. https://nitter.net/RyanLeeMiniMax/status/2061267406761476500
Bài Học Cho Người Học
- Agents > Models: Công cụ xung quanh (Claude Code, workflows, harnesses) quan trọng hơn cải tiến mô hình cơ bản 0.1%.
- Productivity là Thực: 75% doanh nghiệp có lợi nhuận dương từ AI; 46% lãnh đạo dùng AI hàng ngày — không còn thời gian thử nghiệm.
- Review Vẫn Cần: AI sinh code nhanh, nhưng audit vẫn tốn 3x thời gian. Đặt câu hỏi tốt quan trọng hơn tự động hóa đơn phương.
- Inference > Training: Sau 80 năm scaling compute cho training, giờ là thời đại inference — cost giảm, độ trễ tối ưu, models tối ưu chi phí.
- Open Source Đang Lên: Không chỉ tính toán mà kinh tế AI đang chuyển từ "chỉ frontier models" sang "bất kỳ mô hình nào với đúng tool stack".