Dòng tin
Bản tin hôm nay
Ngày hôm nay, cộng đồng AI đối mặt với ba sự kiện then chốt: chính phủ Mỹ cấm Mythos/Fab…
Thứ Hai 15 Th6, 2026 · 98 nội dung
Tương lai bị kiểm soát bởi tính toán
- ›Mô hình Mythos-class yêu cầu điện năng và chip siêu lớn đến nỗi chỉ chính phủ có thể phát hiện được. Điều này có nghĩa kiểm soát biên giới (frontier models) không phải là bất khả—nó chỉ đòi hỏi khả năng giám sát tính toán lớn quy mô. Ethan Mollick
AI mã nguồn mở thắng thế về tính thực tế
- ›Rio 3.5 Open 397B (phát triển bởi công ty IT thành phố Rio de Janeiro) vừa vượt qua Qwen 3.7, thể hiện sự chuyển dịch từ mô hình độc quyền sang mở. Gemma 4 12B đạt 4 triệu lượt tải trên HuggingFace—một mô hình nhỏ gọn chạy được trên laptop nhưng hỗ trợ suy luận đa bước. Clement Delangue
Mô hình nhỏ không phải lựa chọn bị buộc
- ›Giả định dùng mô hình nhỏ cho công việc ít quan trọng là sai. Những bộ phận tổ chức yếu khả năng có thể hưởng lợi lớn nhất từ mô hình AI thông minh, vì chi phí giảm có thể bù đắp chi phí con người cao hơn. Ethan Mollick
Hội đồng mô hình thắng đơn mô hình
- ›OpenRouter Fusion API đạt thông minh ngang Fable nhưng chỉ với nửa chi phí bằng cách kết hợp nhiều mô hình. Tương lai không phải về một mô hình tối cao, mà về việc biết cách kết hợp các điểm mạnh riêng biệt. swyx
Ranh giới chính sách AI không rõ ràng
- ›Lệnh cấm Mythos/Fable phát sinh từ khác biệt giữa Anthropic và chính phủ Mỹ. Một số người cho rằng Anthropic tự gặt những gì họ gieo (khi trước đó nhấn mạnh rủi ro), trong khi những người khác cảnh báo rằng Tây phương sắp bị cô lập nếu tiếp tục hạn chế AI mã nguồn mở. Yann LeCun
Không có tất yếu—chỉ có lựa chọn
- ›Tương lai AI không được định trước. Mỗi người có quyền lựa chọn: khu vườn bảo vệ của ít người (Silicon Valley), hay AI mã nguồn mở nơi mọi tổ chức—kể cả thành phố—có thể xây dựng. Clement Delangue
Tất cả
HYDRA-X: Các Mô Hình Đa Phương Thức Thống Nhất Gốc với Tokenizer Thị Giác Toàn Diện
- ›HYDRA-X là mô hình đa phương thức thống nhất (UMM) đầu tiên hợp nhất tokenization ảnh và video trong một Vision Transformer (ViT) duy nhất
- ›Giải quyết hai thách thức chính: tiêm hiệu quả khả năng tái cấu trúc không-thời gian vào ViT gốc và nhúng nhận thức ngữ nghĩa cấp ảnh/video vào không gian tiềm ẩn
- ›Phát hiện rằng frame-level causal temporal attention đủ cho tái cấu trúc hình ảnh, còn full spatiotemporal attention làm giảm chất lượng; nén thời gian phân cấp vượt trội so với thay thế một bước
- ›Đề xuất lightweight decompressor có giám sát chung ảnh-video để thực thi cấu trúc ngữ nghĩa bổ sung trong không gian tiềm ẩn compact
- ›Cải thiện đường ống chỉnh sửa: tương tác nguồn-mục tiêu tại cấp tiềm ẩn bên trong tokenizer thay vì cấp ngữ nghĩa bên trong LLM
- ›HYDRA-X (mô hình 7B) đạt hiệu suất mạnh trên các tác vụ hiểu và tạo ảnh/video, mở đường cho các UMM thứ hàng với tokenizer thống nhất
Tuyến tính hóa Vision Transformer bằng Test-Time Training
- ›Sử dụng Test-Time Training (TTT) như linear-complexity architecture có structure aligned với Softmax attention, giải quyết representational gap.
- ›Thêm key instance normalization và locality enhancement module để align representational properties như shift-invariance và locality.
- ›Linearize Stable Diffusion 3.5 thành SD3.5-T^5 với fine-tuning chỉ 1 giờ trên 4 H20 GPUs.
- ›Đạt comparable text-to-image quality với speedup 1.32x-1.47x tại 1K-2K resolutions, giảm complexity từ quadratic xuống linear.