Dòng tin

8 nội dung mới nhất
Bản tin hôm nay

Thứ Bảy 13 Th6, 2026 · 294 nội dung
Điều Quan Trọng Nhất Hôm Nay
  • Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.
Mới hôm nay
AK (_akhaliq)
AK (_akhaliq)XBài đăng·khoảng 14 giờ trướcMới
MiniMax M3: Mô Hình Mã Mở 428 Tỷ Tham Số Dành Cho Thời Đại Agent
  • MiniMax M3 từ MiniMax_AI được phát hành trên Hugging Face với mã nguồn mở hoàn toàn
Trước đó
AK (_akhaliq)
AK (_akhaliq)XBài đăng·1 ngày trước
Kỳ thi cuối cùng của các Agent
  • Tiêu đề ám chỉ một đánh giá hoặc bài kiểm tra liên quan đến các hệ thống agent AI
AK (_akhaliq)
AK (_akhaliq)XBài đăng·1 ngày trước
Arbor: Nâng cao khả năng nghiên cứu tự động bằng cách cải tiến cây giả thuyết
  • Arbor là hệ thống nghiên cứu tự động (autonomous research) được phát triển nhằm làm cho nghiên cứu tự động trở nên thiết thực, tái sử dụng được và có tính tổng quát hơn
AK (_akhaliq)
AK (_akhaliq)XBài đăng·1 ngày trước
Microsoft Research giới thiệu Arbor - Agent tự động suy luận
  • Arbor là một autonomous research agent tổng quát sử dụng persistent hypothesis-tree refinement
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·2 ngày trước
SpatialClaw: Thiết kế lại giao diện hành động cho agent suy luận không gian
  • Suy luận không gian (xác định vị trí, mối quan hệ, chuyển động của vật trong 3D) là thách thức cơ bản cho Vision-Language Models (VLM).
  • Các agent được tăng cường bằng công cụ (tool-augmented) cố gắng giải quyết vấn đề bằng cách thêm perception modules, nhưng hiệu suất bị giới hạn bởi action interface.
  • Các phương pháp hiện tại: single-pass code execution (cam kết chiến lược trước khi thấy kết quả trung gian) hoặc structured tool-call interface (giới hạn linh hoạt), cả hai đều không đủ cho suy luận 3D/4D phức tạp.
  • SpatialClaw là framework training-free dùng code làm action interface: VLM-backed agent viết một cell code mỗi bước dựa trên tất cả output trước, cho phép linh hoạt soạn và thao tác kết quả perception, thích ứng với quan sát text/visual và nhu cầu từng bài toán.
  • Đánh giá trên 20 spatial reasoning benchmarks (static và dynamic 3D/4D): đạt 59.9% accuracy trung bình, vượt agent gần đây +11.2 điểm, có lợi ích nhất quán trên 6 VLM backbone từ 2 model families mà không cần tuning riêng theo benchmark hay model.
Hugging Face
Hugging FaceBlogBài viết·4 ngày trước
Tác Nhân AI Xây Dựng Phòng Triển Lãm 3D Paris Bằng Cách Kết Nối Hai Không Gian Hugging Face
  • Một tác nhân AI được sử dụng để xây dựng và quản lý một phòng triển lãm ảo 3D của Paris
  • Kỹ thuật 'chaining' (kết nối tiếp tục) hai Hugging Face Spaces để tạo ra một trải nghiệm phức tạp
  • Thể hiện khả năng tích hợp nhiều thành phần để giải quyết các tác vụ sáng tạo
Anthropic
AnthropicXBài đăng·4 ngày trước
Tại sao AI phát triển nhanh hơn trong lập trình so với sinh học?
  • Bài blog khoa học của Anthropic khám phá sự khác biệt trong tốc độ phát triển AI giữa lập trình và sinh học.
Hugging Face
Hugging FaceBlogBài viết·5 ngày trước
Cộng Đồng Mã Nguồn Mở Ủng Hộ OpenEnv cho Học Tăng Cường Agent
  • OpenEnv nhận được sự ủng hộ mạnh mẽ từ cộng đồng phát triển mã nguồn mở
  • Nền tảng tập trung vào Reinforcement Learning (học tăng cường) dành cho huấn luyện agent AI
  • Cung cấp môi trường mô phỏng để phát triển và kiểm thử agent tương tác