Dòng tin

8 nội dung mới nhất

Bản tin hôm nay

Thứ Bảy 13 Th6, 2026 · 294 nội dung

Điều Quan Trọng Nhất Hôm Nay

›Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.

Mới hôm nay

AK (_akhaliq)XBài đăng·khoảng 14 giờ trướcMới

›MiniMax M3 từ MiniMax_AI được phát hành trên Hugging Face với mã nguồn mở hoàn toàn

Trước đó

AK (_akhaliq)XBài đăng·1 ngày trước

›Tiêu đề ám chỉ một đánh giá hoặc bài kiểm tra liên quan đến các hệ thống agent AI

AK (_akhaliq)XBài đăng·1 ngày trước

›Arbor là hệ thống nghiên cứu tự động (autonomous research) được phát triển nhằm làm cho nghiên cứu tự động trở nên thiết thực, tái sử dụng được và có tính tổng quát hơn

AK (_akhaliq)XBài đăng·1 ngày trước

›Arbor là một autonomous research agent tổng quát sử dụng persistent hypothesis-tree refinement

AK (_akhaliq)HF PapersPaper·2 ngày trước

›Suy luận không gian (xác định vị trí, mối quan hệ, chuyển động của vật trong 3D) là thách thức cơ bản cho Vision-Language Models (VLM).
›Các agent được tăng cường bằng công cụ (tool-augmented) cố gắng giải quyết vấn đề bằng cách thêm perception modules, nhưng hiệu suất bị giới hạn bởi action interface.
›Các phương pháp hiện tại: single-pass code execution (cam kết chiến lược trước khi thấy kết quả trung gian) hoặc structured tool-call interface (giới hạn linh hoạt), cả hai đều không đủ cho suy luận 3D/4D phức tạp.
›SpatialClaw là framework training-free dùng code làm action interface: VLM-backed agent viết một cell code mỗi bước dựa trên tất cả output trước, cho phép linh hoạt soạn và thao tác kết quả perception, thích ứng với quan sát text/visual và nhu cầu từng bài toán.
›Đánh giá trên 20 spatial reasoning benchmarks (static và dynamic 3D/4D): đạt 59.9% accuracy trung bình, vượt agent gần đây +11.2 điểm, có lợi ích nhất quán trên 6 VLM backbone từ 2 model families mà không cần tuning riêng theo benchmark hay model.

Hugging FaceBlogBài viết·4 ngày trước

›Một tác nhân AI được sử dụng để xây dựng và quản lý một phòng triển lãm ảo 3D của Paris
›Kỹ thuật 'chaining' (kết nối tiếp tục) hai Hugging Face Spaces để tạo ra một trải nghiệm phức tạp
›Thể hiện khả năng tích hợp nhiều thành phần để giải quyết các tác vụ sáng tạo

AnthropicXBài đăng·4 ngày trước

›Bài blog khoa học của Anthropic khám phá sự khác biệt trong tốc độ phát triển AI giữa lập trình và sinh học.

Hugging FaceBlogBài viết·5 ngày trước

›OpenEnv nhận được sự ủng hộ mạnh mẽ từ cộng đồng phát triển mã nguồn mở
›Nền tảng tập trung vào Reinforcement Learning (học tăng cường) dành cho huấn luyện agent AI
›Cung cấp môi trường mô phỏng để phát triển và kiểm thử agent tương tác