Dòng tin

2 nội dung mới nhất

Tất cả

DAIR.AIXBài đăng·1 ngày trước

Đường biên hiệu quả: GPT-5.6 sẽ đứng ở đâu?

RT by @dair_ai: The efficiency frontier! Where do you think GPT-5.6 will land?

›Claude Opus 4.8 đạt 58% Pass@1 trên DeepSWE Bench, xếp thứ 2 sau GPT-5.5.

#LLM #Benchmark #Hiệu quả tính toán

Sebastian RaschkaBlogBài viết·16 ngày trước

Những phát triển gần đây trong kiến trúc LLM: KV Sharing, mHC và Compressed Attention

Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention

›Các kiến trúc LLM mới tập trung vào hiệu quả xử lý bối cảnh dài thông qua KV sharing, per-layer embeddings và compressed attention.
›KV-cache size, memory traffic và attention cost trở thành những ràng buộc chính khi agent workflows giữ lại nhiều token.
›Gemma 4, Laguna XS.2, ZAYA1-8B và DeepSeek V4 áp dụng các kỹ thuật kiến trúc này để giảm chi phí tính toán.

#LLM #Kiến trúc mô hình #Attention mechanism #Hiệu quả tính toán

Bản tin hôm nay

Thứ Hai 1 Th6, 2026 · 408 nội dung

Điều Quan Trọng Nhất Hôm Nay

›Tuần này ghi nhận bước ngoặt lớn: Claude Opus 4.8 ra mắt với cải thiện đáng kể về độ tin cậy, Anthropic hoàn tất vòng huy động $65 tỷ USD - vòng tư nhân lớn gấp đôi bất kỳ IPO nào trong lịch sử, và Google liên tiếp công bố Gemini 3.5 Flash cùng Project Genie biến đổi không gian thực thành thế giới tương tác 3D.

Claude & Anthropic: Tiền Bạc Và Hiệu Suất

›Claude Opus 4.8 - Cải Tiến Mục Đích
›Phiên bản mới chứng minh hiệu suất xử lý logic vượt trội hơn 4 lần khi xử lý code, kém lỗi hơn và ít tự tin không có căn cứ. Hỗ trợ mid-conversation system messages để cập nhật hướng dẫn giữa cuộc hội thoại dài mà không mất cache prompt — bước tiến quan trọng cho agent dài hạn.

Gemini & Google: Ứng Dụng Thực Tế Lên Đầu Tiên

›Gemini 3.5 Flash — Tốc Độ 4× Với Giá Rẻ Hơn
›Nhanh hơn 4 lần các mô hình frontier khác (800 tokens/sec trên Antigravity), chi phí ít hơn nửa giá competitors. Vượt Gemini 3.1 Pro trên lập trình và tác vụ agentic. Google tăng gấp 3 rate limits cho tất cả tiers.

Chủ đề đang nổi

1#LLM84 2#AI17 3#Gemini17 4#Agent16 5#Anthropic13 6#Kiến trúc mô hình12 7#Thị giác máy tính11 8#Benchmark9