Dòng tin
Tất cả
Tổng quan trực quan về các tiến bộ gần đây trong kiến trúc LLM
New article: a visual tour of recent LLM architecture advances, from Gemma 4 to DeepSeek V4.
I focus on long-context efficiency tweaks like KV sharing, per-layer embeddings, layer-wise attention budgets, compressed attention, and mHC.
Link: https://magazine.sebastianraschka.com/p/recent-developments-in-llm-architectures
- ›Bài viết của Sebastian Raschka trình bày các tiến bộ kiến trúc LLM gần đây từ Gemma 4 đến DeepSeek V4 qua hình ảnh minh họa.