Dòng tin

2 nội dung mới nhất
Tất cả
Sebastian Raschka
Sebastian RaschkaXBài đăng·khoảng 1 tháng trước
Tháng Tư: mùa phát hành LLM mạnh mẽ với Gemma 4, GLM-5.1, Qwen 3.6, Kimi K2.6, DeepSeek V4
April was a pretty strong month for LLM releases: - Gemma 4 - GLM-5.1 - Qwen3.6 - Kimi K2.6 - DeepSeek V4 All are now added to the LLM Architecture Gallery. More details once I am fully back in May!
  • Tháng Tư phát hành 5 mô hình LLM quan trọng: Gemma 4, GLM-5.1, Qwen 3.6, Kimi K2.6, DeepSeek V4.
Sebastian Raschka
Sebastian RaschkaXBài đăng·khoảng 2 tháng trước
GLM-5.1: Mô hình mã nguồn mở hàng đầu với kiến trúc DeepSeek V3.2 được cải tiến
Strong release! GLM-5.1 is a DeepSeek-V3.2-like architecture (including MLA and DeepSeek Sparse Attention) but with more layers. And the benchmarks look better throughout! Looks like THE flagship open-weight model now.
  • GLM-5.1 sử dụng kiến trúc tương tự DeepSeek V3.2 với MLA và DeepSeek Sparse Attention.