Dòng tin
Tất cả
Talkie: Mô hình 13B huấn luyện trên text trước 1931 để hiểu Generalization của LM
RT by @karpathy: New work with @AlecRad and @DavidDuvenaud:
Have you ever dreamed of talking to someone from the past? Introducing talkie, a 13B model trained only on pre-1931 text.
Vintage models should help us to understand how LMs generalize (e.g., can we teach talkie to code?). Thread:
- ›Talkie là mô hình 13B huấn luyện chỉ trên dữ liệu text trước năm 1931, giúp kiểm tra cách LM generalize across domains.