Dòng tin

1 nội dung mới nhất
Tất cả
Andrej Karpathy
Andrej KarpathyXBài đăng·khoảng 1 tháng trước
Talkie: Mô hình 13B huấn luyện trên text trước 1931 để hiểu Generalization của LM
RT by @karpathy: New work with @AlecRad and @DavidDuvenaud: Have you ever dreamed of talking to someone from the past? Introducing talkie, a 13B model trained only on pre-1931 text. Vintage models should help us to understand how LMs generalize (e.g., can we teach talkie to code?). Thread:
  • Talkie là mô hình 13B huấn luyện chỉ trên dữ liệu text trước năm 1931, giúp kiểm tra cách LM generalize across domains.