Dòng tin

1 nội dung mới nhất
Bản tin hôm nay

🤖 Bản tin AI Hằng ngày: Cân bằng giữa Đột phá và Kiểm soát

Thứ Ba 16 Th6, 2026 · 94 nội dung
⚖️ Chính sách & Tranh luận
  • Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.
🧬 Đột phá Công nghệ & Mô hình Mới
  • Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.
💻 Tư duy Lập trình & AI Agents
  • swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.
🌍 Tầm nhìn Tương lai & Đạo đức
  • Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·7 ngày trước
Fine-tuning Mô Hình LLM Đa Phương Tiện với ART: Huấn Luyện Tăng Cường Dựa Trên Nghệ Thuật
  • Các kỹ thuật PEFT hiện tại (LoRA, Soft Prompting) yêu cầu sửa đổi đồ thị tính toán của LLM, không tương thích đầy đủ với các engine tối ưu hóa cao thông lượng như vLLM
  • Bài báo đề xuất ART (Art-based Reinforcement Training) - phương pháp fine-tuning Multimodal LLM (MLLM) bằng cách chỉ tối ưu hóa raw visual input (đầu vào hình ảnh thô), cho phép sử dụng soft-token approach trên đồ thị tính toán đã được biên dịch
  • Phương pháp dựa vào backpropagation gradient vào một mảng pixel đơn giản, hỗ trợ bất kỳ mục tiêu fine-tuning nào mà không cần sửa đồ thị tính toán
  • Đầu vào hình ảnh được tối ưu hóa có thể được tạo kiểu dưới dạng các tác phẩm tính toán liên quan đến nhiệm vụ
  • Hiệu quả được xác nhận trên các kích thước khác nhau của kiến trúc Qwen phổ biến và trên nhiều benchmark textual
  • ART đạt độ chính xác cạnh tranh với LoRA trên các benchmark về toán học (mathematics) và sử dụng công cụ cấu trúc (structured-tool-use)