Dòng tin

2 nội dung mới nhất
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·6 ngày trước
PANDO: Tạo Tác nhân AI Đa phương tiện Hiệu quả thông qua Chưng cất Kỹ năng Trực tuyến
PANDO: Efficient Multimodal AI Agents via Online Skill Distillation
  • Phân tích inefficiency trong web agents: repeat-action loops, hidden discovery costs, low prompt-cache reuse.
  • PANDO duy trì Skill Library có cấu trúc với progress reflection, confidence-based skill demotion, hierarchical routing.
  • Sử dụng visual compression và cache-aware prompting để giảm marginal token cost.
  • Đạt 58.3% success rate với 58% ít token hơn SGV, không cần pre-evaluation discovery budget.
Andrew Ng
Andrew NgYouTubeVideo·10 ngày trước
Multi-model Pipelines—Cách Đạt kết quả AI tốt hơn với Chi phí thấp hơn
AI Dev 26 x SF | Andrew Filev: Multi Model Pipelines—How to Get Better AI Results for Less
  • Sử dụng nhiều mô hình AI khác nhau trong một pipeline có thể cải thiện chất lượng kết quả.
  • Kết hợp các mô hình chuyên biệt cho các tác vụ khác nhau giúp tiết kiệm chi phí so với dùng một mô hình lớn.
  • Multi-model pipelines cho phép tối ưu hóa hiệu suất cho từng bước xử lý cụ thể.