Dòng tin

1 nội dung mới nhất
Tất cả
AK (_akhaliq)
AK (_akhaliq)HF PapersPaper·4 ngày trước
CoHyDE: Đồng huấn luyện LLM Rewriter và Dense Encoder cho Tìm kiếm Tool
CoHyDE: Iterative Co-Training of LLM Rewriter & Dense Encoder for Tool Retrieval
  • Tìm kiếm tool trong catalog API lớn là vấn đề vì user queries là colloquial nhưng catalog dùng technical vocabulary.
  • CoHyDE huấn luyện dense encoder và LLM rewriter như một hệ thống co-evolving: encoder học trên hypothetical descriptions do rewriter tạo, rewriter được align via DPO trên retrieval scores.
  • Cải thiện +2.5 pp NDCG@5 trên standard queries và +6.3 pp trên vague queries, với lợi ích lên đến +8 pp trên hardest vague tier.
  • Co-training là ingredient chính: dùng một component riêng lẻ thất bại trên cả well-formed và vague queries với losses lên đến -8 pp.