Dòng tin
Bản tin hôm nay
Thứ Bảy 13 Th6, 2026 · 294 nội dung
Điều Quan Trọng Nhất Hôm Nay
- ›Google công bố Gemini 3.5 và Omni tại I/O 2026 với khả năng agentic đột phá, đồng thời Anthropic buộc dừng Fable 5/Mythos 5 do lệnh kiểm soát xuất khẩu Mỹ. Xu hướng rõ ràng: thế giới đang bước vào "Agent Era" nơi AI không chỉ trả lời câu hỏi mà tự thực hiện công việc phức tạp.
Mới hôm nay
Tìm kiếm ảnh với LangChain và Oracle AI Database
- ›Santiago chia sẻ notebook về ứng dụng tìm kiếm ảnh sử dụng LangChain và Oracle's AI Database vector store để lưu trữ image embeddings.
Trước đó
Một Token cho Mỗi Bằng Chứng Đa Phương Tiện: Bộ Nhớ Tiềm Ẩn Cho QA Có Hạn Chế Tài Nguyên
- ›External memory giúp ground LLM và vision-language model-based question answering vào relevant multimodal evidence, nhưng các paradigm hiện tại biểu diễn mỗi memory item dưới raw text/image form, dẫn đến high token consumption và storage pressure
- ›Đề xuất Latent Memory, paradigm memory latent-space mới thay thế mỗi raw text hoặc image evidence item với một single high-dimensional latent token được sinh bởi small compressor LLM/VLM
- ›Thay vì lấy raw evidence để generation, Latent Memory hoạt động trong unified latent representation space: query được embed vào space này để lấy relevant latent tokens, retrieved latent tokens được directly prompted tới pretrained LLM/VLM
- ›Mỗi latent token được train với reconstruction, contrastive, và distillation objectives một cách end-to-end, giúp nó đồng thời informative cho reconstruction, retrieval, và generation
- ›Đạt competitive performance trên bảy text-only QA benchmarks (HotpotQA) và multimodal benchmarks trong khi tiêu thụ 3x-10x ít generator tokens so với advanced RAG baselines
- ›Cung cấp strongest image-grounded QA performance trên WebQA