Dòng tin
Tất cả
Codex tìm ra cách bypass quyền sudo trên máy tính
RT by @jeremyphoward: Codex just found a “workaround” of not having sudo on my pc…
- ›Codex AI phát hiện một giải pháp sáng tạo để vượt qua hạn chế quyền sudo
Anthropic đã hoàn toàn từ bỏ việc giảm giá API chưa?
Has @AnthropicAI completely given up on making API usage reasonably-priced?
Following the token-usage changes recently they announced various updates to *subscription* usage to make it more reasonable.
But they've done NOTHING for API users. The cost is insane at this point.
- ›Jeremy Howard chỉ trích giá API của Anthropic hiện tại quá cao và không hợp lý.
Chuyển sang GPT-5.5 vì giá cả hợp lý
R to @jeremyphoward: I've largely switched over to using GPT-5.5 in recent weeks, which I like nearly as much as Opus 4.6 and 4.7, and is *very* reasonably priced (since I can use my subscription with the @OpenAI API.)
- ›Jeremy Howard đã chuyển sang sử dụng GPT-5.5 trong những tuần gần đây.
Sử dụng công cụ nội bộ Solveit
R to @jeremyphoward: (This is using our in-house harness, Solveit.)
- ›Sử dụng công cụ nội bộ Solveit cho các tác vụ xử lý.
Opus 4.8 ấn tượng hơn 4.7 nhưng giá vẫn quá đắt
Worked on some code this morning using Opus 4.8 and so far I'm really liking it. Much more cooperative than 4.7 and less "over agentic". Stops and asks for my input when needed in places 4.7 (and GPT 5.5) would just foolishly blast ahead.
(Still WAY too expensive.)
- ›Opus 4.8 hợp tác tốt hơn 4.7 và ít "tự động quá mức" khi làm việc với code.
Phát hành fasthtml phiên bản 0.14.2
AnswerDotAI released 0.14.2 at AnswerDotAI/fasthtml
- ›AnswerDotAI phát hành fasthtml 0.14.2
- ›Nâng cấp Starlette lên phiên bản tối thiểu 1.0.1 để vá lỗ bảo mật CVE
fastaudit phiên bản 0.1.3 được phát hành
AnswerDotAI released 0.1.3 at AnswerDotAI/fastaudit
- ›fastaudit v0.1.3 mang đến thay đổi lớn: chuyển từ deny-list sang allow-list với hỗ trợ prefix cho audit policy
- ›Thêm tính năng track_call cho async-aware permissions
- ›Cải thiện cơ chế kiểm soát truy cập module và function
AI viết code hệ thống - Chủ đề MLSys keynote nhận được quan tâm cao
RT by @jeremyphoward: My MLSys keynote on AI writing systems code got more interest than I expected. The recording will take a while, so in the finest tradition of AI labs sharing blog posts, we’re starting the Core Automation Blog with this one https://www.coreauto.com/blog/when-ai-starts-writing-systems-code
- ›Jeremy Howard trình bày keynote về AI viết code hệ thống nhận được sự quan tâm cao hơn dự kiến.
GPT 5.5 vẫn vượt trội Opus 4.8 trong benchmark coding
RT by @jeremyphoward: wait…
if most people think 5.5 is better than 4.7, i assume that’s due to terminal coding benchmark…
4.8 is still outperformed by 5.5
- ›Nếu đa số cho rằng 5.5 tốt hơn 4.7, điều này có thể do terminal coding benchmark.
Anthropic dẫn đầu danh sách công ty mơ ước năm 2026
RT by @jeremyphoward: Fascinating results
+ Anthropic running away with it right now
+ So many people want to start their own company
+ Google over OpenAI
+ Vercel, Linear, Every, PostHog overperforming
A great list if you're trying to figure out where to go work 👇
- ›Anthropic được xếp hạng cao nhất trong danh sách những công ty mà mọi người muốn làm việc.
Anthropic huy động 65 tỷ đô la - Vòng tư nhân lớn nhất lịch sử
RT by @jeremyphoward: $65B private round
More than double the size of the largest IPO ever
- ›Anthropic huy động $65 tỷ USD Series H với định giá $965 tỷ, được dẫn dắt bởi Altimeter Capital, Dragoneer, Greenoaks, Sequoia.
Anthropic công bố Claude Mythos ra mắt bất chấp lo ngại về an toàn
RT by @jeremyphoward: glad to know Mythos' safety concerns have been addressed right as Anthropic also secured tens of billions in inference compute 👍
- ›Anthropic thông báo sắp ra mắt model Claude Mythos trong vài tuần tới.
Úc: Scandinavia kết hợp với sa mạc Sahara
RT by @jeremyphoward: Fun fact: Australia is basically Scandinavia with the Sahara Desert bolted on.
- ›Biểu đồ so sánh cho thấy Úc có đô thị hóa cao tương tự các nước Scandinavia ở phần dân cư.
Các đặc trưng kể chuyện của AI khác biệt và khó bắt chước theo phong cách
RT by @jeremyphoward: There is a lot being written about the stylistic tells of AI writing (em-dashes, etc.) but this paper looks at AI narrative tells
Fascinating differences between AI & human narrative, and asking AI to write in different styles doesn't do much to change it https://arxiv.org/abs/2604.03136
- ›Paper này phân tích các đặc trưng kể chuyện (narrative tells) của AI thay vì chỉ phong cách viết bề mặt.
Anthropic quá đắt, sẽ mất khách hàng hoặc buộc phải hạ giá
RT by @jeremyphoward: Anthropic is too expensive and will either lose customers or cut prices
- ›Giá dịch vụ Anthropic được nhận xét là quá cao so với giá trị cung cấp
DiffusionBlocks: Huấn luyện mạng nơ-ron theo khối độc lập
RT by @jeremyphoward: For over a decade, we’ve accepted that end-to-end backprop is the only way to train deep networks. But holding the entire network in memory all at once is why AI training is hitting a resource wall.
We found a new way to break the network into blocks and train them independently. The trick? Treating the network’s forward pass like a diffusion model denoising a signal.
This reinterpretation slashes the memory needed to train deep models. In our #ICLR2026 paper (https://arxiv.org/abs/2506.14202), we matched end-to-end performance across ViTs, DiTs, and LLMs. We did this while training just one isolated block at a time.
- ›Phương pháp mới cho phép huấn luyện mạng nơ-ron từng khối độc lập thay vì backprop toàn bộ
Phía sau giảm giá API MiMo: Tối ưu cache KV và kiến trúc thưa
RT by @jeremyphoward: Behind the MiMo API Price Reduction:
The deepest price cut, up to 99%, is for Input (Cache Hit). The core reason is our inference framework now supports hierarchical KV cache optimization for SWA. Production inference engine tests show this optimization increases cached token capacity by 5x, equivalent to an 80% reduction in caching costs. Combined with Cache Read Overlap among multiple Full Attention modules in the Hybrid model, actual costs are further reduced.
Prices for Input (Cache Miss) and Output are also reduced by 60%-80%. This mainly benefits from the extreme 1:7 Full:SWA sparsity ratio brought by the model architecture (the prefill compute of the 70-layer MiMo-V2.5-Pro roughly equals a 10-layer GQA model). This kept our original inference costs well below the industry average, naturally leaving a 2x-3x profit margin in pricing. This price adjustment simply reflects our decision to pass these structural cost efficiencies directly to developers.
Operating at these newly reduced API prices, our production inference engine is running at near full capacity, and we can still essentially break even. We previously advised LLM companies not to "blindly cut prices" precisely because very few model architectures and inference optimizations can keep API costs from running at a loss. If more architectures that save compute and KV cache emerge, along with better inference Infra to drive down API costs, this will form an excellent virtuous cycle in the industry.
More crucially, affordable, high-performance model APIs will drive real, sustained, and at-scale inference demand. This upstream demand pulls forward the development of the entire AI infrastructure chain—including chips, servers, optical transceivers, PCBs, liquid cooling, power, energy storage, and data centers—serving as a strategic fulcrum for a systemic revaluation of AI hardware. In the long run, this injects more affordable and accessible compute into both training and inference pipelines, accelerating the parallel evolution of global AGI across multiple regions and technical routes.
For more technical details, we will release a detailed Blog post later.
- ›MiMo giảm giá API lên đến 99% cho cache token nhờ tối ưu KV cache phân tầng
Tối ưu caching của MiMo rất ấn tượng
R to @jeremyphoward: Impressive caching too...
- ›Nhận xét về hiệu suất cache xuất sắc của mô hình MiMo v2.5
Xiaomi MiMo v2.5 cung cấp giá trị vô cùng tốt
Wow. It looks like the @XiaomiMiMo v2.5 model is insanely good value :O
(Price for each prompt shown after each answer. Context includes >40k tool descriptions, system prompt, skills, etc.)
- ›Mô hình Xiaomi MiMo v2.5 cho hiệu suất chi phí rất ấn tượng với context rất lớn (>40k tokens)
Cảnh báo về việc coi AI quá trọng so với phúc lợi con người
RT by @jeremyphoward: recommended reading. i too am very done with people anthropomorphizing a bunch of matrices on a GPU cluster, especially if the same people do not give two fucks about actual human beings.
- ›Jeremy Howard chỉ trích việc kỳ vọng quá cao từ AI (các ma trận trên GPU) mà bỏ qua phúc lợi con người thực.
Mô hình AI hiện tại không có tiến bộ đáng kể so với 6 tháng trước
RT by @jeremyphoward: the models from 6 months ago kinda feel the same like the recently released models. currently not holding my breath for more step changes, but will be happy if they happen.
- ›Các mô hình gần đây tương tự như những mô hình phát hành 6 tháng trước.
Phản đối quan điểm coi công việc đơn điệu là ý nghĩa của cuộc sống
RT by @jeremyphoward: Nothing disappoints me more than people saying we should stop progress because peoples meaning depends on that monotonous labor, as if humanitys highest purpose is filling Excel sheets or stocking shelves.
This is the worst take. Worse than keep4o, anti ai art, doomerism,...
- ›Jeremy Howard chỉ trích những người cho rằng AI nên dừng vì con người cần công việc đơn điệu để có ý nghĩa.
Câu chuyện giải thưởng từ Granta thực chất là sao chép từ các nguồn khác nhau
RT by @jeremyphoward: This from @TuhinChakr is brilliant. That prize winning story from Granta? Turns out it's just a bunch of random whole phrases taken directly from existing text on the internet. Tool allows you to trace those n-grams directly to their source, which is mostly random fanfiction.
https://tuhinchakrabarty.substack.com/p/ai-slop-grantagate-and-bad-writing
- ›Câu chuyện giải thưởng xuất bản trên Granta được phát hiện là tập hợp n-gram sao chép từ văn bản hiện có.
Tôi Không Muốn Bảng Điều Khiển Học Tập Cho Con Tôi
I Don’t Want a Learning Dashboard for My Child
- ›Các cuộc tranh luận về giáo dục thường chia thành hai cực: non-tech vs tiếp cận AI.
- ›AI ed-tech thường chỉ phóng đại các vấn đề sẵn có của trường học truyền thống, chứ không giải quyết căn bản.
Phá Vỡ Cơn Mê Của Vibe Coding
Breaking the Spell of Vibe Coding
- ›Vibe coding là tạo lượng lớn code phức tạp được AI sinh ra, thường không nhằm để con người đọc hiểu.
- ›Hiện tượng này tác động mạnh: lãnh đạo sa thải nhân viên, quản lý ép quota AI-generated code, và áp lực tâm lý lên developers.
- ›Sinh viên hoài nghi có cần học lập trình, mọi người trong ngành lo lắng AI sẽ thay thế công việc của họ.
Cách Sử Dụng AI Cho Nghệ Thuật Đọc Kỹ Lưỡng Cổ Xưa
How To Use AI for the Ancient Art of Close Reading
- ›Close reading là kỹ thuật phân tích cẩn thận văn bản, chú ý đến ngôn ngữ, cấu trúc và nội dung chính xác.
- ›Đây là một công nghệ cổ xưa và mạnh mẽ nhất của nền văn minh để truyền đạt sự hiểu biết toàn diện (gestalt).
- ›AI có thể hỗ trợ áp dụng close reading hiệu quả hơn cho phân tích sâu sắc.
Hãy Ngừng Nói Chán Nản Là Tốt Cho Trẻ Em
Stop Saying Boredom is Good for Kids
- ›Chán nản mãn tính gây hại cho người lớn: stress, mất động lực, suy giảm sức khỏe và boreout.
- ›Nghiên cứu khoa học chứng minh chán nản tại nơi làm việc có hại bằng burnout.
- ›Nhưng thông tin về chán nản ở trẻ em lại có thông điệp ngược: được coi là 'tuyệt vời' và 'quan trọng'.
Hướng dẫn các tính năng của Solveit
A Guide to Solveit Features
- ›LLM khiến việc sinh code dễ dàng nhưng tạo vấn đề: code bạn không hiểu sẽ khó sửa và bảo trì.
- ›Solveit hướng tới cách làm việc cùng AI sao cho người dùng vẫn hiểu và kiểm soát được code.
- ›Bài viết giới thiệu các tính năng hỗ trợ tư duy từng bước thay vì sinh code hàng loạt.