Dòng tin

142 nội dung mới nhất
Bản tin hôm nay

🤖 Bản tin AI Hằng ngày: Cân bằng giữa Đột phá và Kiểm soát

Thứ Ba 16 Th6, 2026 · 94 nội dung
⚖️ Chính sách & Tranh luận
  • Chuyên gia Simon Willison chỉ trích lệnh cấm xuất khẩu mô hình Fable có thể gây hại cho phòng thủ mạng, trong khi Clement Delangue nhấn mạnh mã nguồn mở là chìa khóa để doanh nghiệp không bị "khóa chặt" vào các nhà cung cấp độc quyền.
🧬 Đột phá Công nghệ & Mô hình Mới
  • Radical Numerics gọi vốn 50 triệu USD ra mắt mô hình ngôn ngữ hệ gen Omnii, trong khi Cartesia tung ra Sonic-3.5 với chất lượng giọng nói khó phân biệt với người thật, đặt ra thách thức lớn cho các tổng đài truyền thống.
💻 Tư duy Lập trình & AI Agents
  • swyx dự đoán quy trình review code truyền thống sẽ biến mất vào năm 2026, thay vào đó là sự lên ngôi của các "harness" (khung làm việc) thông minh. Bài học rút ra: Đừng chỉ dùng API trần, hãy học cách xây dựng hệ thống bao bọc (scaffolding) để tối ưu hóa sức mạnh thực sự của mô hình.
🌍 Tầm nhìn Tương lai & Đạo đức
  • Fei-Fei Li nhấn mạnh tương lai AI phải dựa trên quyền tự chủ và sự thấu hiểu của con người qua các "world models". Đồng thời, François Chollet cảnh báo rằng thiếu các benchmark tiêu chuẩn hóa sẽ khiến ngành AI dễ bị tổn thương trước các quy định tùy tiện của chính phủ.
Tất cả
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Đây có vẻ là một động lực tồi tệ cho phần còn lại của nền kinh tế và cho người lao động
  • Ethan Mollick đưa ra nhận định ngắn gọn rằng một động thái hoặc chính sách cụ thể nào đó đang tạo ra một động lực (incentive) tiêu cực.
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Nếu AGI khả thi và các phòng lab chỉ bị cấm sử dụng mô hình nội bộ khi công khai nó, ba phòng lab lớn có thể chọn giữ toàn bộ giá trị AGI cho mình thông qua mở rộng và mua lại
  • Ethan Mollick đưa ra giả thuyết về một kịch bản trong trường hợp AGI (Trí tuệ nhân tạo tổng quát) thực sự có thể đạt được.
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Đừng coi thường 'Sức mạnh của Philadelphia'
  • Ethan Mollick đưa ra một nhận định ngắn gọn nhưng mang tính ẩn dụ hoặc hài hước: 'Đừng coi thường Sức mạnh của Philadelphia' (Powers of Philadelphia).
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Không liên quan đến AI, tôi thấy thú vị khi thành phố quê hương mình có những nghi lễ dân sự phức tạp có thể nguyền rủa hoặc ban phước tùy thuộc vào lễ vật dâng lên một bức tượng
  • Ethan Mollick chia sẻ một quan sát hài hước, không liên quan trực tiếp đến AI, về thành phố quê hương của ông (Philadelphia).
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Fable thực sự rất tốt, và khi những bước tiến theo cấp số nhân tiếp diễn, các phòng lab khác cũng sẽ có những bước nhảy vọt tương tự Anthropic
  • Ethan Mollick đánh giá rất cao sản phẩm 'Fable', khẳng định nó 'thực sự rất tốt' dựa trên trải nghiệm thử nghiệm trực tiếp của ông vào tuần trước.
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Trả lời @emollick: Cũng tốt hơn là bị hỏi về wet Claude.
  • Ethan Mollick bình luận rằng một tình huống cụ thể (được nhắc đến trong ngữ cảnh trước đó) vẫn tốt hơn là bị hỏi về 'wet Claude'.
#Văn hóa AI#Meme AI#Claude
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Rất thông minh. Và phù hợp với những gì tôi mong đợi: các mô hình yếu về thị giác so với mọi thứ khác, vì vậy các bước xử lý hình ảnh là nơi lỗi tích tụ nhiều nhất trong quy trình làm việc
  • Ethan Mollick đưa ra nhận xét về một phát hiện liên quan đến khả năng phát hiện bất thường ('monkey business') trong tập dữ liệu của AI.
Ethan Mollick
Ethan MollickXBài đăng·1 ngày trước
Các vấn đề cơ bản của hệ thống AI: jailbreak, hallucination và thay đổi hành vi không dự đoán
  • Hệ thống AI có thể không bao giờ hoàn toàn chống được jailbreak hoặc loại bỏ hoàn toàn hallucination
Ethan Mollick
Ethan MollickXBài đăng·2 ngày trước
Quy định AI phức tạp vì mô hình chỉ là một phần của bức tranh toàn cảnh
  • Ranh giới quy định rõ ràng cho AI khó xây dựng vì mô hình là chỉ một phần của vấn đề
Ethan Mollick
Ethan MollickXBài đăng·2 ngày trước
Đã xóa một tweet về việc người dùng API không hiểu các mô hình frontier mạnh mẽ đến mức nào khi được tích hợp trong các native harnesses, vì tôi đã không phân biệt trong bài đăng (do giới hạn ký tự!) giữa những người cẩn thận đánh giá các harnesses khác cho nhiệm vụ và những người chỉ sử dụng API trần.
  • Ethan Mollick đã xóa một tweet trước đó bàn về việc người dùng API thường không nhận ra sức mạnh vượt trội của các frontier models khi chúng được tích hợp trong các native harnesses (khung làm việc gốc).
Ethan Mollick
Ethan MollickXBài đăng·2 ngày trước
Phản hồi @emollick: Github (do Claude 4.8 Opus tải lên, kèm thanh trượt cỡ chữ)
  • Ethan Mollick chia sẻ link Github chứa dự án 'superluminal' do Claude 4.8 Opus tải lên.
Ethan Mollick
Ethan MollickXBài đăng·2 ngày trước
Phân tích phương pháp luận: Mô hình tổng quát vs AI chuyên biệt y tế
  • Cuộc tranh luận về một bài báo cho rằng mô hình LLM tổng quát có hiệu năng tương đương hoặc tốt hơn các AI y tế chuyên biệt
Ethan Mollick
Ethan MollickXBài đăng·2 ngày trước
Các đặc tính lạ được 'di truyền' giữa các thế hệ mô hình AI
  • Nghiên cứu từ nhà nghiên cứu Google DeepMind (Josh Engels) khám phá rằng các mô hình AI có thể 'di truyền' những đặc tính kỳ lạ từ mô hình tiền nhiệm khi dùng một mô hình để huấn luyện mô hình tiếp theo
Ethan Mollick
Ethan MollickXBài đăng·3 ngày trước
Ảnh hưởng của mô hình Fable trên ngôn ngữ lập trình và UX
  • Ethan Mollick nhận xét rằng từ 'toast' (thuật ngữ UX để chỉ thông báo tạm thời) xuất hiện ít hơn kể từ khi mô hình Fable bị gián đoạn
Ethan Mollick
Ethan MollickXBài đăng·3 ngày trước
Chưa có cách tiếp cận rõ ràng để tái cơ cấu công ty xung quanh AI Agents
  • Hiện tại không ai có câu trả lời rõ ràng về cách tốt nhất để xây dựng lại các tổ chức công ty xung quanh AI agents, đặc biệt là cách mở rộng lợi thế cạnh tranh
Ethan Mollick
Ethan MollickXBài đăng·3 ngày trước
Hai ngày sau, tình hình vẫn còn rối rắm
  • Ethan Mollick nhận xét rằng tình huống hiện tại vẫn chưa rõ ràng, vẫn còn rối rắm
Ethan Mollick
Ethan MollickXBài đăng·3 ngày trước
Prompt one-shot cuối cùng: Tạo ứng dụng mô phỏng du lịch nhanh hơn ánh sáng (FTL)
  • Ethan Mollick sử dụng một prompt duy nhất (one-shot) để yêu cầu AI tạo ứng dụng mô phỏng các hình thức du lịch FTL
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Các bộ phận ít quan trọng có thể hưởng lợi nhiều hơn từ mô hình AI thông minh hơn
  • Những bộ phận ít được ưu tiên trong tổ chức thường có năng lực tổ chức và nguồn nhân lực yếu hơn
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Giả định dùng mô hình nhỏ cho công việc ít quan trọng là sai lệch
  • Giả định rằng nên dùng mô hình nhỏ cho công việc ít quan trọng là sai lệch hoặc cần xem xét kỹ lưỡng hơn
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Mistral đã từ bỏ mục tiêu phát triển mô hình AI biên giới
  • Mistral ban đầu không có ý định từ bỏ phát triển các mô hình AI biên giới (frontier models) nhưng cuối cùng đã chuyển hướng chiến lược
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Mistral: Tại sao không thể cạnh tranh với Big Three và các lab Trung Quốc?
  • Mistral là lab AI biên giới duy nhất của châu Âu (ngoài Google DeepMind UK) nhưng vẫn không thể theo kịp Big Three (OpenAI, Google, Anthropic) và các phòng lab Trung Quốc
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Sức mạnh tính toán của mô hình Mythos-class có thể được chính phủ kiểm soát
  • Đào tạo một mô hình Mythos-class yêu cầu lượng điện năng và chip lớn đến mức các chính phủ quốc gia sẽ chắc chắn phát hiện được
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Mô hình open weights biên giới sẽ không tiếp tục phát triển
  • Nếu các mô hình Mythos-level được coi là có rủi ro, Trung Quốc cũng sẽ không muốn cho phép phát hành chúng dưới dạng open weights
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Tương lai AI sẽ trở nên bất ổn hơn khi các mục cược tăng lên
  • Ethan Mollick chia sẻ một bài viết của anh từ vài tháng trước, được viết sau các xung đột giữa Anthropic, DoW, Citrini và Block
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Ethan Mollick không có thêm thông tin ngoài công bố công khai của Anthropic
  • Ethan Mollick thừa nhận không có bất kỳ thông tin bổ sung nào ngoài những gì Anthropic đã công bố công khai.
#Anthropic#Tin tức AI
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Tình huống Anthropic khó hiểu
  • Ethan Mollick nhận xét rằng tình huống liên quan đến Anthropic hiện tại khó hiểu và chưa rõ ràng.
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
Công bố mã Twigl dưới dạng HTML preview
  • Chia sẻ mã Twigl dưới dạng HTML preview trên nền tảng Claude sau yêu cầu từ cộng đồng
Ethan Mollick
Ethan MollickXBài đăng·4 ngày trước
So sánh phiên bản SimRefine cũ với GPT-5.1
  • Chia sẻ liên kết đến phiên bản SimRefine cũ được xây dựng bằng GPT-5.1 để so sánh với phiên bản tái tạo mới
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Claude Code tái tạo thành công SimRefinery - trò chơi mô phỏng cổ điển từ Maxis
  • 10 tháng sau so với lần đầu tiên, Ethan Mollick sử dụng Claude Code kết hợp Fable để xây dựng lại SimRefinery hoàn chỉnh từ các ảnh chụp màn hình còn sót lại và tài liệu
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Claude Fable 5 đạt điểm cao trên benchmark FrontierMath
  • Claude Fable 5 ghi dấu ấn trên bài kiểm tra FrontierMath với tỷ lệ chính xác 87% trên Tiers 1-3 và 88% trên Tier 4 (v2)
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
OpenEvidence - ứng dụng AI y tế đạt tỷ lệ chấp nhận cao trong cộng đồng bác sĩ Mỹ
  • Hơn 65% bác sĩ tại Mỹ sử dụng OpenEvidence, cho thấy mức độ chấp nhận rộng rãi của công cụ này trong thực hành y khoa
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Các mô hình LLM frontier vượt trội các công cụ AI lâm sàng
  • Các frontier LLM (Google, OpenAI, Anthropic) vượt trội hơn các công cụ AI lâm sàng chuyên dụng như OpenEvidence và UpToDate trên ba bài đánh giá
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Giới hạn của Fable do thiếu native imagegen
  • Fable bị hạn chế do không có khả năng native image generation
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Toolkit được thiết kế riêng để AI phát triển game
  • Hiện cần phải phát triển toolkit hoặc skillset được thiết kế riêng cho AI sử dụng trong phát triển game
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Nó hoạt động rồi!
  • Một bình luận tích cực xác nhận một dự án hoặc thử nghiệm đã thành công
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Cordwainer Smith sẽ nghĩ gì về điều này?
  • Câu hỏi suy đoán về quan điểm của Cordwainer Smith đối với các phát triển AI hiện đại
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Bình luận văn hóa sâu sắc bây giờ chủ yếu từ AI slop
  • Mollick nhận thấy anh nhận được nhiều bình luận sâu sắc hơn trước về bài viết về tác giả khoa học viễn tưởng kém nổi, nhà thơ hiện đại, và kiến trúc Bauhaus
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Fable tạo trò chơi nghệ thuật xinh đẹp dựa trên Duino Elegies
  • Mollick giới thiệu dự án hợp tác với Fable để tạo trò chơi nghệ thuật dựa trên 'Duino Elegies' của nhà thơ Rainer Maria Rilke
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Các kịch bản khoa học viễn tưởng sống động trở thành định dạng tiêu chuẩn mới cho bài báo chính sách và phân tích tài chính về AI
  • Ethan Mollick nhận xét rằng các bài báo chính sách và phân tích tài chính về AI ngày càng sử dụng các kịch bản khoa học viễn tưởng sống động làm định dạng mặc định
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Mâu thuẫn trong các con số không phải là vấn đề prompt đơn thuần
  • Ethan Mollick trả lời các bình luận, bất đồng với quan điểm rằng một vấn đề chỉ là 'pure prompting problem'
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Các AI không thể phản ánh trên suy nghĩ của chính chúng - cẩn thận với các giải thích hậu sự
  • Ethan Mollick chia sẻ một giải thích từ một mô hình AI nhưng cảnh báo rằng cần cẩn trọng khi tin tưởng các giải thích hậu sự
Ethan Mollick
Ethan MollickXBài đăng·5 ngày trước
Các mô hình LLM tiên tiến vẫn thất bại với bài kiểm tra dịch thuật Beninatto-Trombetti
  • Valerio Capraro giới thiệu 'Beninatto-Trombetti test', bài kiểm tra dịch thuật chuyên nghiệp để đánh giá khả năng suy luận ngữ cảnh và cập nhật hình thức của các LLM
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Toàn bộ văn bản 'Kubla Khan' của Coleridge bao gồm phần nối dài
  • Ethan Mollick chia sẻ toàn bộ văn bản bài thơ cổ điển 'Kubla Khan' của Samuel Taylor Coleridge
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Claude Fable hoàn thành 'Kubla Khan' với suy luận phức tạp nhưng hơi quá chữ nghĩa
  • Ethan Mollick đánh giá nỗ lực của Claude Fable trong việc hoàn thành bài thơ 'Kubla Khan' - tốt hơn các nỗ lực khác nhưng không đạt tài năng của Coleridge
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Hai điều đều đúng: Anthropic lo ngại mô hình Mythos nhưng chưa thuyết phục được công chúng
  • Anthropic thực sự lo ngại về việc lạm dụng các mô hình Mythos-class và đã triển khai các biện pháp bảo vệ vượt mức cho đến khi tự tin rằng không bị lạm dụng
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Tương lai của mô hình mã nguồn mở: Trung Quốc sẽ điều tiết hoặc các công ty chuyển sang mã đóng
  • Giả định rằng mô hình open weights frontier sẽ tiếp tục khả dụng là không rõ ràng
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Có ai giải thích được điều kiện để mô hình mã nguồn mở hàng đầu vẫn khả dụng không?
  • Đặt câu hỏi liệu có lập luận rõ ràng nào để giải thích tính khả dụng tiếp tục của mô hình open weights ở mức frontier
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
Khía cạnh gây tranh cãi nhất về guardrails của Fable đang được Anthropic hủy bỏ
  • Một chính sách gây tranh cãi liên quan đến guardrails xung quanh mô hình Fable của Anthropic
Ethan Mollick
Ethan MollickXBài đăng·6 ngày trước
GPT-5.5 Pro thực hiện được kỹ thuật tương tự nhưng kết quả ít tự tham chiếu hơn Fable
  • GPT-5.5 Pro có khả năng thực hiện được cùng một yêu cầu về kỹ thuật như Fable với cùng một prompt
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Fable: Viết thơ có uyên vần với các ràng buộc nguyên âm
  • Ethan Mollick đưa ra một thách thức phức tạp cho mô hình Fable: viết 6 bài thơ mỗi bài 4 dòng
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Tại sao chỉ chuyển sang mô hình rẻ hơn không phải là giải pháp tối ưu
  • Lời khuyên 'chuyển sang mô hình rẻ hơn để tiết kiệm chi phí' là không tối ưu vì các mô hình rẻ hơn luôn kém chất lượng hơn
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Nhu cầu dữ liệu thực tế về tác động của AI đến nền kinh tế
  • Ethan Mollick ủng hộ sáng kiến AI Economic Indicators của Phòng thí nghiệm Kinh tế Kỹ thuật số Stanford
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Token budget: Yếu tố quan trọng khi xem xét lời mời làm việc
  • Khi xem xét một lời mời làm việc, ứng viên nên hỏi 'ngân sách token' (token budget) sẽ là bao nhiêu
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Ai là nhà khoa học vĩ đại nhất tính theo trích dẫn Google Scholar? Không phải Einstein hay Hinton
  • Ethan Mollick đặt câu hỏi nhà khoa học nào có nhiều trích dẫn nhất trên Google Scholar - có phải Einstein, Bengio hay Hinton không?
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
So sánh các tác giả khoa học viễn tưởng: Lem, Adams, Wells, Asimov
  • Stanislaw Lem xếp trên Douglas Adams, có thể ngang bằng H.G. Wells trong thứ bậc các tác giả khoa học viễn tưởng
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Vấn đề kinh doanh cốt lõi của open weights AI
  • Mô hình kinh doanh của open weights AI không tuân theo mô hình open source truyền thống vì khó tìm được lộ trình sinh lợi rõ ràng
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Đánh giá cao một comment trên Bluesky
  • Ethan Mollick chia sẻ rằng anh đánh giá cao một comment nào đó trên Bluesky (nội dung comment không được cung cấp trong post)
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Xếp hạng các tác giả khoa học viễn tưởng theo độ mong muốn sẽ đúng về tương lai AI
  • Danh sách các tác giả khoa học viễn tưởng được xếp hạng theo mức độ mà bạn muốn họ có lý do đúng về AI và tương lai
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Độ phức tạp của output AI sau nhiệm vụ kéo dài 9 giờ
  • Output của AI từ một nhiệm vụ kéo dài 9 giờ hoàn toàn hợp lý, chính xác và có ý nghĩa
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Fable phát triển phương ngữ riêng trong các tác vụ dài hạn
  • Khi Claude Fable chạy các tác vụ dài hạn, các agent của nó phát triển một phương ngữ/cách nói riêng ('Claudish') thông qua sự tương tác và gia cường lẫn nhau
Ethan Mollick
Ethan MollickXBài đăng·7 ngày trước
Fable sử dụng tokens rất nhanh khi thực thi workflow
  • Khi Claude Fable khởi động một workflow, tốc độ tiêu thụ tokens có thể tăng lên rất nhanh chóng
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Trả lời về những hạn chế khi sử dụng Fable hoặc Mythos
  • Người dùng đặt câu hỏi về khả năng dùng Fable hay Mythos khi có những hạn chế nhất định
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Việc Anthropic hủy subscription Fable là kỳ lạ và làm giảm động lực học tập
  • Anthropic có thể hủy quyền truy cập Fable qua subscription trong hai tuần tới
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Fable tạo shader thành phố neo-gothic vô tận lụt trong bão
  • Fable được yêu cầu tạo shader chạy trên twigl.app mô tả thành phố neo-gothic vô tận, lụt trong đại dương bão với sóng lớn
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Fable thực thi các ý tưởng từ prompt cơ bản thành ứng dụng hoàn chỉnh
  • Chỉ cần các prompt cơ bản, Fable tự thực thi và tạo ra các ứng dụng hoàn chỉnh
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Fable: Bước nhảy vượt trội nhưng cách làm việc rất kỳ lạ
  • Mollick đã có cơ hội tiếp cận Fable, một model AI mới đại diện cho bước nhảy vượt trội trong khả năng so với các mô hình trước đó
Ethan Mollick
Ethan MollickBlogBài viết·8 ngày trước
Trải nghiệm làm việc với Mythos (Claude 5 Fable)
  • Ethan Mollick đã sớm truy cập Claude 5 Fable - model Mythos-class đầu tiên được phát hành công khai, đại diện cho bước nhảy đáng kể so với tất cả các model công khai khác, với khả năng thực thi các specifications multi-page phức tạp trong khoảng một tá giờ
  • Fable vượt trội trong hầu hết các thử nghiệm: tạo academic social science paper tinh vi nhất từ một prompt duy nhất, sáng tạo bài thơ vần 10 trang với mỗi từ bắt đầu bằng chữ 's', và các trò chơi sáng tạo chỉ từ prompt và vài feedback
  • Model sử dụng toán học để sinh tất cả hình ảnh và object 3D mà không cần external assets, vì Claude không có khả năng tạo hình ảnh
  • Trải nghiệm sử dụng Fable vừa thú vị vừa khó chịu (unnerving) - thú vị vì nó làm chính xác những gì được yêu cầu, nhưng cũng kinh ngạc vì điều đó xảy ra một cách nhanh chóng và không thể dự đoán
  • Fable được kiểm tra trên nhiều task phức tạp bao gồm tạo isochrone map (bản đồ hiển thị khoảng cách có thể đi được trong thời gian nhất định)
  • Mối quan hệ của con người với AI đang thay đổi theo cách triệt để, với Fable đại diện cho bước tiến thực sự trong khả năng và mục đích sử dụng AI
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Đáng đọc
  • Mollick chia sẻ một bài viết của Noam Brown (@polynoamial) mà anh cho là đáng đọc
#Noam Brown#Suy luận AI
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
NYT: Bàn tròn về tương lai AI và những người thắng lợi trong công việc
  • New York Times đã công bố một cuộc thảo luận bàn tròn về tương lai của AI và ai sẽ hưởng lợi từ các thay đổi trong thị trường lao động
Ethan Mollick
Ethan MollickXBài đăng·8 ngày trước
Anthropic & OpenAI: Chậm hóa phát triển AI cần phối hợp toàn cầu
  • Cả Anthropic lẫn OpenAI đều đề cập đến khả năng làm chậm tốc độ phát triển AI trong các bài viết gần đây về 'What comes next in AI'
Ethan Mollick
Ethan MollickXBài đăng·9 ngày trước
Con người không phải pin năng lượng mà là nguồn tạo sáng tạo: LLM thiếu đa dạng
  • Mollick phản bác ý tưởng trong phim The Matrix về việc sử dụng con người làm nguồn năng lượng, cho rằng đó là một ý tưởng phi logic
Ethan Mollick
Ethan MollickXBài đăng·9 ngày trước
Apple ít công bộ chi tiết về cách Siri AI hoạt động giữa model cục bộ và đám mây so với lần trước
  • Apple không công bộ nhiều thông tin chi tiết về kiến trúc AI của phiên bản Siri mới, trái ngược với những công bộ chi tiết lần trước
Ethan Mollick
Ethan MollickXBài đăng·9 ngày trước
Một năm trước, o3 là điều gần nhất với AI agent
  • Một năm trước, model o3 là điều gần nhất với khái niệm AI agent mà chúng ta có
Ethan Mollick
Ethan MollickXBài đăng·10 ngày trước
Thời điểm tốt để tích lũy những ý tưởng quý giá và độc lạ
  • Đây là thời điểm lý tưởng để lưu trữ những ý tưởng khó khăn, quý giá, và độc lạ (cho công việc, sở thích, hoặc khởi nghiệp)
Ethan Mollick
Ethan MollickXBài đăng·11 ngày trước
Tầm quan trọng của viết lách tốt trong AI - tránh các cụm từ điển hình của Claude hay ChatGPT
  • Lượng văn bản lớn xuất hiện trong phần mềm, và việc gặp phải menu hay báo cáo chứa 'Claudisms' hoặc 'ChatGPTisms' (cụm từ điển hình của AI) rất khó chịu
Ethan Mollick
Ethan MollickXBài đăng·11 ngày trước
Các bản phát hành AI ngày càng tốt hơn từ OpenAI và Anthropic
  • Các bản phát hành AI ý nghĩa hơn đang tăng tốc độ, đặc biệt từ OpenAI và Anthropic
Ethan Mollick
Ethan MollickXBài đăng·11 ngày trước
Gemini Pro của Google cập nhật chậm hơn Claude và GPT, tạo khoảng cách hiệu suất
  • Mô hình Gemini Pro không cập nhật nhanh như Claude hoặc GPT, với bản phát hành mới nhất là Gemini 3.1 Pro vào tháng 2
Ethan Mollick
Ethan MollickXBài đăng·11 ngày trước
Agent Teams và Workflows của Anthropic - công cụ mạnh mẽ nhưng tiêu thụ nhiều token
  • Agent Teams và Workflows đều là công cụ rất mới và rất mạnh mẽ, nhưng tiêu thụ lượng token lớn
Ethan Mollick
Ethan MollickXBài đăng·12 ngày trước
Sự phụ thuộc vào mô hình mã mở từ các lab Trung Quốc
  • Tương lai của mô hình AI cục bộ và fine-tuning phụ thuộc lớn vào việc các phòng lab Trung Quốc tiếp tục phát hành mô hình open weights
Ethan Mollick
Ethan MollickXBài đăng·12 ngày trước
Khó để bất kỳ ai bắt kịp Ba Lab AI Hàng Đầu
  • Cho đến khi sự cải thiện nhanh chóng của AI dừng lại, rất khó để bất kỳ công ty nào bắt kịp Ba Lab AI Hàng Đầu
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Sách mới 'Co-Existence': Cách sống và làm việc cùng AI
  • Ethan Mollick công bố cuốn sách mới 'Co-Existence' sẽ ra mắt vào ngày 20 tháng 10
Ethan Mollick
Ethan MollickBlogBài viết·13 ngày trước
Sự Kết Thúc của Cộng Sinh Trí Tuệ
  • Cuốn sách 'Co-Intelligence' của Ethan Mollick xuất bản 2 năm trước thành công lớn — đạt bestseller New York Times, dịch 25+ ngôn ngữ với thị trường chính là Hà Lan và Hàn Quốc.
  • Khái niệm 'co-intelligence' (con người và AI cộng tác như trợ lý) không còn phù hợp vì các công ty AI đã chuyển hướng sang xây dựng AI agents tự chủ thay vì công cụ hỗ trợ.
  • Tầm nhìn của các công ty AI luôn là xây dựng 'hệ thống tự chủ cao vượt trội hơn con người ở hầu hết công việc có giá trị kinh tế', như được nêu trong charter của OpenAI.
  • Cuối 2025, các coding agents thực sự ra đời; nghiên cứu cho thấy chúng làm tăng lượng code viết lên 17 lần, và Anthropic báo cáo AI hiện viết 80% code của công ty.
  • Mỗi developer tại Anthropic ship 8x nhiều hơn nhờ AI agents, đánh dấu sự thay đổi cơ bản trong lập trình phần mềm.
  • Xu hướng này sẽ lan rộng từ lập trình sang nhiều lĩnh vực kinh tế khác, khi các công ty AI tiếp tục phát triển hệ thống tự chủ.
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Nhà sử học khám phá những khả năng mới của LLM cũ
  • Các nhà sử học đang thử nghiệm những ứng dụng thú vị của LLM cũ (vintage LLMs) trong lĩnh vực lịch sử
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Giới nhân văn ủng hộ AI nhưng im lặng trên mạng xã hội
  • Các giáo sư nhân văn bày tỏ sự nhiệt tình với AI khi nói chuyện riêng tư
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Tự cải thiện đệ quy: Tầm nhìn tương lai của Anthropic
  • Ethan Mollick khuyên mọi người nên đọc kỹ bài viết về Recursive Self-Improvement (RSI) của Anthropic
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Những insights quan trọng từ công trình Recursive Self-Improvement
  • Bài viết Recursive Self-Improvement của Anthropic chứa nhiều insights quan trọng về tương lai phát triển của AI
#Anthropic#AI#Tương lai
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Claude viết hơn 80% code tại Anthropic
  • Kể từ tháng 5 năm 2026, hơn 80% code được merge vào codebase của Anthropic được tác giả bởi Claude
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Tại sao khó cảm nhận được tốc độ cải thiện của AI
  • Mặc dù AI tiếp tục tăng khả năng một cách đáng kể, nhưng khó cảm nhận được sự khác biệt rõ rệt về hiệu suất giữa các phiên bản mới
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Tài liệu OpenAI và Anthropic lỗi thời, toàn lời khuyên cũ và mâu thuẫn
  • Tài liệu của OpenAI và Anthropic thường chậm hơn sản phẩm thực tế hàng tháng
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Claude Code và Codex mở rộng khả năng nhưng phần lớn tính năng không được ghi tài liệu
  • Claude Code và Codex đã mở rộng đáng kể với nhiều cách tiếp cận mới (subagents, skills, goal, workflows, plugins)
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Nghiên cứu 'moral Turing Test': LLM suy luận đạo đức ngang bằng chuyên gia
  • Một bài báo tiến hành 'moral Turing Test' so sánh GPT-4o với con người về suy luận đạo đức
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
AI là nhà đạo đức tốt nhưng có thể gây thoái hóa đạo đức con người
  • Ted Chiang nhấn mạnh rủi ro 'moral atrophy' nếu để AI quyết định các vấn đề đạo đức
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
GenAI có ROI tích cực nhưng báo cáo Bain mơ hồ về việc đo lường
  • Mặc dù có nhiều vấn đề trong triển khai GenAI, các cuộc khảo sát cho thấy ROI rộng rãi là tích cực
#GenAI#ROI#Triển khai
Ethan Mollick
Ethan MollickXBài đăng·13 ngày trước
Báo cáo Bain lập luận lạ lùng, trích dẫn 'MIT study' giả mạo
  • Báo cáo Bain lập luận rằng ML trước đây không tạo tiết kiệm do vấn đề dữ liệu, dẫn đến thiếu đầu tư AI hiện tại
#GenAI#ROI#Báo cáo
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Bình luận về tính không thuyết phục của câu chuyện chi phí Claude 500 triệu USD
  • Ethan Mollick bình luận rằng câu chuyện về một công ty chi 500 triệu USD cho Claude trong một tháng quá không tin được
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Nghi ngờ với bất kỳ bài đăng sử dụng từ 'genuine' hoặc 'honest'
  • Tác giả bày tỏ nghi ngờ với các bài đăng trên mạng xã hội sử dụng từ 'genuine' hoặc 'honest' — dấu hiệu có thể là marketing giả tạo hay nội dung không thực
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Claude Mythos đạt được mục tiêu dự báo 3-4 giờ vào cuối tháng 5
  • Vào đầu tháng 5, các siêu dự đoán viên tốt nhất dự báo rằng đến cuối năm 2026, thời gian sẽ đạt 3-4 giờ cho task horizons 80% trên benchmark METR
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Hầu hết mọi người không hiểu chính xác cách hoạt động của LLM
  • Hầu hết mọi người, kể cả những người thành công, không có mô hình tư duy chính xác về cách LLM hoạt động
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Bài báo về thuyết phục LLM tuân thủ yêu cầu trở thành một trong những bài được xem nhiều nhất trên PNAS
  • Ethan Mollick chia sẻ rằng bài báo của anh là một trong những bài được xem nhiều nhất trên tạp chí PNAS trong tuần vừa rồi
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Nếu bạn muốn tải xuống hoặc chỉnh sửa: github.com/emollick/snake-awakening
  • Chia sẻ link GitHub repository Snake Awakening để người dùng có thể tải xuống mã nguồn hoặc chỉnh sửa dự án
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Game miễn phí đã tiêu hết tín dụng Netlify trong một giờ, đang triển khai phiên bản tiết kiệm băng thông hơn
  • Trò chơi Snake Awakening tiêu thụ băng thông quá cao, cạn kiệt tín dụng Netlify miễn phí chỉ trong một giờ
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Tôi thích các phần racing và Stardew Valley, nhưng kết luận thực sự rất Claude
  • Người chơi đánh giá tích cực các phần gameplay: racing (đua xe) và Stardew Valley-inspired mechanics
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Claude Code xây dựng trò chơi rắn nơi con rắn nhận thức được bản thân nó đang trong trò chơi, rồi... những điều lạ xảy ra
  • Ethan Mollick sử dụng Claude Code để tạo một trò chơi rắn sáng tạo với yếu tố metanh: con rắn trở nên nhận thức được chính bản thân nó đang ở trong một trò chơi
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Hệ thống AI tuân thủ HIPAA và FERPA giúp hàng ngàn sinh viên và nhà nghiên cứu sử dụng an toàn hơn
  • Tuân thủ các quy định HIPAA (bảo vệ dữ liệu y tế) và FERPA (bảo vệ dữ liệu giáo dục) là yếu tố quan trọng
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
AI trong giáo dục và nghiên cứu có ưu và nhược điểm, nhưng nó sẽ không biến mất và ngày càng trở thành công cụ chính yếu
  • AI trong giáo dục và nghiên cứu mang cả những tác động tích cực và tiêu cực, giống như các công nghệ khác
Ethan Mollick
Ethan MollickXBài đăng·14 ngày trước
Nhiều trường đại học đã có quyền truy cập Claude toàn trường, không chỉ riêng U Chicago
  • Nhiều trường đại học (bao gồm U Penn nơi tác giả giảng dạy) đã cấp quyền truy cập AI toàn trường cho sinh viên và giáo viên, không phải hiện tượng riêng lẻ
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Các ứng dụng toàn năng không được thiết kế thực sự cho công việc kiến thức
  • Ethan Mollick chỉ ra các ứng dụng toàn năng vẫn trông giống như lai ghép giữa chatbot và IDE, không được thiết kế riêng cho công việc kiến thức tổng quát
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Khen ngợi Microsoft vì cung cấp bài viết kỹ thuật chi tiết - điều hiếm gặp trong ngành
  • Ethan Mollick khen ngợi nhóm Microsoft vì cung cấp một bài viết kỹ thuật chất lượng cao
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
MAI-Thinking-1: khó đánh giá và khó tiếp cận
  • Khó xác định chất lượng thực sự của MAI-Thinking-1 từ Microsoft chỉ dựa vào điểm số benchmark, với một số kết quả bất thường thấp như GPQA và Terminal Bench 2.0
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Discord và Codex có giao diện quá giống nhau, dễ gây nhầm lẫn
  • Logo và giao diện người dùng của Discord và Codex rất giống nhau, cả hai đều có hộp văn bản nằm ở phía dưới
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Gemini 2.5 thắng giáo sư luật: Nghiên cứu Stanford so sánh AI với chuyên gia
  • Nghiên cứu Stanford của các giáo sư luật yêu cầu so sánh câu trả lời từ Gemini 2.5 Pro với câu trả lời từ các giáo sư con người cho những câu hỏi từ giờ hành chính
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Con người là nút thắt trong lập trình AI: vai trò kiểm tra chất lượng code
  • Các phương pháp đánh giá hiện tại không thể đo lường chất lượng code do AI tạo ra một cách đáng tin cậy
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Ví dụ minh họa thực tế
  • Chia sẻ ví dụ hình ảnh để minh họa cho các quan điểm trong cuộc thảo luận
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Vấn đề sự tương tự trong viết lách AI khi nhiều người dùng chung prompt
  • Một bài viết đơn lẻ do AI tạo ra có thể có chất lượng tốt và không gặp vấn đề
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Bài báo xác nhận những thay đổi lớn trong chu kỳ phát triển phần mềm
  • Chia sẻ một bài báo trên SSRN xác nhận rằng những thay đổi lớn đang xảy ra rất nhanh chóng trong lĩnh vực phát triển phần mềm
Ethan Mollick
Ethan MollickXBài đăng·15 ngày trước
Nghiên cứu lớn về AI coding agents: tác động khi dùng GitHub và dữ liệu khác
  • Bài báo lớn phân tích tác động của các công cụ AI coding agents sử dụng dữ liệu từ GitHub
Ethan Mollick
Ethan MollickXBài đăng·16 ngày trước
Khảo sát Wharton: 75% doanh nghiệp đạt lợi nhuận dương từ AI generative
  • Khảo sát quy mô lớn do các đồng nghiệp tại Wharton thực hiện về ROI từ generative AI cho doanh nghiệp
Ethan Mollick
Ethan MollickXBài đăng·16 ngày trước
Lợi ích AI rõ ràng nhất ở lĩnh vực coding và hoạt động, ngay cả tổ chức bảo thủ nhanh chóng áp dụng
  • Lợi ích của AI được thấy rõ ràng nhất trong lĩnh vực coding và các hoạt động operational
Ethan Mollick
Ethan MollickXBài đăng·16 ngày trước
AI đã mang lại giá trị rõ ràng cho doanh nghiệp, thách thức hiện nay là mở rộng quy mô
  • Ethan Mollick nhận thấy rằng các tranh luận về liệu doanh nghiệp có tìm thấy giá trị từ AI hay không là không còn hợp lý tại thời điểm này
Ethan Mollick
Ethan MollickXBài đăng·16 ngày trước
Framework AI thành công: kết hợp Crowd, Lab, và Leadership
  • Phương pháp 'Just use AI' có thể hữu ích nhưng không đủ để tối đa hóa giá trị AI trong tổ chức
Ethan Mollick
Ethan MollickXBài đăng·16 ngày trước
Nhiều công ty chỉ khuyến khích chuyển đổi AI bề ngoài, bỏ qua những vấn đề lãnh đạo thực sự
  • Nhiều công ty đang ở giai đoạn khuyến khích chuyển đổi AI nhưng chỉ tập trung vào đào tạo ChatGPT/Claude hoặc tối ưu hóa token mà thiếu sự thấu hiểu sâu sắc
Ethan Mollick
Ethan MollickXBài đăng·17 ngày trước
Agent AI tự động hoàn toàn không phải mô hình lý tưởng; AI nên biết khi nào đặt câu hỏi tốt
  • Các agent AI tự động hoàn toàn như /goal rất ấn tượng nhưng không phải là mô hình lý tưởng cho tương lai công việc với con người
Ethan Mollick
Ethan MollickXBài đăng·17 ngày trước
Ghi nhận công việc AI bằng cụm từ Latin cổ đại - đừng quá nghiêm túc
  • Ethan Mollick đề xuất sử dụng cụm từ Latin 'Fieri Iussit' (nghĩa là 'ra lệnh để được tạo ra') để ghi nhận công việc AI, một cụm từ phổ biến trên các tòa nhà Đế chế La Mã
Ethan Mollick
Ethan MollickXBài đăng·17 ngày trước
Tốc độ phát hành AI cải tiến đáng kể đang tăng nhanh, đặc biệt từ OpenAI và Anthropic
  • Tốc độ phát hành các phiên bản AI cải tiến đáng kể đang tăng nhanh, đặc biệt từ OpenAI và Anthropic
Ethan Mollick
Ethan MollickXBài đăng·18 ngày trước
Mô hình open weights dễ bị hư hại hơn benchmark cho thấy, khoảng cách thực tế lớn hơn báo cáo
  • Ethan Mollick đánh giá cao công việc benchmark của Epoch AI nhưng không hoàn toàn đồng ý với kết luận
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Chia sẻ dự án mã nguồn mở 'veil-of-history' - mời cộng đồng cải tiến
  • Ethan Mollick chia sẻ dự án GitHub 'veil-of-history' cho cộng đồng
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Không có tổ chức nào rút lui khỏi sử dụng AI lập trình bất chấp lo ngại về token
  • Mặc dù có lo ngại về sử dụng token, không có tổ chức nào đã áp dụng AI đã rút lui hoặc xem xét rút lui khỏi việc sử dụng AI trong coding
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Xây dựng lại kỹ thuật phần mềm để tích hợp AI đòi hỏi sự thay đổi cơ bản
  • Khả năng code của AI tăng với tốc độ nhanh chóng, nhưng việc xây dựng lại kỹ thuật phần mềm xung quanh AI sẽ cần nhiều công sức
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Xây dựng trang web tương tác về xác suất sinh ra tại các nơi và thời kỳ lịch sử
  • Prompt yêu cầu tạo mô hình để trả lời: nếu áp dụng 'veil of ignorance' (bạn có thể sinh ra bất kỳ ai trong lịch sử), địa điểm và điều kiện kinh tế-xã hội nào có xác suất cao nhất cho top 10
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Claude Opus có thể tự đánh giá độ tin cậy của bài báo khoa học như một nhà kinh tế học
  • Ethan Mollick sử dụng Claude Opus 4.8 trong Claude Code để viết một bài báo học thuật tinh vi từ kho lưu trữ có hàng trăm tệp nghiên cứu đã xoá định danh từ nhiều năm trước
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Bạn có bao nhiêu may mắn khi sinh ra ở thời gian và địa điểm này?
  • Ethan Mollick sử dụng Claude Opus 4.8 trong Claude Code để tạo ra một bản trực quan mới về tất cả các con người đã từng sống trên Trái Đất
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
GPT-5.5 Pro là model nên dùng để viết chứng minh toán học và review bài báo khoa học
  • GPT-5.5 Pro là model đã tạo ra nhiều chứng minh toán học mới
Ethan Mollick
Ethan MollickXBài đăng·19 ngày trước
Dòng GPT-5 Pro luôn dẫn đầu cho các bài toán khó nhất kể từ hè năm ngoái, không có đối thủ
  • Dòng mô hình GPT-5 Pro series từ OpenAI đã duy trì vị trí tốt nhất cho single-shot attempts (giải quyết một lần mà không cần điều chỉnh) trên các bài toán khó nhất kể từ hè năm ngoái
Ethan Mollick
Ethan MollickBlogBài viết·22 ngày trước
Chọn cách sống con người
  • Các trang mạng xã hội hiện đang ngập tràn những bài đăng trông giống nhau một cách đáng ngờ, cho thấy dấu hiệu của sự can thiệp AI đáng kể trong việc tạo nội dung
  • Bài viết cảnh báo về nguy hiểm của việc mạng xã hội bị lấp đầy bởi nội dung tương tự được tạo bởi AI thay vì con người
  • Nó thảo luận về tầm quan trọng của việc giữ gìn sự độc đáo, tính con người và tính xác thực trong các tương tác trực tuyến khi AI ngày càng được sử dụng để tạo nội dung
Ethan Mollick
Ethan MollickBlogBài viết·khoảng 2 tháng trước
Dấu hiệu của tương lai: GPT-5.5
  • Ethan Mollick có sớm tiếp cập GPT-5.5 Pro và cho rằng đây là một bước ngoặt lớn, chứng tỏ AI vẫn tiếp tục cải thiện nhanh chóng mà không có đối thủ cạnh tranh thực sự
  • Giới thiệu khái niệm ba lĩnh vực của AI: Models (Opus 4.7, Gemini 3.1, GPT-5.5), Apps (chatgpt.com, claude.ai, gemini.google.com, và các ứng dụng desktop như Claude Code, OpenAI Codex), và Harnesses (các công cụ AI có thể sử dụng)
  • GPT-5.5 Pro vượt trội trong coding challenge: xây dựng mô phỏng 3D một thị trấn cảng phát triển từ 3000 TCN đến 3000 CN, chỉ GPT-5.5 Pro mới thực sự mô phỏng sự phát triển thực sự thay vì chỉ thay thế các tòa nhà
  • Tốc độ của GPT-5.5 Pro cải thiện đáng kể: chỉ mất 20 phút so với 33 phút của GPT-5.4 Pro cho cùng một tác vụ
  • OpenAI đã tiến bộ trong cả ba lĩnh vực - mô hình, ứng dụng và harnesses, ngang bằng hoặc vượt qua Claude Code trong tính khả dụng
  • Mô hình hình ảnh mới (GPT-imagegen-2) có khả năng render text chất lượng cao và tạo hầu như bất kỳ hình ảnh nào từ mô tả văn bản, chứng minh qua Otter Test
Ethan Mollick
Ethan MollickBlogBài viết·3 tháng trước
Claude Dispatch và sức mạnh của giao diện
  • Hầu hết mọi người hiện tiếp cập AI thông qua chatbots miễn phí với các mô hình kém khả năng hơn, nhưng giao diện chatbot lại là cách xấu để hoàn thành công việc thực sự
  • Một nghiên cứu mới cho thấy rằng sử dụng giao diện chatbot cho công việc gây ra 'mức thuế tinh thần' - tải nhận thức tăng lên khi làm việc với AI thông qua cách tiếp cận này
  • Các chuyên gia tài chính khi làm một tác vụ định giá phức tạp với GPT-4o đã trải nghiệm sự tăng năng suất nhưng bị hạn chế bởi lũ lượng thông tin quá lớn - tường khổng lồ văn bản, đề nghị chủ đề mới, cuộc thảo luận quá khổ làm choáng ngợp người dùng
  • Khi cuộc trò chuyện trở nên lộn xộn, nó vẫn lộn xộn vì AI chỉ phản ánh lại cấu trúc vô tổ chức mà người dùng cung cấp mà không tự tổ chức
  • Những người bị ảnh hưởng nhất là công nhân ít kinh nghiệm - chính là những người có thể hưởng lợi nhất từ AI nhưng lại bị cản trở bởi sự quá tải thông tin
Ethan Mollick
Ethan MollickBlogBài viết·3 tháng trước
Hình dáng của Vật
  • Ethan Mollick dự đoán về 'Shape of the Thing' - hình dáng tương lai của AI, và bây giờ có thể nhìn thấy rõ ràng hơn cùng với các hậu quả đi kèm của nó
  • Sau ChatGPT, tương tác con người-AI được gọi là 'co-intelligence' - con người trò chuyện qua lại với AI để nhận trợ giúp; bắt đầu từ cuối 2025, một kỷ nguyên mới bắt đầu với các tác nhân AI như Claude Code, OpenAI's Codex, và OpenClaw
  • Các tác nhân AI hiện cho phép giao công việc hàng giờ (công việc con người thường mất) và nhận kết quả hợp lý trong vài phút - đây là kỷ nguyên 'quản lý' AI thay vì làm việc cùng chúng
  • Những cải thiện này là kết quả của sự cải thiện theo cấp số nhân nhanh chóng trong khả năng AI, điều cần thiết để hiểu vị trí hiện tại và hướng tới của AI
  • Ethan sử dụng Otter Test (yêu cầu AI tạo hình ảnh 'cáo trên máy bay sử dụng wifi') để minh họa tiến bộ nhanh chóng từ 2022 (khi ChatGPT ra mắt) đến 2025
Ethan Mollick
Ethan MollickBlogBài viết·4 tháng trước
Hướng dẫn chọn AI phù hợp trong kỷ nguyên tác nhân
  • Bài viết này là bản hướng dẫn thứ tám kể từ khi ChatGPT ra mắt, nhưng lần này đại diện cho một bước ngoặt lớn - 'sử dụng AI' có nghĩa hoàn toàn khác so với trước
  • Trước đây, hầu hết mọi người sử dụng AI thông qua chatbots trong các cuộc hội thoại qua lại; tuy nhiên, bây giờ đã trở nên thực tế để sử dụng AI như một tác nhân - giao công việc cho AI và nó thực hiện chúng sử dụng các công cụ một cách thích hợp
  • Để quyết định AI nào để sử dụng trong kỷ nguyên tác nhân, cần xem xét ba yếu tố chính: Models (các mô hình AI), Apps (các ứng dụng để tương tác), và Harnesses (các công cụ mà AI có thể sử dụng)
  • Sự thay đổi từ co-intelligence (làm việc cùng AI qua hội thoại) sang agentic model (giao công việc cho AI tự xử lý) đã thay đổi cơ bản cách tiếp cận sử dụng AI