Tôi là giám đốc chiến lược của Cloudera và đây là lý do tại sao ngân sách AI $1 tỷ của bạn vừa trở nên lỗi thời

AI đang bước vào một giai đoạn mới: kỷ nguyên 2.0 của nó. AI 1.0 được xây dựng dựa trên dữ liệu phi cấu trúc, áp dụng học máy chung cho các vấn đề kinh doanh rộng lớn. Nó đánh dấu sự chuyển đổi từ AI thử nghiệm sang các hệ thống vận hành sơ khai và có tính chất đại lý, dựa trên niềm tin rằng các mô hình lớn hơn sẽ tự nhiên mang lại kết quả mạnh mẽ nhất. Khái niệm này được củng cố bởi các nhà cung cấp hạ tầng siêu lớn cạnh tranh xây dựng các mô hình biên lớn nhất, tạo ra cuộc chạy đua vũ trang thúc đẩy các đột phá nhưng cũng gây ra yêu cầu tính toán không bền vững và chi phí hạ tầng ngày càng tăng.

Video đề xuất


AI 2.0 khác biệt và thách thức niềm tin đó khi các mô hình lớn hơn thực tế chứng minh ít có giá trị hơn nhiều. Thay vì mô hình hóa ngôn ngữ hoặc xác suất thống kê, AI 2.0 tập trung vào mô hình hóa các động thái của thế giới thực. Nó dựa vào học máy dựa trên vật lý – các mô hình chính xác, dựa trên mô phỏng, dựa trên các phương trình vi phân nhưng được tăng tốc bởi AI. Những mô hình này không tạo ra ảo tưởng; chúng tính toán và dự đoán trong giới hạn của hoạt động thực tế, khiến chúng phù hợp hơn nhiều cho môi trường sản xuất. Sự chuyển đổi này cũng nhấn mạnh rằng các doanh nghiệp không thể chỉ dựa vào kinh tế của các nhà cung cấp hạ tầng siêu lớn nữa. Việc huấn luyện các mô hình quy mô biên đòi hỏi lượng tính toán chỉ có một số nhà cung cấp có thể hỗ trợ, thúc đẩy các tổ chức phải xem xét lại liệu “lớn hơn” có thực sự khả thi, chứ đừng nói đến tối ưu, cho các trường hợp sử dụng của họ.

Cuối cùng, đặc điểm nổi bật của AI 2.0 không phải là quy mô, mà là sự kiểm soát. Chúng ta đang hướng tới các hệ thống AI biết khi nào nên dừng suy nghĩ. Đây là các mô hình được thiết kế để chính xác, tiết kiệm chi phí và có lý luận vững chắc thay vì tính toán vô tận.

Chuyển đổi từ AI 1.0 sang AI 2.0

AI 1.0 chủ yếu dựa trên suy luận, và bị chi phối bởi thử nghiệm và các bằng chứng khả thi, nơi các tổ chức tối ưu hóa cho các bản trình diễn và điểm chuẩn hơn là kết quả vận hành thực tế. Câu hỏi chính không phải là AI có thể mở rộng về mặt kinh tế hoặc đáng tin cậy hay không; mà đơn giản là liệu nó có thể hoạt động được hay không.

Trong giai đoạn này, nhiều nhà lãnh đạo rơi vào cái gọi là “bẫy độ chính xác,” nơi họ tối ưu hóa chỉ cho độ chính xác, thay vì tính toán hoặc nhận thức ngữ cảnh. Các mô hình trông có vẻ mạnh trong môi trường kiểm soát cuối cùng lại thất bại khi triển khai thực tế vì chúng quá chậm so với yêu cầu thực tế hoặc quá đắt để mở rộng với các mô hình kinh tế lành mạnh. Phản ứng tự nhiên là bắt đầu với mô hình lớn nhất có thể, giả định rằng việc thích nghi sẽ tự nhiên cải thiện hiệu suất.

AI 2.0 định hình lại cách suy nghĩ này. Các nhà lãnh đạo giờ đây phải chịu trách nhiệm về ROI có thể đo lường được, chứ không phải các bản trình diễn hoặc điểm chuẩn. Trong AI 2.0, chúng ta cần dừng việc huấn luyện mô hình để biết mọi thứ và thay vào đó huấn luyện các mô hình AI để mô phỏng những gì thực sự quan trọng. Đây là một mô hình chuyên biệt hơn, nơi mục tiêu là học hỏi và hoàn thiện một hoặc nhiều khả năng thay vì đuổi theo khả năng tổng quát vì chính nó.

Trong AI 2.0, mọi ngành công nghiệp – từ chăm sóc sức khỏe đến sản xuất đến dịch vụ tài chính – sẽ có khả năng xây dựng các mô hình nhỏ hơn, chuyên ngành, mô phỏng các vật lý, giới hạn và môi trường riêng của họ. Nó tương tự như chuyển từ sản xuất ô tô hàng loạt sang lắp ráp tùy chỉnh: mọi người sẽ có thể “tự chế xe của riêng mình” vì sản xuất không còn bị chi phối bởi quy mô kinh tế nữa. Trong chăm sóc sức khỏe, ví dụ, các mô hình nhỏ dựa trên vật lý có thể mô phỏng tiến trình bệnh hoặc phản ứng điều trị mà không dựa vào các hệ thống tổng quát lớn. Điều này loại bỏ rủi ro ảo tưởng và tăng độ tin cậy trong các quy trình an toàn quan trọng.

Hơn nữa, động lực của các nhà cung cấp hạ tầng siêu lớn cũng đang thay đổi. Thay vì chạy mọi thứ qua các mô hình tập trung khổng lồ, các doanh nghiệp phân phối trí tuệ bằng cách kết hợp các mô hình nền tảng với các mô hình ngôn ngữ nhỏ, giảm phụ thuộc vào các nhà cung cấp hạ tầng siêu lớn và tối ưu hóa hiệu suất cho các môi trường địa phương cụ thể.

Sự chuyển đổi này không chỉ mang tính kỹ thuật mà còn mang tính kinh tế và vận hành.

Chìa khóa thành công: Biết khi nào nên “dừng suy nghĩ”

Trong môi trường doanh nghiệp, “suy nghĩ” có chi phí thực sự. Thêm tham số hiếm khi mang lại kết quả tốt hơn cho hầu hết các khối lượng công việc. Đối với nhiều ứng dụng, các mô hình như GPT-5 là quá mạnh, đắt đỏ và chậm, dẫn đến việc triển khai bị đình trệ và các trường hợp sử dụng bị hạn chế.

Nền tảng của AI 2.0 là trí tuệ nhận thức giới hạn. Các mô hình thế giới cho phép hệ thống xây dựng biểu diễn đặc thù cho nhiệm vụ của thực tại, giúp hệ thống lý luận dựa trên những gì thực sự quan trọng thay vì tính toán lại hiểu biết từ đầu ở mỗi bước. Một cuộc thảo luận tương tự đã nổ ra tại Davos năm nay khi nhà tiên phong AI Yann LeCun phát biểu rằng chúng ta “không bao giờ đạt được trí tuệ cấp con người bằng cách huấn luyện các mô hình ngôn ngữ lớn hoặc chỉ huấn luyện trên văn bản. Chúng ta cần thế giới thực.” Quan điểm của ông là tạo mã là một chuyện, nhưng đạt đến độ phức tạp nhận thức của, ví dụ, ô tô tự lái cấp độ năm, còn xa mới có thể làm được bằng các mô hình lớn ngày nay.

Tất cả những điều này dẫn đến việc các mô hình như GPT-5 không được huấn luyện dựa trên các tình huống thực tế. Trong khi các mô hình nhỏ, chuyên biệt và được tinh chỉnh hiệu quả có thể đạt độ chính xác đủ nhanh hơn, cung cấp độ trễ thấp đáng kể, chạy với chi phí thấp hơn nhiều và mở rộng dựa trên nhu cầu thực tế. Trong thực tế, AI không nên suy nghĩ vô tận và chắc chắn không thể vận hành theo kiến trúc “một mô hình để trị tất cả.” Nó nên hoạt động trong một phạm vi quyết định xác định. Mô hình mới nổi bao gồm các kiến trúc phân phối nhiệm vụ tới mô hình đơn giản nhất có hiệu quả, chỉ nâng cấp khi cần thiết và liên tục cân bằng giữa độ chính xác, tốc độ và chi phí.

Nói cách khác, kích thước mô hình là chỉ số nguy hiểm nhất trên bảng điều khiển. Đó là di sản của thời kỳ 1.0, gây nhầm lẫn giữa khả năng và năng lực. Điều thực sự quan trọng là chi phí cho mỗi vấn đề được giải quyết: hệ thống có thể cung cấp kết quả chính xác, đáng tin cậy trong giới hạn hoạt động thực tế như thế nào.

Các doanh nghiệp sẽ không chiến thắng bằng cách chạy các mô hình lớn nhất; họ sẽ chiến thắng bằng cách chạy các mô hình tiết kiệm nhất, giải quyết vấn đề quy mô lớn.

Thị trường nhân tài trong AI 2.0

Nhân lực là một biến số quan trọng khác của AI 2.0, sẽ thay đổi đáng kể động thái của ngành AI, vì thành công đòi hỏi một lực lượng lao động có thể xây dựng các mô hình phù hợp với các ứng dụng có biến động cao. Hiện tại, chỉ một tỷ lệ nhỏ nhân tài toàn cầu có thể phát triển các mô hình nền tảng, và phần lớn trong số đó tập trung tại một số trung tâm công nghệ toàn cầu.

Hiện tại, các nhà nghiên cứu là những siêu sao và được trả lương xứng đáng vì họ đang rất được săn đón. Nhưng chuyển đổi sang AI 2.0 đòi hỏi một sự chuyển đổi từ phù thủy sang kỹ thuật viên: những chuyên gia có thể tinh chỉnh, bảo trì và tối ưu hóa các mô hình để giải quyết các vấn đề thực tế cụ thể. Sự chuyển đổi nhân lực này sẽ là một trong những cơ hội arbitrage lớn nhất của giai đoạn tiếp theo của AI. Nếu AI thực sự muốn trở nên dân chủ, các doanh nghiệp cần có nhân tài ở mọi nơi hiểu rõ về vật lý của các ngành như y học, sản xuất, logistics, v.v., và có thể chuyển đổi kiến thức đó thành các hệ thống AI chuyên biệt, có thể sử dụng được.

Vậy điều này ảnh hưởng như thế nào đến các lộ trình AI năm 2026? Nó có nghĩa là chúng ta cần làm việc thông minh hơn, chứ không phải chăm chỉ hơn. Ngân sách và chiến lược cần chuyển hướng sang hiệu quả, đồng thời chú trọng khả năng sử dụng, ưu tiên các mô hình nhỏ, tối ưu, kiến trúc lai và đa mô hình, và các hệ thống được thiết kế để bền vững ở quy mô lớn. Các chỉ số thành công sẽ chuyển từ kích thước mô hình sang chi phí cho mỗi kết quả, thời gian ra quyết định và tác động thực tế rõ ràng.

AI 2.0 không phải là bỏ qua các mô hình lớn. Nó là sử dụng chúng một cách có chủ đích và tiết kiệm. Các tổ chức áp dụng các phương pháp này sẽ tiến nhanh hơn, tiêu ít hơn và đạt được nhiều hơn so với những ai vẫn chạy theo quy mô brute-force.

Ý kiến trong các bài bình luận của Fortune.com chỉ phản ánh quan điểm của tác giả và không nhất thiết phản ánh quan điểm và niềm tin của Fortune.

Tham gia cùng chúng tôi tại Hội nghị Đổi mới Nơi làm việc Fortune vào ngày 19–20 tháng 5 năm 2026 tại Atlanta. Kỷ nguyên mới của đổi mới nơi làm việc đã bắt đầu — và sách lược cũ đang được viết lại. Tại sự kiện độc quyền, năng lượng cao này, các nhà lãnh đạo sáng tạo nhất thế giới sẽ tụ họp để khám phá cách AI, nhân loại và chiến lược hội tụ để định hình lại, một lần nữa, tương lai của công việc. Đăng ký ngay.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim