Nhớ lại Tết Nguyên Đán năm Thìn, DeepSeek bùng nổ đã từng khiến các mô hình lớn khác trong nước “đau đầu”. Năm nay, các tập đoàn công nghệ lớn và các công ty mô hình lớn nội địa đều kỳ vọng tái hiện kỳ tích của DeepSeek, đồng loạt công bố ra mắt sản phẩm mới trước Tết, xem đây là sân chơi luyện tập tốt nhất cho năm mới.
Ngày 12 tháng 2, công ty mô hình lớn tại Thượng Hải MiniMax chính thức ra mắt thế hệ mô hình văn bản mới MiniMax M2.5 (gọi tắt là “M2.5”) trên MiniMax Agent, và ngày 13 tháng 2 mở mã nguồn toàn cầu, hỗ trợ triển khai cục bộ. Sau đó, người dùng toàn cầu nhanh chóng xây dựng hơn 10.000 “chuyên gia” trên MiniMax Agent, số lượng vẫn đang tăng nhanh.
M2.5 được gọi là “quân bài vua” vì hiệu năng gần như sánh ngang với mô hình Claude Opus 4.6 do công ty AI Mỹ Anthropic phát triển, nhưng giá cả lại khiến người ta kinh ngạc, ngay cả Peter Steinberger, cha đẻ của dự án AI cá nhân mã nguồn mở OpenClaw, cũng không khỏi cảm thán.
Peter Steinberger chia sẻ và đánh giá về M2.5, hiệu năng ngang bằng Claude Opus 4.6, giá rẻ hơn 20 lần.
M2.5 được định vị là “mô hình Agent nguyên bản cho sản xuất”, có khả năng tự viết mã, gọi công cụ, phân tích dữ liệu, tạo báo cáo.
Trong bảng xếp hạng SWE-Bench Verified dành cho lập trình cứng nhất, M2.5 đạt điểm cao 80.2%, chỉ kém chút ít so với Claude Opus 4.6. Trong nhiệm vụ đa ngôn ngữ Multi-SWE-Bench, M2.5 vượt qua Claude Opus 4.6 để đứng đầu.
Trong các tình huống làm việc văn phòng, M2.5 thể hiện xuất sắc trong Word, PPT, Excel, mô hình tài chính, và trong khung đánh giá GDPval-MM so sánh với các mô hình chính, đạt tỷ lệ thắng trung bình 59%. Bảng tính do M2.5 tạo ra rõ ràng, phân biệt rõ ràng giữa bìa, nguồn dữ liệu và dữ liệu chi tiết, định dạng gọn gàng, như thể do nhân viên mắc chứng OCD làm ra.
M2.5 không hề kém cạnh các mô hình chính của Mỹ.
Điều quan trọng là, M2.5 có khả năng “làm việc nặng” với tham số kích hoạt chỉ 10B, là mô hình hàng đầu trong cùng phân khúc toàn cầu về kích cỡ nhỏ nhất.
Vừa “có trí tuệ”, M2.5 còn sở hữu điểm mạnh giải quyết hai vấn đề lớn của mô hình là “đắt” và “chậm”.
M2.5 đạt tốc độ suy luận lên tới 100 TPS (giao dịch mỗi giây), gấp khoảng hai lần các mô hình chính hiện nay; giá đầu vào khoảng 0,3 USD/triệu Token (đơn vị cơ bản của đầu vào và đầu ra mô hình), đầu ra khoảng 2,4 USD/triệu Token. Tính theo 100 Token/giây, chỉ 1 USD có thể duy trì hoạt động liên tục của trí tuệ nhân tạo trong một giờ, gọi là “giá rẻ như rau”.
Trong thời đại thiếu hụt năng lực tính toán, khả năng đổi mới đột phá để giữ cho mô hình không giảm trí tuệ, không lag và có trải nghiệm tốt chính là bí quyết giúp MiniMax duy trì vị trí trong cuộc đua các mô hình lớn.
Điều thú vị là, công ty trí tuệ nhân tạo Zhizhi AI, đã niêm yết trên Sở Giao dịch Chứng khoán Hong Kong trước MiniMax một ngày, cũng mới ra mắt Zhizhi GLM-5, cùng đối đầu Claude Opus 4.6. Claude Opus 4.6 thực sự bị hai mô hình lớn trong nước từ Bắc vào Nam “kẹp chặt”.
Zhizhi GLM-5 đạt thành tích xuất sắc trong khả năng lập trình và trí tuệ nhân tạo. Một số nhà phát triển sau khi dùng thử cho rằng, GLM-5 đã gần như đạt đến trải nghiệm sử dụng trong các tình huống lập trình thực tế của Claude, trong khi khả năng lập trình của Claude vẫn đứng đầu ngành. Trong bảng xếp hạng uy tín Artificial Analysis toàn cầu, GLM-5 xếp thứ tư toàn cầu, đứng đầu về mã nguồn mở.
Zhizhi mô tả GLM-5 như là “kiến trúc sư hệ thống”, nghĩa là, mô hình AI lớn trong tương lai không chỉ dừng lại ở việc viết mã để hoàn thành một chức năng, mà còn xây dựng hệ thống như kỹ sư, thậm chí phân công nhiệm vụ cho các trí tuệ nhân tạo khác nhau.
Trong thử nghiệm lập trình đại lý, Zhizhi GLM-5 nhỉnh hơn Claude một chút.
Ngoài ra, ngày 10 tháng 2, Qianwen cũng ra mắt mô hình tạo hình ảnh mới Qwen-Image 2.0, hỗ trợ lệnh dài tới 1000 từ, khả năng suy luận cũng mạnh hơn.
Gần như cùng thời điểm, ByteDance cũng ra mắt mô hình cùng loại Seedream 5.0, khả năng sinh ảnh từ văn bản lại tiến bộ một bước. “Trước đây, khi dùng AI tạo hình ảnh, có hạn chế về khả năng suy luận, chữ Hán trong ảnh thường bị sai hoặc thành mã lộn xộn,” nhóm phát triển Qianwen cho biết, với khả năng hiểu lệnh và suy luận nâng cao, “bài toán chữ Hán trong ảnh do AI tạo ra sẽ trở thành quá khứ.”
Ngoài các mô hình đa phương tiện như tạo hình ảnh, video từ văn bản, các mô hình ngôn ngữ lớn cơ bản cũng có nhiều tiến bộ. Gần đây, DeepSeek âm thầm ra mắt một mô hình mới, dù không phải V4 như mong đợi, nhưng cũng mang lại bất ngờ.
Mô hình cập nhật này dù không có khả năng nhận dạng đa phương tiện, nhưng nâng cao khả năng xử lý ngữ cảnh lên tới 1 triệu từ, tương đương có thể đọc hiểu toàn bộ “Tam Thái” với khoảng 90 vạn chữ trong một lần. Một nhà phát triển trí tuệ nhân tạo nói: “Hiện tại, rất ít mô hình hỗ trợ hiểu ngữ cảnh tới mức triệu từ, như Gemini của Google hay Claude của Anthropic, lần này DeepSeek cũng đã ‘lên tàu’.”
Theo nguồn tin, làn sóng cập nhật mô hình lớn vẫn chưa dừng lại, các mô hình flagship như Doubao 2.0, Qianwen 3.5 sẽ sớm ra mắt.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Mô hình lớn của Mỹ bị Trung Quốc bao vây từ Bắc vào Nam, AI nội địa tranh giành mùa Tết Nguyên Đán, muốn tái hiện kỳ tích của DeepSeek
Nhớ lại Tết Nguyên Đán năm Thìn, DeepSeek bùng nổ đã từng khiến các mô hình lớn khác trong nước “đau đầu”. Năm nay, các tập đoàn công nghệ lớn và các công ty mô hình lớn nội địa đều kỳ vọng tái hiện kỳ tích của DeepSeek, đồng loạt công bố ra mắt sản phẩm mới trước Tết, xem đây là sân chơi luyện tập tốt nhất cho năm mới.
Ngày 12 tháng 2, công ty mô hình lớn tại Thượng Hải MiniMax chính thức ra mắt thế hệ mô hình văn bản mới MiniMax M2.5 (gọi tắt là “M2.5”) trên MiniMax Agent, và ngày 13 tháng 2 mở mã nguồn toàn cầu, hỗ trợ triển khai cục bộ. Sau đó, người dùng toàn cầu nhanh chóng xây dựng hơn 10.000 “chuyên gia” trên MiniMax Agent, số lượng vẫn đang tăng nhanh.
M2.5 được gọi là “quân bài vua” vì hiệu năng gần như sánh ngang với mô hình Claude Opus 4.6 do công ty AI Mỹ Anthropic phát triển, nhưng giá cả lại khiến người ta kinh ngạc, ngay cả Peter Steinberger, cha đẻ của dự án AI cá nhân mã nguồn mở OpenClaw, cũng không khỏi cảm thán.
Peter Steinberger chia sẻ và đánh giá về M2.5, hiệu năng ngang bằng Claude Opus 4.6, giá rẻ hơn 20 lần.
M2.5 được định vị là “mô hình Agent nguyên bản cho sản xuất”, có khả năng tự viết mã, gọi công cụ, phân tích dữ liệu, tạo báo cáo.
Trong bảng xếp hạng SWE-Bench Verified dành cho lập trình cứng nhất, M2.5 đạt điểm cao 80.2%, chỉ kém chút ít so với Claude Opus 4.6. Trong nhiệm vụ đa ngôn ngữ Multi-SWE-Bench, M2.5 vượt qua Claude Opus 4.6 để đứng đầu.
Trong các tình huống làm việc văn phòng, M2.5 thể hiện xuất sắc trong Word, PPT, Excel, mô hình tài chính, và trong khung đánh giá GDPval-MM so sánh với các mô hình chính, đạt tỷ lệ thắng trung bình 59%. Bảng tính do M2.5 tạo ra rõ ràng, phân biệt rõ ràng giữa bìa, nguồn dữ liệu và dữ liệu chi tiết, định dạng gọn gàng, như thể do nhân viên mắc chứng OCD làm ra.
M2.5 không hề kém cạnh các mô hình chính của Mỹ.
Điều quan trọng là, M2.5 có khả năng “làm việc nặng” với tham số kích hoạt chỉ 10B, là mô hình hàng đầu trong cùng phân khúc toàn cầu về kích cỡ nhỏ nhất.
Vừa “có trí tuệ”, M2.5 còn sở hữu điểm mạnh giải quyết hai vấn đề lớn của mô hình là “đắt” và “chậm”.
M2.5 đạt tốc độ suy luận lên tới 100 TPS (giao dịch mỗi giây), gấp khoảng hai lần các mô hình chính hiện nay; giá đầu vào khoảng 0,3 USD/triệu Token (đơn vị cơ bản của đầu vào và đầu ra mô hình), đầu ra khoảng 2,4 USD/triệu Token. Tính theo 100 Token/giây, chỉ 1 USD có thể duy trì hoạt động liên tục của trí tuệ nhân tạo trong một giờ, gọi là “giá rẻ như rau”.
Trong thời đại thiếu hụt năng lực tính toán, khả năng đổi mới đột phá để giữ cho mô hình không giảm trí tuệ, không lag và có trải nghiệm tốt chính là bí quyết giúp MiniMax duy trì vị trí trong cuộc đua các mô hình lớn.
Điều thú vị là, công ty trí tuệ nhân tạo Zhizhi AI, đã niêm yết trên Sở Giao dịch Chứng khoán Hong Kong trước MiniMax một ngày, cũng mới ra mắt Zhizhi GLM-5, cùng đối đầu Claude Opus 4.6. Claude Opus 4.6 thực sự bị hai mô hình lớn trong nước từ Bắc vào Nam “kẹp chặt”.
Zhizhi GLM-5 đạt thành tích xuất sắc trong khả năng lập trình và trí tuệ nhân tạo. Một số nhà phát triển sau khi dùng thử cho rằng, GLM-5 đã gần như đạt đến trải nghiệm sử dụng trong các tình huống lập trình thực tế của Claude, trong khi khả năng lập trình của Claude vẫn đứng đầu ngành. Trong bảng xếp hạng uy tín Artificial Analysis toàn cầu, GLM-5 xếp thứ tư toàn cầu, đứng đầu về mã nguồn mở.
Zhizhi mô tả GLM-5 như là “kiến trúc sư hệ thống”, nghĩa là, mô hình AI lớn trong tương lai không chỉ dừng lại ở việc viết mã để hoàn thành một chức năng, mà còn xây dựng hệ thống như kỹ sư, thậm chí phân công nhiệm vụ cho các trí tuệ nhân tạo khác nhau.
Trong thử nghiệm lập trình đại lý, Zhizhi GLM-5 nhỉnh hơn Claude một chút.
Ngoài ra, ngày 10 tháng 2, Qianwen cũng ra mắt mô hình tạo hình ảnh mới Qwen-Image 2.0, hỗ trợ lệnh dài tới 1000 từ, khả năng suy luận cũng mạnh hơn.
Gần như cùng thời điểm, ByteDance cũng ra mắt mô hình cùng loại Seedream 5.0, khả năng sinh ảnh từ văn bản lại tiến bộ một bước. “Trước đây, khi dùng AI tạo hình ảnh, có hạn chế về khả năng suy luận, chữ Hán trong ảnh thường bị sai hoặc thành mã lộn xộn,” nhóm phát triển Qianwen cho biết, với khả năng hiểu lệnh và suy luận nâng cao, “bài toán chữ Hán trong ảnh do AI tạo ra sẽ trở thành quá khứ.”
Ngoài các mô hình đa phương tiện như tạo hình ảnh, video từ văn bản, các mô hình ngôn ngữ lớn cơ bản cũng có nhiều tiến bộ. Gần đây, DeepSeek âm thầm ra mắt một mô hình mới, dù không phải V4 như mong đợi, nhưng cũng mang lại bất ngờ.
Mô hình cập nhật này dù không có khả năng nhận dạng đa phương tiện, nhưng nâng cao khả năng xử lý ngữ cảnh lên tới 1 triệu từ, tương đương có thể đọc hiểu toàn bộ “Tam Thái” với khoảng 90 vạn chữ trong một lần. Một nhà phát triển trí tuệ nhân tạo nói: “Hiện tại, rất ít mô hình hỗ trợ hiểu ngữ cảnh tới mức triệu từ, như Gemini của Google hay Claude của Anthropic, lần này DeepSeek cũng đã ‘lên tàu’.”
Theo nguồn tin, làn sóng cập nhật mô hình lớn vẫn chưa dừng lại, các mô hình flagship như Doubao 2.0, Qianwen 3.5 sẽ sớm ra mắt.