Dòng MiMo-V2.5 của Xiaomi ra mắt mã nguồn mở: 1T tham số, hiệu quả token vượt trội so với GPT-5.4

Tin cổng, ngày 27 tháng 4 — Nhóm MiMo của Xiaomi đã phát hành mã nguồn mở cho dòng mô hình ngôn ngữ lớn MiMo-V2.5 theo giấy phép MIT, hỗ trợ triển khai thương mại, huấn luyện tiếp tục và tinh chỉnh. Cả hai mô hình đều có cửa sổ ngữ cảnh 1 triệu token. MiMo-V2.5-Pro là mô hình mixture-of-experts văn bản thuần (MoE) với tổng cộng 1,02 nghìn tỷ tham số và 42Bỷ tham số hoạt động, trong khi MiMo-V2.5 là mô hình đa phương thức gốc với tổng cộng 1Mỷ tham số và 310Bỷ tham số hoạt động, hỗ trợ hiểu văn bản, hình ảnh, video và âm thanh.

MiMo-V2.5-Pro nhắm đến các tác vụ tác nhân phức tạp và lập trình. Trong các benchmark ClawEval, nó đạt 64% Pass@3 trong khi tiêu thụ khoảng 70.000 token cho mỗi quỹ đạo tác vụ—ít hơn 40% đến 60% token so với Claude Opus, Gemini 3.1 Pro và GPT-5.4. Mô hình đạt 78,9 trên SWE-bench Verified. Trong một bản demo, V2.5-Pro tự độc lập triển khai hoàn chỉnh bộ biên dịch SysY-to-RISC-V cho một dự án môn học của Đại học Bắc Kinh trong 4,3 giờ với 672 lần gọi công cụ, đạt điểm tuyệt đối 233/233 trên các tập kiểm thử ẩn.

MiMo-V2.5 được thiết kế cho các kịch bản tác nhân đa phương thức, được trang bị bộ mã hóa tầm nhìn chuyên dụng (729 triệu tham số) và bộ mã hóa âm thanh (261 triệu tham số), đạt 62,3 trên phân tập tổng quát Claw-Eval. Cả hai mô hình đều sử dụng kiến trúc lai kết hợp cơ chế chú ý cửa sổ trượt (SWA) và chú ý toàn cục (GA), đi kèm module dự đoán đa token 3 lớp (MTP) để tăng tốc suy luận. Trọng số mô hình có sẵn trên Hugging Face.

Cùng với bản phát hành mã nguồn mở, nhóm MiMo đã ra mắt “Chương trình ưu đãi Orbit Quadrillion Token Creator Incentive Program”, cung cấp 100 nghìn tỷ token miễn phí trong 30 ngày cho người dùng trên toàn cầu. Các nhà phát triển cá nhân, đội nhóm và doanh nghiệp có thể đăng ký thông qua trang chương trình với chu kỳ đánh giá khoảng 3 ngày làm việc; các lợi ích được phê duyệt sẽ được phân phối dưới dạng Token Plans hoặc tín dụng trực tiếp, tương thích với các công cụ như Claude Code và Cursor.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

DeepSeek Tăng Vốn Đăng Ký 50%, Tỷ Lệ của Nhà Sáng Lập Liang Wenfeng Lên 34%

Tin tức Gate, ngày 28 tháng 4 — Theo dữ liệu từ Qichacha, DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) đã tăng vốn đăng ký từ 10 triệu nhân dân tệ lên 15 triệu nhân dân tệ. Đóng góp vốn đăng ký của nhà sáng lập Liang Wenfeng tăng từ 1 triệu nhân dân tệ lên 5,1 triệu nhân dân tệ

GateNews5phút trước

Meta Dự trữ 1GW+ Điện Mặt Trời và Lưu Trữ Năng Lượng cho các Trung Tâm Dữ Liệu AI

Meta đã ký các thỏa thuận năng lượng với Overview Energy và Noon Energy để đảm bảo công suất điện cho các trung tâm dữ liệu trí tuệ nhân tạo của mình, theo The Economic Times. Công ty đã dành sẵn tối đa 1 gigawatt

CryptoFrontier9phút trước

Zhipu Z.ai Gia hạn Chương trình khuyến mãi Gấp ba Hạn mức của GLM Coding Plan đến ngày 30 tháng 6

Tin tức từ Gate, ngày 28 tháng 4 — Zhipu Z.ai đã công bố gia hạn chương trình khuyến mãi gấp ba hạn mức trong Kế hoạch Lập trình GLM Coding Plan từ thời hạn ban đầu ngày 30 tháng 4 đến ngày 30 tháng 6, bao gồm cả hai mô hình GLM-5.1 và GLM-5-Turbo. Chương trình khuyến mãi có sẵn trong khung giờ Giờ Miền Đông từ 6:00 AM đến 2:00 AM ngày hôm sau. GLM Coding

GateNews24phút trước

TSMC Đẩy Mạnh Mở Rộng Với Tốc Độ Gấp Đôi, Năm Nhà Máy 2nm Sẽ Tăng Sản Xuất vào Năm 2026

Tin từ cổng Gate News, ngày 28 tháng 4 — Công ty Sản xuất Chất bán dẫn Đài Loan (TSMC) đang đẩy nhanh kế hoạch mở rộng công suất với tốc độ gấp đôi so với nhịp độ lịch sử để đáp ứng nhu cầu tăng vọt từ trí tuệ nhân tạo và điện toán hiệu năng cao, theo lời Hou Yongqing, phó chủ tịch cấp cao tại TSMC. Công ty

GateNews30phút trước

GitHub Copilot Chuyển Sang Thanh Toán Dựa Trên Token Bắt Đầu Từ Ngày 1 Tháng 6, Phí Hàng Tháng Không Đổi

Tin từ Gate News, ngày 28 tháng 4 — GitHub đã công bố rằng tất cả các gói Copilot sẽ chuyển sang thanh toán dựa trên token có hiệu lực từ ngày 1 tháng 6 năm 2026. Mô hình giá hiện tại "yêu cầu cao cấp" sẽ được thay thế bằng GitHub AI Credits, trong đó việc sử dụng được tính dựa trên mức tiêu thụ token thực tế (bao gồm đầu vào, đầu ra và token đã lưu trong bộ nhớ đệm theo mức giá khớp với giá API công khai của từng mô hình.

GateNews36phút trước

Các Cơ quan Quản lý Trung Quốc chặn thương vụ mua lại Manus trị giá $2 Billion của Meta

Tin tức Cổng, ngày 28 tháng 4 — Các cơ quan chính phủ Trung Quốc đã chặn thương vụ mua lại trị giá $2 billion của Meta đối với nền tảng tác nhân AI Manus, được công bố hôm qua (ngày 27 tháng 4). Thỏa thuận, ban đầu đã hoàn tất vào tháng 12, đã phải đối mặt với

GateNews40phút trước
Bình luận
0/400
Không có bình luận