La série MiMo-V2.5 de Xiaomi passe en open source : 1 000 milliards de paramètres avec une efficacité en jetons supérieure à GPT-5.4

Message de Gate News, le 27 avril — L’équipe MiMo de Xiaomi a publié en open source la série de modèles de langage MiMo-V2.5 sous licence MIT, prenant en charge le déploiement commercial, l’entraînement continu et l’affinage. Les deux modèles présentent une fenêtre de contexte de 1 million de jetons. MiMo-V2.5-Pro est un modèle mélange d’experts pure-texte (MoE) avec 1,02 trillion de paramètres au total et 42 milliards de paramètres actifs, tandis que MiMo-V2.5 est un modèle natif multimodal avec 310 milliards de paramètres au total et 15 milliards de paramètres actifs, prenant en charge la compréhension du texte, de l’image, de la vidéo et de l’audio.

MiMo-V2.5-Pro vise des tâches d’agents complexes et de programmation. Sur les benchmarks ClawEval, il a obtenu 64% de Pass@3 tout en consommant environ 70 000 jetons par trajectoire de tâche — 40% à 60% de jetons en moins que Claude Opus, Gemini 3.1 Pro et GPT-5.4. Le modèle a obtenu 78,9 sur SWE-bench Verified. Lors d’une démonstration, V2.5-Pro a implémenté indépendamment un compilateur complet SysY-to-RISC-V pour un projet de cours du compilateur de l’Université de Pékin en 4,3 heures avec 672 appels d’outils, atteignant un score parfait de 233/233 sur des jeux de tests cachés.

MiMo-V2.5 est conçu pour des scénarios d’agents multimodaux, doté d’un encodeur visuel dédié (729 millions de paramètres) et d’un encodeur audio (261 millions de paramètres), obtenant 62,3 sur le sous-ensemble général Claw-Eval. Les deux modèles emploient une architecture hybride combinant l’attention à fenêtre glissante (SWA) et l’attention globale (GA), associée à un module de prédiction multi-jetons à 3 couches (MTP) pour une inférence accélérée. Les poids du modèle sont disponibles sur Hugging Face.

En plus de la publication open source, l’équipe MiMo a lancé le « Orbit Quadrillion Token Creator Incentive Program », offrant 100 quadrillions de jetons gratuitement sur 30 jours aux utilisateurs du monde entier. Les développeurs individuels, les équipes et les entreprises peuvent postuler via la page du programme, avec un cycle d’évaluation d’environ 3 jours ouvrés ; les avantages approuvés sont distribués sous forme de Token Plans ou de crédits directs, compatibles avec des outils comme Claude Code et Cursor.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek augmente son capital social enregistré de 50 %, la participation du fondateur Liang Wenfeng passe à 34 %

Message de Gate News, le 28 avril — Selon des données de Qichacha, DeepSeek (Hangzhou Deepseek AI Basic Technology Research Co., Ltd.) a augmenté son capital social enregistré de 10 millions de yuans à 15 millions de yuans. La contribution du capital social enregistrée du fondateur Liang Wenfeng est passée de 1 million de yuans à 5,1 millions de yuans

GateNewsIl y a 5m

Réserves Meta : 1 GW+ de solaire et de stockage d’énergie pour les centres de données IA

Meta a signé des contrats d’énergie avec Overview Energy et Noon Energy afin de sécuriser une capacité d’alimentation pour ses centres de données d’intelligence artificielle, selon The Economic Times. La société a réservé jusqu’à 1 gigawatt

CryptoFrontierIl y a 9m

Zhipu Z.ai prolonge la promotion « triple quota » du GLM Coding Plan jusqu’au 30 juin

Message de Gate News, 28 avril — Zhipu Z.ai a annoncé une extension de sa promotion « triple quota » dans le cadre du GLM Coding Plan, initialement prévue jusqu’au 30 avril, repoussée au 30 juin, couvrant à la fois les modèles GLM-5.1 et GLM-5-Turbo. La promotion est disponible de 6:00 à 2:00 (heure de l’Est) le jour suivant. GLM Coding

GateNewsIl y a 24m

TSMC accélère son expansion à un rythme deux fois plus rapide : cinq usines 2 nm pour lancer la production en 2026

Message de Gate News, 28 avril — Taiwan Semiconductor Manufacturing Company (TSMC) accélère l’expansion de sa capacité à un rythme deux fois supérieur à celui historique afin de répondre à la demande croissante en intelligence artificielle et en informatique haute performance, selon Hou Yongqing, vice-président exécutif chez TSMC. L’entreprise

GateNewsIl y a 29m

Copilot de GitHub passe à la facturation basée sur des jetons à partir du 1er juin, frais mensuels inchangés

Message de Gate News, 28 avril — GitHub a annoncé que tous les forfaits Copilot passeront à la facturation basée sur des jetons à compter du 1er juin 2026. Le modèle de tarification actuel « premium request » sera remplacé par des GitHub AI Credits, avec une utilisation calculée en fonction de la consommation réelle de jetons (y compris les entrées, sorties, et jetons mis en cache à des tarifs correspondant à la tarification publique de l'API de chaque modèle.

GateNewsIl y a 35m

Les régulateurs chinois bloquent l’acquisition de Manus par Meta, pour $2 Billion

Message d’actualités de Gate, 28 avril — Des agences du gouvernement chinois ont bloqué l’acquisition de $2 billion d’envergure par Meta du plateforme d’agent d’IA Manus, annoncée hier (27 avril). L’accord, initialement finalisé en décembre, a fait l’objet de

GateNewsIl y a 39m
Commentaire
0/400
Aucun commentaire