10 000 dollars = 4 Agents toute l'année sans interruption Modèle de coût de reconstruction MiniMax M2.5 Le point critique pour la mise en œuvre à grande échelle de l'IA est-il atteint ?

La guerre de l’IA du Nouvel An chinois (intelligence artificielle) fait rage, et MiniMax (HK00100, cours de 680,0 HKD, capitalisation boursière de 213,272 milliards HKD) n’a pas manqué à l’appel.

Le 12 février, MiniMax a officiellement lancé son dernier modèle phare de programmation, MiniMax M2.5. Selon les informations, en tant que premier modèle de production conçu nativement pour les scénarios d’agents intelligents (Agent), ses performances en programmation et en agent (Coding&Agentic) rivalisent avec celles des modèles internationaux de pointe, directement comparables à Claude Opus 4.6, supportant le développement full-stack pour PC, applications et applications multi-plateformes.

Sous l’effet de cette annonce, à la clôture du marché hongkongais le 13 février, le cours de MiniMax a augmenté de 15,65 %, avec une capitalisation totale de 2132,72 milliards HKD.

Il est également notable que la version M2.5-lightning supporte un débit supérieur à 100 TPS (transactions par seconde), soit environ deux fois celui des modèles grand public ; le prix d’entrée est d’environ 0,3 USD par million de tokens, et le prix de sortie d’environ 2,4 USD par million de tokens.

En supposant une sortie de 100 tokens par seconde, le coût pour une heure de fonctionnement continu serait d’environ 1 USD ; à 50 tokens, il serait d’environ 0,3 USD. Cela signifie qu’avec 10 000 USD, on pourrait théoriquement faire fonctionner 4 agents en continu pendant un an.

Avant le Nouvel An chinois, les stratégies des entreprises d’IA ont déjà commencé à diverger. Certains misent sur le multimodal, d’autres sur l’entrée dans le marché grand public, mais MiniMax concentre tous ses efforts sur la “double percée” en termes de performance et de coût dans le scénario des agents. S’agit-il d’une préfiguration d’une guerre des prix ou d’une nouvelle voie pour accélérer la commercialisation de l’IA ?

Derrière le lancement du modèle de texte : MiniMax veut-il reconstruire l’économie des agents ?

Concernant la performance du modèle MiniMax M2.5, le président de l’Institut Think Fast and Slow, Tian Feng, a déclaré à un journaliste du « Daily Economic News » que, selon son positionnement, il s’agit d’un « modèle natif de production d’agents de niveau industriel », dont la valeur centrale réside dans la fourniture d’une compréhension fiable des tâches textuelles et d’une capacité de raisonnement à long terme pour des scénarios d’agents.

« Sur les capacités clés des agents telles que la programmation, l’appel d’outils, la décomposition de tâches complexes, M2.5 a déjà atteint le niveau SOTA (State of the Art, le plus avancé au monde). Ces capacités sont la pierre angulaire de la construction d’agents efficaces », a-t-il ajouté.

Tous les signes indiquent que MiniMax a une stratégie claire pour ses agents.

Au cours des 108 derniers jours, MiniMax a fait évoluer ses modèles de M2, M2.1 à M2.5, avec des résultats sur le benchmark SWE-Bench Verified passant de 69,4 à 80,2 points. Selon nos sources, cette progression est attribuée à un apprentissage par renforcement à grande échelle pour les agents (RL Scaling).

Son cadre Forge, développé en interne, décompose l’entraînement en séparant le moteur d’entraînement et l’agent, permettant une généralisation et une optimisation pour tout type de scaffolding et d’outils d’agents, tout en accélérant l’entraînement d’environ 40 fois grâce à une planification asynchrone et une stratégie de fusion en arbre.

Par ailleurs, au niveau algorithmique, il utilise l’optimisation CISPO et un mécanisme de récompense basé sur le processus, atténuant le problème de répartition de crédit dans des scénarios à contexte long, et intégrant le « temps réel de tâche » dans la fonction de récompense pour équilibrer efficacité et réactivité.

Le 12 février, M2.5 a été intégré dans MiniMax Agent, puis le 13 février, il a été open source mondialement pour supporter le déploiement local. En moins d’une journée, des utilisateurs du monde entier ont déjà construit plus de 10 000 experts sur MiniMax Agent, et ce nombre continue de croître rapidement.

MiniMax espère, tout en améliorant continuellement ses modèles, construire un écosystème d’agents durable — l’Agent Universe.

Il est également intéressant de noter qu’à l’heure actuelle, la majorité des investissements des entreprises d’IA se concentrent sur les modèles multimodaux de grande taille. Pourquoi MiniMax lance-t-il un modèle de texte seul à ce moment-là ?

Tian Feng explique que MiniMax concentre presque toutes ses ressources sur l’amélioration continue de ses capacités de modèle de base : « La sortie de M2.5 s’inscrit dans cette stratégie — d’abord renforcer la capacité du modèle de base, puis l’étendre aux applications concrètes. »

Il ajoute que MiniMax est l’une des premières entreprises nationales à adopter la voie des modèles multimodaux complets, et que le lancement d’un modèle purement textuel ne signifie pas abandonner le multimodal, mais plutôt une optimisation spécifique pour les scénarios d’agents sur la base des capacités multimodales existantes.

Zhang Yi, CEO d’iiMedia Research, indique que MiniMax pousse fortement pour des modèles de grande taille à faible coût, avec une stratégie claire : éviter la compétition dans le marché saturé du multimodal, et cibler directement les coûts élevés et la faible efficacité dans la mise en œuvre des agents.

Outre les progrès en performance, l’un des points d’attention majeur concernant M2.5 est la maîtrise des coûts. MiniMax estime qu’une fois la performance et le coût équilibrés, le modèle économique du déploiement massif d’agents changera fondamentalement.

Wang Peng, vice-chercheur à l’Académie des sciences sociales de Pékin, souligne que MiniMax et d’autres fabricants ont réduit au minimum le coût d’utilisation des agents, marquant une étape où l’IA passe de la « validation technologique » à la « substitution à grande échelle ».

Il rappelle qu’auparavant, le coût élevé de l’inférence limitait l’usage des agents aux tâches à forte valeur ajoutée, mais qu’aujourd’hui, le faible coût permet aux entreprises de déployer massivement l’IA pour des tâches quotidiennes répétitives (service client, saisie de données) et même de créer de nouveaux modèles commerciaux (paiement à l’usage pour des services IA).

Le secteur va-t-il vers une guerre des prix ? Experts : il est plus probable qu’il y ait une « guerre de la valeur »

Il est également à noter qu’avant le Nouvel An chinois, de nombreuses entreprises d’IA ont déjà lancé des stratégies liées aux agents.

Sur le plan produit, divers acteurs s’activent pour prendre de l’avance. Le 11 février, Meituan LongCat a lancé un agent « de recherche approfondie » natif. Des tests utilisateurs ont montré un taux d’utilisabilité global de 61,1 %, supérieur aux 42,8 % de ChatGPT. Cette fonctionnalité est désormais accessible gratuitement sur le site web de LongCat.

Le 20 janvier, MiniMax a lancé la version 2.0 de son agent, positionné comme une « plateforme de travail IA native », disponible sur desktop (Mac et Windows), avec des agents spécialisés pour des scénarios verticaux. Le 19 janvier, Ziejue Xingchen a officiellement annoncé la nouvelle version de son agent pour PC, « Ziejue AI Desktop Partner », également disponible gratuitement pour Windows.

Concernant les modèles, le 3 février au soir, Alibaba a open source le nouveau modèle d’intelligence artificielle Qwen3-Coder-Next, avec seulement 3 milliards de paramètres, mais ses performances en programmation d’agents rivalisent avec celles de DeepSeek-V3.2, GLM-4.7, etc.

Selon les informations, grâce à de nouvelles avancées technologiques, Qwen3-Coder-Next réduit considérablement le coût d’inférence, à seulement 5-10 % de celui de modèles de même performance, ce qui le rend particulièrement adapté aux déploiements sur PC domestiques ou serveurs légers, et constitue actuellement le modèle open source de programmation d’agents le plus performant.

Alibaba indique que face aux défis réels tels que le raisonnement sur de longs contextes, l’utilisation d’outils ou la récupération après échec, le nouveau modèle Qwen3-Coder-Next peut y répondre aisément.

On constate que, pour les grands modèles liés aux agents, la réduction des coûts est la tendance principale du secteur. Cela signifie-t-il qu’avec l’arrivée de M2.5, le secteur pourrait entrer dans une guerre des prix ?

Zhang Yi pense que « ce n’est pas forcément une course au gaspillage pour conquérir le marché ». Selon lui, cette baisse de prix est principalement due à des optimisations technologiques, et non à une vieille stratégie de subventions coûteuses. « Quant à savoir si cela déclenchera une guerre des prix, il faut observer l’évolution du marché. Mais il est certain que cela accélérera l’élimination des concurrents inefficaces, et que le secteur évoluera vers une compétition à la fois axée sur la performance et le coût. »

Tian Feng estime que la faible coût de M2.5 résulte d’une optimisation de l’architecture technologique et d’une amélioration des capacités d’ingénierie, ce qui favorisera la transition des agents du « concept de validation » à la « commercialisation à grande échelle », et pourrait plutôt provoquer une « guerre de la valeur » que de prix.

« Nous prévoyons que la réduction du coût d’inférence des grands modèles par un facteur 10 chaque année pourrait continuer. L’émergence de M2.5 accélérera cette tendance, poussant l’industrie vers une plus grande efficacité et des coûts encore plus faibles », a-t-il déclaré.

Il ajoute que, jusqu’à présent, la tarification des produits d’agents était généralement élevée, principalement destinée aux clients d’entreprise. La baisse des coûts apportée par M2.5 pourrait permettre à l’agent de s’étendre à un marché plus large de PME, de développeurs, voire d’utilisateurs individuels. « Cela pourrait élargir la taille globale du marché des agents, plutôt que de se limiter à une simple compétition de prix. »

Selon Wang Peng, l’émergence des agents et la baisse des coûts marquent le passage de l’« étape technologique » à l’« étape produit » de l’IA. « Tout comme le smartphone a remplacé le téléphone à fonctionnalités, à l’avenir, la compétition en IA ne sera plus basée sur la taille des paramètres, mais sur la capacité à s’intégrer réellement dans les flux de travail et à créer une valeur concrète. »

La guerre de l’IA du Nouvel An chinois est-elle à son apogée, le point de bascuet pour la mise en œuvre à grande échelle de l’IA ?

Selon Wang Peng, la raison pour laquelle de nombreuses entreprises d’IA misent sur les agents est que la transition du paradigme technologique va d’une « réponse passive » à une « exécution proactive ».

« Les grands modèles traditionnels ressemblent à une ‘base de connaissances’, tandis que les agents sont plus comme des ‘employés numériques’ capables de décomposer des tâches, d’appeler des outils, de gérer des exceptions, voire de s’auto-optimiser. Ce changement répond à une demande croissante des entreprises : les utilisateurs ne veulent plus simplement obtenir des informations, mais veulent que l’IA réalise directement des tâches en boucle fermée (comme le traitement automatique des commandes ou la génération de rapports financiers) », explique-t-il.

Avec le lancement collectif de nouveaux modèles et produits, les entreprises commencent-elles à se démarquer dans la course aux agents ?

Tian Feng pense que la compétition dans la voie des grands modèles d’agents est effectivement en train de s’intensifier, mais cette différence se manifeste surtout dans les capacités d’ingénierie, la mise en œuvre dans des scénarios concrets et l’efficacité des coûts, plutôt que dans la simple taille des paramètres ou les capacités fondamentales.

Il souligne que, derrière cette stratégie, la nécessité d’une commercialisation rapide de l’IA est cruciale pour toutes les entreprises.

Tian Feng indique que M2.5 est clairement positionné comme un « modèle natif de production d’agents de niveau industriel », et que toutes ses améliorations clés tournent autour de la programmation, de l’appel d’outils et de la productivité bureautique. Ce choix de spécialisation reflète une compréhension approfondie de la commercialisation.

Il est également à noter qu’à l’occasion du Nouvel An chinois, l’IA est devenue une priorité stratégique pour de grandes entreprises technologiques. Bien que leurs stratégies diffèrent, l’industrie montre une tendance vers une convergence progressive.

Tian Feng mentionne que le secteur évolue d’un « combat par paramètres » vers un « combat par revenus » et « profit ». La simple supériorité technique ne suffit plus pour gagner sur le marché : celui qui convertira le plus rapidement ses avantages technologiques en revenus commerciaux quantifiables remportera la victoire finale.

Il ajoute que, que ce soit le modèle « flux + scénario » de ByteDance, le « plateforme e-commerce + écosystème » d’Alibaba, ou la « spécialisation + déploiement » de MiniMax, tous construisent leurs propres barrières écologiques.

Zhang Yi observe que, d’après la guerre de l’IA du Nouvel An chinois, on passe d’une « compétition homogène » à une différenciation. « La direction prise par les fabricants se diversifie, notamment dans le multimodal, l’efficacité des agents et la construction d’écosystèmes réalisables. La racine de cette divergence réside dans les différences de capacités technologiques, de maturité commerciale et de scénarios d’application. »

Selon lui, cela marque une étape où le secteur, passant d’une « course aux paramètres » à une compétition plus ciblée, plus concrète et plus segmentée.

De « démonstration technique » à « usage commercial », de « test » à « adoption généralisée », la compétition durant le Nouvel An chinois a été intense. À mesure que le coût de l’IA baisse, que les utilisateurs découvrent de plus en plus ses produits, cette période de compétition intensive pourrait être vue comme un tournant historique où l’IA passe du « feu d’artifice festif » à « l’éclairage quotidien. »

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler