10,000 dólares = 4 Agents, disponibles las 24 horas, Modelo de costos reestructurado MiniMax M2.5 ¿Ha llegado el punto crítico para la implementación a gran escala de IA?

La guerra de IA (Inteligencia Artificial) durante el Festival de Primavera, MiniMax (HK00100, precio de acción 680.0 HKD, valor de mercado 2132.720 millones de HKD) no estuvo ausente.

El 12 de febrero, MiniMax lanzó oficialmente su último modelo insignia de programación, MiniMax M2.5. Se sabe que, como el primer modelo de nivel de producción diseñado nativamente para escenarios de Agentes (inteligencias), su rendimiento en programación y en agentes (Coding&Agentic) está a la par con los modelos internacionales de punta, directamente comparable con Claude Opus 4.6, soportando desarrollo de programación de pila completa para PC, aplicaciones y aplicaciones multiplataforma.

A raíz de esta noticia, hasta el cierre del mercado en Hong Kong el 13 de febrero, el precio de las acciones de MiniMax subió un 15.65%, con un valor de mercado total de 2132.720 millones de HKD.

También es notable que la versión M2.5-lightning soporta una velocidad de salida de más de 100 TPS (transacciones por segundo), aproximadamente el doble que los modelos principales; el precio de entrada es de unos 0.3 dólares por millón de tokens, y el de salida de unos 2.4 dólares por millón de tokens.

Calculando a una tasa de salida de 100 tokens por segundo, el costo de operación continua por una hora sería de aproximadamente 1 dólar; si se calcula con 50 tokens, el costo sería de unos 0.3 dólares. Esto significa que, teóricamente, 10,000 dólares podrían soportar que 4 agentes trabajen continuamente durante un año.

Antes del Festival de Primavera, las apuestas de las empresas de IA ya mostraban diferentes direcciones. Mientras algunos apostaban por modelos multimodales o por la entrada en el mercado C (consumidor final), MiniMax concentró todos sus recursos en la “ruptura dual en rendimiento y costo” en escenarios de agentes. ¿Es esto el preludio de una guerra de precios o un nuevo camino para acelerar la comercialización de IA?

¿Detrás del lanzamiento del modelo de texto: MiniMax quiere reconstruir la economía de los agentes?

Sobre el rendimiento del modelo MiniMax M2.5, el director del Instituto Think Fast and Slow, Tian Feng, dijo a un periodista de Daily Economic News que, desde la perspectiva de su posicionamiento, es un “modelo de producción nativo de agentes de nivel de producción”, cuyo valor central radica en ofrecer una comprensión confiable de tareas en escenarios de agentes y capacidades de razonamiento a largo plazo en problemas complejos.

“En capacidades clave como programación, llamadas a herramientas y descomposición de tareas complejas, M2.5 ya alcanza el nivel SOTA (State of the Art, lo más avanzado del mundo), estas capacidades son la base para construir agentes eficientes”, afirmó Tian Feng.

Todas las señales indican que la estrategia de MiniMax en relación con los agentes ya está clara.

En los últimos 108 días, MiniMax ha ido de M2 a M2.1 y luego a M2.5, con resultados en SWE-Bench Verified (prueba de referencia en ingeniería de software) que subieron de 69.4 a 80.2 puntos. Se sabe que el equipo atribuye esta mejora a un escalamiento de aprendizaje reforzado de agentes a gran escala (RL Scaling).

Su marco Forge, desarrollado internamente, desacopla el motor de entrenamiento y los agentes, logrando una optimización generalizada para cualquier estructura de agentes y herramientas, y acelera el entrenamiento aproximadamente 40 veces mediante programación asíncrona y estrategias de fusión en árbol.

Al mismo tiempo, en nivel algorítmico, emplea optimización CISPO y mecanismos de recompensa por proceso, para aliviar el problema de asignación de crédito en escenarios de contexto largo, y ha incorporado el “tiempo real de tarea” en la función de recompensa, logrando un equilibrio entre efectividad y velocidad de respuesta.

El 12 de febrero, M2.5 ya estaba en línea en MiniMax Agent, y el 13 de febrero se lanzó como código abierto global para soporte de despliegue local. En menos de un día, usuarios de todo el mundo ya habían construido más de 10,000 expertos en MiniMax Agent, y la cifra sigue creciendo rápidamente.

MiniMax expresó su deseo de, además de mejorar continuamente las capacidades del modelo, construir un ecosistema de agentes escalable y sostenible — el Universo de Agentes.

Cabe destacar que, en la etapa actual, las apuestas de las empresas de IA están más centradas en modelos multimodales grandes, ¿qué busca MiniMax al lanzar un modelo de texto grande en este momento?

Al respecto, Tian Feng afirmó que MiniMax ha concentrado casi todos sus recursos en la mejora continua de la capacidad del modelo base, “el lanzamiento de M2.5 es una extensión de esta estrategia: primero fortalecer la capacidad del modelo base, y luego expandirse a escenarios de aplicación específicos”.

Sin embargo, también mencionó que MiniMax fue una de las primeras empresas nacionales en adoptar la ruta de modelos multimodales completos, y que lanzar un modelo puramente de texto no significa abandonar los multimodales, sino que en base a capacidades multimodales existentes, se realiza una optimización específica para escenarios de agentes.

El CEO de iiMedia Research, Zhang Yi, dijo a un periodista que el impulso de MiniMax hacia modelos grandes de bajo costo responde a una estrategia clara de diferenciación: evitar la competencia en el mercado saturado de multimodales, y centrarse en resolver los principales problemas de costo y eficiencia en la implementación de agentes.

Además del avance en rendimiento, uno de los principales focos de atención sobre M2.5 es el control de costos. Desde MiniMax consideran que, cuando el rendimiento y el costo dejan de ser restricciones, el modelo económico para despliegue masivo de agentes cambiará radicalmente.

Sobre el desempeño de M2.5 en control de costos, Wang Peng, subinvestigador del Instituto de Ciencias Sociales de Beijing, afirmó que empresas como MiniMax están reduciendo los costos de uso de agentes a niveles muy bajos, lo que marca la entrada de la comercialización de IA en una fase de “sustitución a escala” en lugar de solo “verificación técnica”.

Wang Peng señaló que, en el pasado, los altos costos de inferencia limitaban los escenarios de aplicación de los agentes (solo en tareas de alto valor), pero ahora, con costos bajos, las empresas pueden desplegar IA en masa para tareas diarias repetitivas (como atención al cliente, entrada de datos), e incluso crear nuevos modelos de negocio (como servicios de IA basados en pago por resultados).

¿La industria se dirigirá a una competencia de precios? Expertos: más probable una “guerra de valor”

Cabe destacar que, antes del Festival de Primavera, muchas empresas de IA ya estaban haciendo movimientos relacionados con agentes.

En productos, diferentes actores están acelerando para ganar ventaja. El 11 de febrero, Meituan LongCat lanzó un agente nativo de “investigación profunda”. Las pruebas ciegas de usuarios mostraron una tasa de “usabilidad general” del 61.1%, superior al 42.8% de ChatGPT. Actualmente, esta función está disponible gratuitamente en la web de LongCat.

El 20 de enero, MiniMax lanzó la versión 2.0 de su agente, posicionándolo como “plataforma de trabajo nativa de IA”, que soporta tanto Mac como Windows, además de presentar “Agentes expertos” para escenarios verticales especializados. El 19 de enero, Ziejue Xingchen anunció oficialmente su nuevo producto de agente para escritorio, “Ziejue AI Desktop Partner”, y lanzó una versión para Windows, disponible gratuitamente.

En cuanto a modelos, el 3 de febrero por la noche, Alibaba open sourceó el nuevo modelo de programación de agentes Qwen3-Coder-Next, que con solo 3B de parámetros, ya puede igualar en rendimiento a modelos top como DeepSeek-V3.2 y GLM-4.7.

Se sabe que, gracias a avances tecnológicos, Qwen3-Coder-Next reduce significativamente los costos de inferencia, a solo entre el 5% y 10% del costo de modelos con rendimiento similar, siendo especialmente adecuado para despliegues en PCs domésticos y servidores ligeros, y actualmente es uno de los modelos de programación de agentes de código abierto más potentes y pequeños.

Alibaba afirmó que, frente a problemas reales como razonamiento en contextos largos, uso de herramientas y recuperación tras fallos, el nuevo modelo Qwen puede responder con calma.

Se puede ver que, en relación con los grandes modelos relacionados con agentes, reducir costos es la principal tendencia del sector. ¿Significa esto que, con la entrada de M2.5, la industria podría entrar en una guerra de precios?

“Esto no necesariamente es gastar mucho para ganar mercado.” Zhang Yi opina que la baja de precios se logra principalmente mediante optimizaciones tecnológicas, no solo con subsidios y gastos excesivos. “En cuanto a si esto provocará una guerra de precios, hay que observar cómo evoluciona el mercado, pero lo que es seguro es que acelerará la eliminación de competidores ineficientes, y la industria se moverá hacia una competencia en rendimiento y costo en doble dimensión.”

Tian Feng considera que, en realidad, el bajo costo de M2.5 es resultado inevitable de la optimización de la arquitectura técnica y la mejora de capacidades de ingeniería, y que esto impulsará a los agentes a pasar de la “verificación de concepto” a la “comercialización a escala”, probablemente generando una “guerra de valor” en lugar de una tradicional guerra de precios.

“Predecimos que la reducción del costo de inferencia en modelos grandes en un factor de 10 cada año es una tendencia probable y sostenida. La aparición de M2.5 acelerará esta tendencia, impulsando a toda la industria hacia una dirección más eficiente y de menor costo”, afirmó Tian Feng.

También mencionó que, anteriormente, los precios de los productos de agentes eran generalmente altos, dirigidos principalmente a clientes empresariales, pero la ventaja de costos que trae M2.5 podría ampliar el mercado a pequeñas y medianas empresas, desarrolladores e incluso usuarios individuales. “Esto podría ampliar significativamente el tamaño del mercado de agentes, sin que se trate solo de una competencia de precios.”

Para Wang Peng, la explosión de los agentes y la caída de costos marcan la transición de la “singularidad tecnológica” a la “singularidad de producto” en IA. “Al igual que los teléfonos inteligentes reemplazaron a los teléfonos con funciones básicas, en el futuro, la competencia en IA ya no será solo por tamaño de parámetros, sino por la capacidad de integrarse realmente en los flujos de trabajo y crear valor tangible.”

La guerra de IA del Festival de Primavera en pleno auge, ¿llegó el punto crítico para la implementación masiva de IA?

Sobre las razones por las que muchas empresas de IA apuestan en la misma dirección, Wang Peng opina que, en esencia, se trata de una transición del paradigma tecnológico de “respuesta pasiva” a “ejecución activa”.

“Los grandes modelos tradicionales son como ‘bases de conocimiento’, mientras que los agentes son más como ‘empleados digitales’, capaces de descomponer tareas, llamar a herramientas, manejar excepciones e incluso optimizarse a sí mismos. Este cambio responde a la actualización de las necesidades empresariales: los usuarios ya no solo quieren obtener información, sino que exigen que la IA complete directamente los ciclos de trabajo (como procesamiento automático de pedidos o generación de informes financieros)”, explicó Wang Peng.

Con la puesta en marcha de nuevos modelos y productos, ¿están empezando a marcar diferencia las empresas en la carrera de agentes?

Tian Feng opina que, efectivamente, la carrera por los grandes modelos de agentes está empezando a marcar diferencias, pero estas diferencias se reflejan más en capacidades de ingeniería, implementación en escenarios y eficiencia de costos, que en tamaño de parámetros o capacidades básicas.

Cabe destacar que, en la actualidad, la estrategia de las empresas en agentes está estrechamente vinculada a la necesidad urgente de comercialización de IA.

Tian Feng señaló que M2.5 está claramente definido como un “modelo de producción nativo de agentes”, y que todas sus mejoras en capacidades clave giran en torno a programación, llamadas a herramientas y productividad en oficina, reflejando una profunda comprensión de la comercialización.

También es importante notar que, durante el Festival de Primavera, la IA se ha convertido en una de las principales áreas de inversión de las grandes empresas tecnológicas. Aunque cada una tiene su enfoque, la industria muestra un consenso y una dirección cada vez más convergentes.

Tian Feng mencionó que la industria está pasando de una competencia basada en “parámetros” a una basada en “ingresos” y “beneficios”. La simple ventaja técnica ya no garantiza el éxito en el mercado; quien pueda convertir más rápidamente sus ventajas tecnológicas en ingresos comerciales cuantificables, ganará la partida final.

Además, considera que, tanto la estrategia de ByteDance de “tráfico + escenario”, como la de Alibaba de “plataforma de comercio electrónico + ecosistema”, o la de MiniMax de “especialización + implementación”, en esencia, están construyendo diferentes barreras ecológicas.

Zhang Yi también señaló que, a partir de la guerra de IA del Festival de Primavera, se observa una tendencia de diferenciación en lugar de homogeneización. “Las empresas están diversificando sus enfoques, con caminos principales en multimodales, eficiencia en agentes y ecosistemas implementables. La raíz está en que cada fabricante tiene diferentes capacidades tecnológicas, etapas de comercialización y demandas de escenario.”

Para él, esto también marca una transición de una “carrera armamentística” centrada en parámetros a una competencia más enfocada en escenarios, implementación y segmentación.

De “mostrar habilidades” a “comercializar”, de “probar por novedad” a “popularizar”, en este Festival de Primavera, la competencia en IA ha sido intensa y variada. Cuando los costos de IA se reducen y los usuarios acceden cada vez más a productos de IA, esta intensa competencia puede ser vista en el futuro como un punto de inflexión en la historia de la IA, de “fuegos artificiales festivos” a “iluminación cotidiana”.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado

Opera con criptomonedas en cualquier momento y lugar
qrCode
Escanea para descargar la aplicación de Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)