10 000 долларов = 4 агента круглогодично без выходных MiniMax M2.5 пересмотр модели затрат наступил ли критический момент для масштабирования AI?

В Весеннем фестивале войны искусственного интеллекта (искусственный интеллект) MiniMax (HK00100, цена акций HK$680,0, рыночная стоимость HK$213,272 миллиарда) не отсутствовал.

12 февраля MiniMax официально представила свою новейшую флагманскую модель программирования — MiniMax M2.5. Сообщается, что как первая в мире производственная модель, нативно разработанная для сценариев Agent, её программирование и производительность агентов (кодирование и агентность) сопоставимы с мировыми топовыми моделями, напрямую сравниваются с Claude Opus 4.6 и поддерживают full-stack программирование для ПК (персональный компьютер), приложений (приложения) и кросс-терминальных приложений.

Или, учитывая эти новости, по состоянию на закрытие акций Гонконга 13 февраля цена акций MiniMax выросла на 15,65%, а общая рыночная стоимость составила 213,272 миллиарда гонконгских долларов.

Также стоит отметить, что версия M2.5 lightning поддерживает скорость вывода более 100 TPS (транзакций в секунду), что примерно вдвое больше, чем у основных моделей; Входная цена составляет около $0,3/миллион токенов (токенов/токенов), а выходная цена — около $2,4/миллион токенов.

Если вы выводите 100 токенов в секунду, стоимость непрерывной работы в течение часа составляет около $1. Если рассчитать в 50 токенов, стоимость составляет около $0.3. Это значит, что теоретически $10,000 могут содержать 4 агента, работающих непрерывно в течение года.

Накануне Весеннего фестиваля направление ставок у различных компаний, занимающихся ИИ, было иным. Пока некоторые игроки делают ставки на мультимодальность, а некоторые берут выход на C-end (потребительский конец), MiniMax ставит все свои фишки на «прорыв производительности и стоимости» сценария с агентом. Является ли это прелюдией к ценовой войне или новым путём ускорения коммерциализации ИИ?

За онлайн-моделью текста: MiniMax хочет реконструировать агентную экономику?

Что касается производительности модели MiniMax M2.5, Тянь Фэн, президент Института исследований быстрого мышления, сообщил журналисту «Daily Economic News», что с точки зрения позиционирования M2.5 это «нативная модель на уровне производства агентов», а её основная ценность — обеспечить надежное понимание текста задач и возможности долгосрочного рассуждения для сложных задач для сценариев Агента.

«С точки зрения основных возможностей агента, таких как программирование, вызов инструментов и сложный разбор задач, M2.5 достигла глобального уровня SOTA (State of the Art, the Master, Advanced), который является краеугольным камнем создания эффективного агента.» — сказал Тянь Фэн.

Все признаки указывают на то, что планировка Агента в MiniMax ясна.

За последние 108 дней MiniMax поднялся с M2 и M2.1 до M2.5, а его балл в SWE-Bench Verified (Software Engineering Benchmark) улучшился с 69.4 до 80.2. Журналист узнал, что команда связывает этот скачок с масштабным обучением с подкреплением агентов (RL-масштабирование).

Считается, что её самостоятельно разработанная структура Forge реализует оптимизацию обобщения любых агентских каркасов и инструментов путём разделения обучающего движка и агента, и достигает примерно 40-кратного ускорения обучения с помощью асинхронного планирования и стратегий слияния деревьев.

В то же время на уровне алгоритма используются оптимизация CISPO и механизм вознаграждения процессов для облегчения проблемы распределения кредитов в долгосрочных сценариях, а в функцию вознаграждения включена «задача, занимающая реальное время», чтобы найти баланс между эффектом и скоростью отклика.

12 февраля M2.5 был запущен на MiniMax Agent, а 13 февраля — глобальный исходный код для поддержки локализованного развертывания. Менее чем за день пользователи со всего мира создали более 10 000 экспертов на MiniMax Agent, и их число быстро растёт.

MiniMax заявила, что надеется создать устойчивую и расширяющуюся экосистему Agent — Agent Universe, одновременно постоянно совершенствуя возможности моделей.

Стоит отметить, что на данном этапе компании в области ИИ больше делают ставку на мультимодальные крупные модели и другие направления, а MiniMax запускает модель с большим текстом — какова цель?

В этом отношении Тянь Фэн отметил, что MiniMax сосредоточила почти все свои ресурсы на постоянном совершенствовании возможностей базовых моделей: «Запуск M2.5 является продолжением этой стратегии — сначала с базовыми возможностями моделей, а затем расширением в конкретные сценарии применения.»

Однако он также отметил, что MiniMax — одна из первых компаний в Китае, выбравших технический путь полномодальных моделей, и запуск открытых текстовых моделей не означает отказ от мультимодальности, а специальную оптимизацию для сценариев агентов на основе существующих полномодальных возможностей.

Чжан И, генеральный директор iiMedia Consulting, сообщил журналистам, что активное продвижение недорогих крупных моделей MiniMax — это чёткий дифференцированный путь: избегание тропы мультимодальных соревнований на Красном море и прямое задействование основных проблем — высокой стоимости и низкой эффективности в процессе посадки Agent.

Помимо прогресса в производительности, одной из главных забот внешнего мира по отношению к M2.5 является контроль затрат. MiniMax считает, что когда производительность и стоимость перестанут быть ограничениями, экономическая модель масштабного внедрения агентов кардинально изменится.

Что касается эффективности M2.5 в контроле затрат, Ван Пэн, младший исследователь Пекинской академии социальных наук, сообщил журналистам, что такие производители, как MiniMax, снизили стоимость использования агентов до очень низкого уровня, что означает, что коммерциализация ИИ вошла в стадию «крупномасштабной замены» «технической проверки».

Ван Пэн считает, что ранее высокие затраты на выводы ограничивали возможности применения агентов (только для задач с высокой ценностью), но теперь низкие затраты позволяют предприятиям внедрять ИИ пакетами, выполнять ежедневные повторяющиеся задачи (такие как обслуживание клиентов, ввод данных) и даже создавать новые бизнес-модели (например, сервисы ИИ с оплатой по результату).

Перейдет ли отрасль в сторону ценовой конкуренции? Эксперты: Более вероятно спровоцировать «войну ценностей»

Стоит отметить, что накануне Весеннего фестиваля многие компании по ИИ проводили макеты, связанные с агентами.

Что касается продуктов, игроки из самых разных слоёв общества без остановки пользуются возможностью. 11 февраля Meituan LongCat выпустила свой собственный агент для «глубоких исследований». Слепые тесты пользователей показали, что «общий уровень доступности» стратегии достиг 61,1%, что лучше, чем у ChatGPT с 42,8%. Эта функция сейчас доступна бесплатно на сайте LongCat.

20 января MiniMax выпустил версию Agent 2.0, позиционируя её как «нативный рабочий стол с искусственным интеллектом», который не только запускается на стороне рабочего стола, поддерживает Mac и Windows, но и запускает «Экспертных агентов» для профессиональных вертикальных сценариев. 19 января Step Star официально объявила о новом обновлении продукта Computer Agent под названием Step AI Desktop Partner и запуске версии для Windows, которой можно пользоваться бесплатно.

Что касается моделей, вечером 3 февраля Alibaba представила своё новое поколение агентной модели Qwen3-Coder-Next, и её производительность агентного программирования сопоставима с топовыми открытыми моделями, такими как DeepSeek-V3.2 и GLM-4.7, когда активирован только 3B.

Считается, что на основе новых технологических прорывов стоимость вывода Qwen3-Coder-Next для «Xiao Kuailing» значительно снизилась — всего на 5–10% от стоимости той же модели производительности, что особенно подходит для недорогих сценариев развертывания агентов, таких как домашние компьютеры и легкие серверы, а также является небольшой открытой моделью программирования с наилучшими возможностями агентного программирования.

Alibaba отметила, что в условиях таких проблем, как рассуждение в долгосрочном контексте, использование инструментов и восстановление после сбоев при выполнении, которые создают головные боли для агентов в реальном мире, новая модель Цяньвэнь может спокойно справляться с этим.

Можно увидеть, что для крупных моделей, связанных с агентами, снижение затрат является основным направлением текущей отрасли. Означает ли это, что с появлением M2.5 отрасль, вероятно, сместится в сторону ценовой конкуренции?

«Возможно, это не сжигание денег для рынка.» В этом отношении Чжан И считает, что его низкая цена достигается в основном за счёт технической оптимизации, и это не совсем старый способ субсидирования сжигания денег. «Что касается того, может ли это вызвать ценовую войну, мы должны наблюдать за последующим изменениями рынка. Но однозначно можно сказать, что это ускорит (устранит) неэффективных конкурентов, а отрасль также обратится к двубокой конкуренции производительности и стоимости. ”

Тянь Фэн считает, что низкая стоимость M2.5 — неизбежный результат оптимизации технической архитектуры и улучшения инженерных возможностей, что приведёт к переходу Agent от «доказательства концепции» к «масштабной коммерциализации», что скорее вызовет «войну стоимости», а не традиционную «ценовую войну».

«Мы прогнозируем, что тенденция снижения затрат на выводы в 10 раз в год в крупной модельной индустрии, вероятно, сохранится. Появление M2.5 ускорит эту тенденцию, подтолкнув всю отрасль к более эффективным и сниженным затратам. — сказал Тянь Фэн.

Он также отметил, что ценообразование на продукты Agent в целом было высоким, в основном для корпоративных клиентов, а преимущество по стоимости M2.5, как ожидается, позволит Agent выйти на более широкий круг малых и средних предприятий, рынков разработчиков и даже отдельных пользователей. «Это может расширить весь рынок агентов, а не просто ценовую конкуренцию.»

По мнению Ван Пэна, вспышка и снижение стоимости Agent свидетельствуют о том, что ИИ перешёл из «технологической сингулярности» к «сингулярности продукта», «так же, как смартфоны, заменяющие обычные телефоны, будущая конкуренция ИИ больше не будет сводиться к размеру параметров, а в том, сможет ли его действительно интегрировать в рабочий процесс и создать реальную ценность».

Война ИИ на Весеннем фестивале в полном разгаре, и настал ключевой момент крупномасштабной посадки ИИ?

Что касается причин коллективной ставки отрасли на Agent, Ван Пэн считает, что суть этого проекта — скачок в технической парадигме от «пассивного ответа» к «активному исполнению».

«Традиционные крупные модели — это как ‘базы знаний’, тогда как агенты — это скорее ‘цифровые сотрудники’, способные разбирать задачи, вызывать инструменты, обрабатывать исключения и даже самооптимизироваться. Этот сдвиг возник из-за роста спроса на предприятия: пользователи больше не довольствуются получением информации, а нуждаются в ИИ для прямого завершения замкнутого цикла работы (например, автоматической обработки заказов и формирования финансовых отчетов). — сказал Ван Пэн.

С коллективным запуском новых моделей и продуктов, с точки зрения трека Агента, стало ли расширяться разрыв между компаниями?

В этом отношении Тянь Фэн считает, что большая модель Agent действительно увеличивает разрыв, но этот разрыв больше отражается в трёх измерениях: инженерных способностях, возможности по посадке сценариев и экономической эффективности, а не просто в масштабе параметров или базовых возможностях.

Стоит отметить, что в настоящее время структура агентов для предприятий неразрывно связана с острой потребностью в коммерциализации ИИ.

Тянь Фэн отметил, что M2.5 чётко позиционируется как «нативная модель на уровне производства агентов», а все ключевые улучшения возможностей связаны с важными экономическими задачами, такими как программирование, вызов инструментов и производительность в офисе. Такой выбор специализации отражает глубокое понимание коммерциализации MiniMax.

Также стоит отметить, что во время Весеннего фестиваля в этом году ИИ стал ключевым направлением оформления крупных технологических компаний. Хотя у каждой компании свой фокус, отрасль демонстрирует постепенное сближение консенсуса и направления.

Тянь Фэн отметил, что отрасль переходит от «боевых параметров» к «борьбе за доход» и «борьбе за прибыль», и простого технологического лидерства больше недостаточно для победы на рынке, и тот, кто быстрее превратит технические преимущества в измеримый доход бизнеса, может одержать окончательную победу.

Кроме того, он считает, что будь то модель Byte «трафик + сцена», модель Alibaba «платформа электронной коммерции + экология» или модель MiniMax «специализация + посадка», они фактически строят собственные экологические барьеры.

Чжан И также отметил, что из войны ИИ во время Весеннего праздника видно, что она перешла от однородной «инволюции» к дифференциации. «Основные направления включают мультимодальность, эффективность агентов и экологическую посадку и т.д., что основано на том, что у разных производителей разные технические навыки, этапы коммерциализации и требования к сценариям.»

По его мнению, это также означает, что вся индустрия переходит от «гонки вооружений» вокруг масштаба параметров к новой стадии конкуренции, которая больше основана на сценариях, более земельных и более подразделённых.

От «ослепительных навыков» до «коммерциализации», от «ранних пользователей» до «популяризации» — в этом году на Весеннем фестивале будет звучать дорожка с искусственным интеллектом, а я выйду на сцену так живо. Когда порог затрат на ИИ постепенно снижается, и пользователи всё чаще сталкиваются с продуктами ИИ, эта интенсивная конкуренция во время Весеннего фестиваля может считаться будущими поколениями историческим поворотным моментом для ИИ — от «праздничных фейерверков» к «ежедневным огням».

(Источник статьи: Daily Economic News)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить