🍀 Spring Date with Fortune, Prizes with Raffle! Growth Value Phase 1️⃣ 7️⃣ Spring Raffle Carnival Begins!
Seize Spring's Good Luck! 👉 https://www.gate.com/activities/pointprize?now_period=17
🌟 How to Participate?
1️⃣ Enter [Square] personal homepage, click the points icon next to your avatar to enter [Community Center]
2️⃣ Complete Square or Hot Chat tasks such as posting, commenting, liking, speaking to earn growth value
🎁 Every 300 points can raffle once, 10g gold bars, Gate Red Bull gift box, VIP experience card and more prizes waiting for you to win!
Details 👉 https://www.gate.com/ann
1萬美元=4個Agent全年無休 MiniMax M2.5重構成本模型 AI規模化落地的臨界點到了?
春节AI(人工智能)大戰,MiniMax(HK00100,股價680.0港元,市值2132.72億港元)沒有缺席。
2月12日,MiniMax正式上線最新旗艦編程模型MiniMax M2.5。据悉,作為全球首個為Agent(智能體)場景原生設計的生產級模型,其編程與智能體性能(Coding&Agentic)比肩國際頂尖模型,直接對標Claude Opus 4.6,支持PC(個人電腦)、App(應用程序)、跨端應用的全棧編程開發。
或受此消息影響,截至2月13日港股收盤,MiniMax股價上漲15.65%,總市值2132.72億港元。
同樣值得注意的是,M2.5-lightning版本支持100 TPS(每秒交易處理量)以上輸出速度,是主流模型的2倍左右;輸入價格約0.3美元/百萬Token(令牌/詞元),輸出價格約2.4美元/百萬Token。
若按每秒輸出100 Token計算,連續運行一小時成本約1美元;若按50 Token計算,成本約0.3美元。這意味著,1萬美元理論上可支持4個Agent連續工作一年。
春節前夕,各家AI企業的押注方向已經出現區別。有的玩家押注多模態、有的搶灘C端(消費者端)入口,MiniMax卻將籌碼悉數押在Agent場景的“性能與成本雙突破”上。這是價格戰的前奏,還是加速AI商業化落地的新路徑?
上線文本模型背後:MiniMax想要重構Agent經濟?
就MiniMax M2.5這一模型的性能,快思慢想研究院院長田豐對《每日經濟新聞》記者表示,從M2.5的定位來看,它是“原生Agent生產級模型”,其核心價值在於為Agent場景提供可靠的任務文本理解和複雜問題長程推理能力。
“在編程、工具調用、複雜任務拆解等Agent核心能力上,M2.5已經達到全球SOTA(State of the Art,最先進的)水平,這些能力是構建高效Agent的基石。”田豐表示。
種種跡象都表明,MiniMax對Agent的布局已然清晰。
過去108天,MiniMax從M2、M2.1迭代至M2.5,在SWE-Bench Verified(軟件工程基準測試)成績從69.4提升至80.2分。記者了解到,團隊將這一躍升歸因於大規模Agent強化學習(RL Scaling)。
据了解,其自研Forge框架通過解耦訓練引擎與Agent,实现對任意Agent腳手架和工具的泛化優化,并通過異步調度與樹狀合併策略實現約40倍訓練加速。
同時,在算法層面採用CISPO優化與過程獎勵機制,緩解長上下文場景中的信用分配問題,並將“任務真實耗時”納入獎勵函數,在效果與響應速度之間取得平衡。
2月12日,M2.5已在MiniMax Agent上線,並於13日全球開源支持本地化部署。不到一天,來自全世界的用戶已在MiniMax Agent上構建了1萬多個專家,且數量仍在快速增長。
MiniMax表示,希望在持續提升模型能力的同時,構建一個可持續擴展的Agent生態——Agent Universe。
值得一提的是,在現階段,AI企業的押寶重點更多在多模態大模型等方向,MiniMax在此時推出文本大模型,意欲何為?
就此,田豐表示,MiniMax把幾乎所有資源都集中押在了基座模型能力的持續提升上,“M2.5的推出是這一戰略的延續——先有底座模型能力,再向外輻射到具體應用場景”。
不過,他也提到,MiniMax是國內最早採用全模態模型技術路線的企業之一,推出純文本模型並非放棄多模態,而是在已有全模態能力基礎上,針對Agent場景進行專項優化。
艾媒咨詢CEO張毅則向記者表示,MiniMax大力推進低成本大模型,背後是一條清晰的差異化路線:避開多模態競爭的紅海賽道,直擊Agent在落地過程中成本高、效率低的核心痛點。
除了性能上的進展,外界對M2.5的一大關注點便是成本控制。MiniMax方面認為,當性能與成本不再構成約束,Agent規模化部署的經濟模型將發生根本變化。
就M2.5在成本控制上的表現,北京市社會科學院副研究員王鵬對記者表示,MiniMax等廠商將Agent使用成本壓至極低水平,標誌著AI商業化從“技術驗證”進入“規模替代”階段。
王鵬認為,過去,高昂的推理成本限制了Agent的應用場景(僅能用於高價值任務),而如今低成本使得企業可以批量部署AI,處理日常重複性工作(如客服、數據錄入),甚至創造新的商業模式(如按結果付費的AI服務)。
行業是否會走向價格比拼?專家:更可能引發“價值戰”
值得一提的是,春節前夕,不少AI企業都進行了Agent相關布局。
在產品上,各路玩家正在馬不停蹄地搶占先機。2月11日,美團LongCat發布原生“深度研究”Agent。用戶盲測顯示,其攻略“整體可用率”達61.1%,優於ChatGPT的42.8%。目前該功能已在LongCat網頁免費開放。
1月20日,MiniMax發布Agent2.0版本,定位“AI原生工作台”,不僅上線桌面端,支持Mac和Windows,還推出面向專業垂直場景的“專家Agents”。1月19日,階躍星辰正式官宣,全新升級電腦端Agent產品“階躍AI桌面夥伴”,並推出Windows版本,可以免費使用。
就模型方面而言,2月3日晚,阿里開源新一代智能體編程模型Qwen3-Coder-Next,仅激活3B,其智能體編程性能就可媲美DeepSeek-V3.2、GLM-4.7等頂級開源模型。
据了解,基於技術新突破,“小快靈”的Qwen3-Coder-Next推理成本顯著降低,僅為同等性能模型成本開銷的5%到10%,特別適用於家用電腦、輕量伺服器等低成本智能體部署場景,也是目前Agent編程能力最強的小型開源編程模型。
阿里方面表示,面臨現實世界中令Agent頭疼的長上下文推理、工具使用、從執行失敗中恢復等難題,千問這一新模型都能從容應對。
可以發現,就與Agent相關的大模型而言,降低成本是目前行業的主攻方向。這是否意味著,隨著M2.5的入場,行業有可能走向價格比拼?
“這未必是燒錢換市場。”對此,張毅認為,其低價主要是通過技術優化實現的,不完全是補貼燒錢的老路。“至於是否可能引發價格戰,得觀察後續市場的變化。但可以肯定的是,它會加速(淘汰)低效的競品,行業也轉向性能加成本的雙維競爭。”
田豐則認為,M2.5的低成本是技術架構優化和工程能力提升的必然結果,將推動Agent從“概念驗證”走向“規模化商用”,更可能引發“價值戰”而非傳統“價格戰”。
“我們預測,大模型行業每年降低10倍推理成本是很可能持續下去的趨勢。M2.5的出現將加速這一趨勢,推動整個行業向更高效、更低成本的方向發展。”田豐說。
他還提到,此前Agent產品的定價普遍較高,主要面向企業級客戶,M2.5帶來的成本優勢有望讓Agent走向更廣泛的中小企業市場、開發者市場,甚至個人用戶。“這或將擴大整個Agent市場的規模,而非單純的價格競爭。”
在王鵬看來,Agent的爆發和成本下降,標誌著AI從“技術奇點”走向“產品奇點”,“如同智能手機取代功能機,未來AI的競爭將不再是參數大小,而是能否真正融入工作流程、創造實際價值”。
春節AI大戰如火如荼,AI規模化落地的臨界點到了?
就行業集體押注Agent的原因,王鵬認為,其背後本質是技術範式從“被動響應”向“主動執行”的躍遷。
“傳統大模型如同‘知識庫’,而Agent更像‘數字員工’,能拆解任務、調用工具、處理異常,甚至自我優化。這種轉變源於企業需求升級:用戶不再滿足於獲取信息,而是要求AI直接完成工作閉環(如自動處理訂單、生成財報)。”王鵬說。
隨著新模型和新產品的集體上線,截至目前,就Agent賽道而言,各企業之間開始拉開差距了嗎?
对此,田豐認為,Agent大模型賽道確實正在拉開差距,但這一差距更多體現在工程化能力、場景落地能力和成本效益三個維度,而非單純的參數規模或基礎能力。
值得一提的是,當前,各企業對Agent的布局背後離不開對AI商業化落地的迫切需求。
田豐便指出,M2.5被明確定位為“原生Agent生產級模型”,所有核心能力提升都圍繞編程、工具調用、辦公生產力等高價值經濟任務展開。這種專業化路徑的選擇,體現了MiniMax對商業化落地的深刻理解。
同樣值得注意的是,今年春節期間,AI已成為各大科技企業重點布局的賽道。儘管各家發力路徑各有側重,但行業已展現出逐漸趨同的共識與方向。
田豐提到,行業正從“拼參數”轉向“拼營收”“拼利潤”,單純的技術領先已不足以確保市場勝利,誰能更快地將技術優勢轉化為可量化的商業收入,誰就能贏得最終勝利。
此外,他認為,無論是字節的“流量+場景”模式、阿里的“電商平台+生態”模式,還是MiniMax的“專業化+落地”模式,本質上都是在構建各自的不同生態壁壘。
張毅也提到,從春節的AI大戰可以看出,已經由同質化“內卷”走向差異化的方向。“廠商發力方向明顯出現分化,主要路徑包括多模態、Agent效率和生態可落地等,根源在於不同廠商在技術化禀賦、商業化的階段和場景訴求上存在差異。”
在他看來,這也標誌著整個行業正從圍繞參數規模的“軍備競賽”,轉向更場景化、更落地、更細分的全新競爭階段。
從“炫技”走向“商用”,從“嘗鮮”走向“普及”,今年春節,AI賽道你方唱罷我登台,好不熱鬧。當AI的成本門檻逐漸拉低,當用戶開始越來越多地接觸到AI產品,這場春節期間的密集競演,或許將被後人視為AI從“節日煙火”走向“日用燈火”的歷史性轉折點。
(資料來源:每日經濟新聞)