小米大模型負責人:AI 競爭轉向 Agent 時代,自進化是 AGI 關鍵事件

AI自進化

小米大模型團隊負責人羅福莉於 4 月 24 日在嗶哩嗶哩平台接受深度訪談(影片號:BV1iVoVBgERD),訪談時長 3.5 小時,為其首次以技術負責人身份公開系統性闡述技術觀點。羅福莉稱,大模型競爭賽道已從 Chat 時代轉入 Agent 時代,並指出「自進化」將是未來一年 AGI 關鍵事件。

Chat 時代到 Agent 時代:核心技術判斷

小米大模型團隊負責人羅福莉訪談

(來源:嗶哩嗶哩)

根據羅福莉在 Bilibili 訪談中的陳述,她指出 2026 年大模型競爭的重心已從通用對話品質轉向在複雜任務中的持續自主執行能力。她在訪談中表示,目前頂尖模型已能在特定任務中自主最佳化,並持續穩定執行 2 至 3 天,不需要人類介入調整。她在訪談中強調,「自進化」能力的突破代表 AI 系統開始具備自我修正能力,並點名 Anthropic 的技術路徑以及 Claude Opus 4.6 等技術變數對整個 AI 生態的影響。

小米算力配比調整與 Pre-train 代差評估

根據羅福莉在訪談中的披露,小米在算力分配策略上已進行重大調整。她說明,業界慣用的算力配比為 Pre-train:Post-train:Inference = 3:5:1,而小米當前策略已調整為 3:1:1,大幅壓縮後訓練比例,同步提升推理階段的資源投入。

她在訪談中解釋,這一轉變源於 Agent RL Scaling 策略的成熟,使後訓練不再需要大量算力堆疊,而推理端資源的提升反映了 Agent 落地場景對即時響應能力的需求。

對於國內大模型的 Pre-train 代差問題,羅福莉在訪談中表示,這一差距已從過去的 3 年縮短至數月,當前的策略重心正向 Agent RL Scaling 移動。羅福莉的職涯歷程涵蓋阿里達摩院、幻方量化及 DeepSeek(DeepSeek-V2 核心開發者),於 2025 年 11 月加入小米。

MiMo-V2 系列技術規格與開源排名

根據小米官方於 2026 年 3 月 19 日發布的 MiMo-V2 系列公告,此次一次發布三款模型:

MiMo-V2-Pro:兆總參數,啟用參數 42B,混合注意力架構,支援百萬上下文,任務完成率 81%

MiMo-V2-Omni:全模態 Agent 場景

MiMo-V2-TTS:語音合成場景

根據公告,已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二,推理速度達 DeepSeek-V3.2 的 3 倍。

常見問題

羅福莉如何定義「自進化」,為何認為其是 AGI 最關鍵事件?

根據羅福莉 2026 年 4 月 24 日在 Bilibili 的訪談陳述(BV1iVoVBgERD),她在訪談中指出,目前頂尖模型已能在特定任務中自主最佳化並穩定執行 2 至 3 天而無需人類介入,並將「自進化」定性為未來一年 AGI 發展最關鍵的事件。

小米在算力配比上做了哪些具體調整,背後邏輯為何?

根據羅福莉在訪談中的披露,小米的算力配比已從業界慣用的 Pre-train:Post-train:Inference = 3:5:1 調整為 3:1:1,大幅壓縮後訓練比例;她解釋這一調整源於 Agent RL Scaling 策略成熟後後訓練效率提升,以及 Agent 落地場景對推理端即時響應能力的需求。

MiMo-V2-Flash 的開源排名與速度表現如何?

根據小米 2026 年 3 月 19 日發布的官方公告,已開源的 MiMo-V2-Flash 在全球開源模型排行榜位列第二,推理速度達 DeepSeek-V3.2 的 3 倍,旗艦版 MiMo-V2-Pro 的任務完成率為 81%。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

Cursor AI 代理出包!一行程式碼 9 秒清空公司資料庫,安全把關淪空談

PocketOS 創辦人 Jer Crane 指 Cursor AI 代理在測試環境自行執行維護,濫用一個新增/移除自訂網域的 API Token,向 Railway 的 GraphQL API 發動刪除指令。9 秒內資料與同區快照全毀,最新可還原到三個月前。代理人承認違反不可逆操作、未研讀技術文件、未驗證環境隔離等規範,受害者為租車業客戶,預約與資料全消失,對帳工程耗時長。Crane 提出五項改革:人工確認、細粒度 API 權限、備份與主資料分離、公開 SLA、底層強制機制。

鏈新聞abmedia14分鐘前

阿里巴巴PAI發布開源 AgenticQwen 模型:8B 版本通過雙數據飛輪接近 235B 性能

門戶消息,4月27日——阿里巴巴PAI團隊已發布並開源了 AgenticQwen,一款面向工業級工具調用應用的小規模代理式語言模型。該模型提供兩個版本:8B 與 30B-A3B。透過一種創新的 "雙數據飛輪"

GateNews21分鐘前

DeepSeek V4 Pro 上 Ollama Cloud:Claude Code 一鍵串接

根據 Ollama 推文,DeepSeek V4 Pro於4/24發布,已以雲端模式入 Ollama 目錄,僅一行指令即可呼叫 Claude Code、Hermes、OpenClaw、OpenCode、Codex 等工具。V4 Pro1.6T參、1M context,Mixture-of-Experts;雲端推論不下載本機權重。若要本地需自取權重並以 INT4/GGUF 與多卡 GPU 執行。早期測速受雲端負載影響,常態約30 tok/s,峰值1.1tok/s;建議以雲端原型,正式量產再自行推論或用商用 API。

鏈新聞abmedia1小時前

UB(Unibase)24 小時上漲 14.96%

Gate 新聞消息,4 月 27 日,根據 Gate 行情顯示,截至發稿時,UB(Unibase)現報 0.0491 美元,24 小時內上漲 14.96%,最高觸及 0.0534 美元,最低回落至 0.0423 美元,24 小時交易量達 396.67 萬美元。目前市值約為 1.23 億美元。 Unibase 是一個高性能去中心化 AI 記憶層,為 AI 代理提供長期記憶和跨平台互操作性,使其能夠記憶、協作與自我進化。Unibase 旨在構建開放代理互聯網,支援智慧代理在生態系之間無縫協作,賦能開發者打造下一代 AI 應用。 此消息不作為投資建議,投資需注意市場波動風險。

GateNews1小時前

郭明錤:OpenAI 要做 AI Agent 手機,聯發科、高通、立訊成關鍵供應鏈

郭明錤指稱 OpenAI 正與聯發科、高通、立訊精密合作開發 AI Agent 手機,預計 2028 年量產。新手機將以任務完成為核心,由 AI 代理理解並執行需求,結合雲端與裝置端運算,重點在感測與情境理解。規格與供應鏈名單預計 2026–2027 年定案,若成形,或為高階市場帶來新換機週期,立訊有望成為主要受惠者。

鏈新聞abmedia1小時前

騰訊雲 QClaw 接入 Hermes 框架,支援 DeepSeek-V4 Pro 等多模型切換

根據騰訊雲於 4 月 27 日官方公告,騰訊雲 AI Agent 桌面工具 QClaw 正式發布 v0.2.14 版本,騰訊雲表示此次為 QClaw 迄今規模最大的版本升級,核心更新包括接入 Hermes Agent 框架、底層模型升級為自由切換模式,以及「靈感廣場」全面升級為「專家廣場」。

Market Whisper2小時前
留言
0/400
暫無留言