Gate 新聞訊息,4 月 29 日——螞蟻集團的 Ling-2.6-flash 模型權重現已開源釋出;此前該模型的權重僅可透過 API 使用。該模型具備 1040 億(104 billion)總參數,每次推論啟用 74 億(7.4 billion)參數,並提供 256K 上下文視窗,且採用 MIT 授權。HuggingFace 與 ModelScope 提供 BF16、FP8 與 INT4 精度版本。
Ling-2.6-flash 相較 Ling 2.0 引入混合線性注意力改進(hybrid linear attention),將原本的 GQA 升級為「1:7 MLA + Lightning Linear」混合架構,並結合高度稀疏的 MoE。推論效率顯著優於同類模型:在 4x H20 GPU 上,峰值生成速度達到 340 tokens/s;預填充(prefill)與解碼(decode)的吞吐量約為可比開源模型的 4 倍。與代理(Agent)相關的基準測試顯示強勁表現:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 與 PinchBench 均達到或接近最新最先進(SOTA)水準。在完整的 Artificial Analysis 基準測試套件中,總 token 消耗僅為 15 million。在 AIME 2026 上,該模型得分為 73.85%。
螞蟻集團官方網站亦列出了 Ling-2.6-1T (trillion-parameter 旗艦版本) 與 Ling-2.6-mini (lightweight 版本);不過截至發布之時,其權重仍未在 HuggingFace 上釋出,僅提供 flash 系列供下載。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
OpenAI Models to Gradually Migrate to Amazon's Custom Trainium Chip, Altman Says He's 'Looking Forward' to It
Gate News message, April 29 — OpenAI models running on Amazon Web Services' Bedrock will gradually migrate to Trainium, Amazon's custom-designed AI chip, according to recent remarks from OpenAI CEO Sam Altman and AWS executives. Currently, models operate in a mixed environment using both GPUs and Tr
GateNews49分鐘前
Altman:隨著 GPT-5.5 將重點轉向任務完成而非代幣數,基於代幣的定價將變得過時
Gate 新聞訊息,4 月 29 日 — OpenAI 執行長 Sam Altman 在接受 Stratechery 節目主持人 Ben Thompson 訪談時表示,基於代幣的定價並不是 AI 服務的長期可行模式。以 GPT-5.5 為例,Altman 指出,儘管每代幣價格比 GPT-5.4 顯著更高,但該模型用遠少的代幣即可完成相同任務,這意味著客戶並不在乎代幣數量——他們只在乎任務是否完成以及總成本。
GateNews53分鐘前
Sam Altman 發布 Codex 雙模式截圖,辦公與編程功能正式分流
OpenAI 執行長 Sam Altman 於 4 月 29 日在 X 平台發布的截圖及聲明,Codex 正在推出新版引導介面,用戶首次進入時須從兩種模式中選擇,分別為 Excelmogging 和 Codemaxxing。Codex 目前的周活躍用戶已超過 400 萬,使用場景已從代碼生成延伸至非技術用途。
Market Whisper1小時前
OpenAI 的 Codex 推出雙模式介面:用於辦公工作的 Excelmogging,以及用於程式設計的 Codemaxxing
Gate 新聞訊息,4 月 29 日——OpenAI 執行長 Sam Altman 今天在 X 上宣布重新設計的 Codex 介面,並為使用者推出兩種截然不同的模式。"Excelmogging" 面向日常辦公任務,採用更精簡的介面,並配有口號「同樣的工具,更簡潔的介面」,包含例如建立試算表等示例任務。
GateNews2小時前
美媒:白宮行政命令草案允許 Anthropic Mythos 模型進入政府
根據 Axios 於 4 月 28 日引述知情人士的報道,白宮正在制定指引,允許各聯邦機構繞過 Anthropic 的供應鏈風險認定(SCRD),並引入包括 Anthropic 旗下 Mythos 模型在內的新模型供政府使用。就此,白宮發表官方聲明稱,任何政策聲明都將直接由總統發布,其他任何說法都純屬猜測。
Market Whisper2小時前
泰勒絲申請聲音及圖像商標,防範 AI 仿冒內容傳播
根據 BBC 於 4 月 28 日的報道,美國流行歌手泰勒絲(Taylor Swift)已在美國提交三項商標申請,涵蓋聲音音頻片段及舞台圖像,目的是保護其聲音與外觀免受 AI 仿冒;商標律師 Josh Gerben 首先在其部落格上披露了上述申請細節。
Market Whisper2小時前