蚂蚁集团 Ling-2.6-flash 模型开源:1040B 参数、7.4B 有效参数,达成多项 SOTA 基准

Gate 新闻简报,4月29日——蚂蚁集团的 Ling-2.6-flash 模型权重现已开源;此前这些权重仅通过 API 提供。该模型总参数量为 1040 亿,单次推理激活为 74 亿,拥有 256K 上下文窗口,并采用 MIT 许可。提供 BF16、FP8 和 INT4 精度版本,现已在 HuggingFace 与 ModelScope 上提供。

Ling-2.6-flash 相较 Ling 2.0 引入了混合线性注意力改进:将原始的 GQA 升级为 1:7 MLA,并结合 Lightning Linear 的混合架构,同时配合高度稀疏的 MoE。推理效率显著超过同类模型:在 4x H20 GPU 上,峰值生成速度达到 340 tokens/s;在可比的开源模型上,prefill 与 decode 的吞吐量约高出 4 倍。与智能体相关的基准测试显示出强劲表现:BFCL-V4、TAU2-bench、SWE-bench Verified (61.2%)、Claw-Eval 以及 PinchBench 达到或接近 SOTA 水平。在完整的 Artificial Analysis 基准测试套件中,总 token 消耗仅为 1500 万。在 AIME 2026 上,该模型得分为 73.85%。

蚂蚁集团的官方网站同样列出了 Ling-2.6-1T ( 万亿参数旗舰版本 ) 以及 Ling-2.6-mini ( 轻量版本 );不过截至发布,权重仍未在 HuggingFace 上发布,当前仅提供 flash 系列下载。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

Altman 表示:OpenAI 模型将逐步迁移到亚马逊定制的 Trainium 芯片,他表示“期待”

Gate 新闻消息,4月29日——根据 OpenAI 首席执行官 Sam Altman 以及 AWS 高管的近期表态,运行在亚马逊网络服务(AWS)Bedrock 上的 OpenAI 模型将逐步迁移到 Trainium。Trainium 是亚马逊专为 AI 定制的芯片。当前,模型在使用 GPU 和 Trainium 的混合环境中运行,且随着时间推移,向 Trainium 的占比会逐步增加。

GateNews49 分钟前

Altman:随着 GPT-5.5 转向任务完成而非代币数量,按代币定价将走向过时

Gate 新闻消息,4月29日——OpenAI 首席执行官 Sam Altman 在接受 Stratechery 的 Ben Thompson 采访时表示,按代币定价并不是 AI 服务的长期可行模式。以 GPT-5.5 为例,Altman 指出,尽管单代币价格相较 GPT-5.4 显著更高,但该模型使用的代币数量要少得多来完成同一任务,这意味着客户并不在意代币数量——他们只关心任务是否完成以及总成本。

GateNews53 分钟前

Sam Altman 发布 Codex 双模式截图,办公与编程功能正式分流

OpenAI 执行长 Sam Altman 于 4 月 29 日在 X 平台发布的截图及声明,Codex 正在推出新版引导界面,用户首次进入时须从两种模式中选择,分别为 Excelmogging 和 Codemaxxing。Codex 目前的周活跃用户已超过 400 万,使用场景已从代码生成延伸至非技术用途。

Market Whisper1小时前

OpenAI 的 Codex 推出双模式界面:办公工作用 Excelmogging,编程用 Codemaxxing

Gate 新闻消息,4月29日——OpenAI 首席执行官 Sam Altman 今天在 X 上宣布,重新设计了 Codex 界面,为用户推出两种截然不同的模式。 “Excelmogging” 面向日常办公任务,采用简化界面,并配有标语 “Same tools, simpler interface,”,示例任务包括创建电子表格。

GateNews2小时前

美媒:白宫行政命令草案允许 Anthropic Mythos 模型进入政府

根据 Axios 于 4 月 28 日引用知情人士的报道,白宫正在制定指引,允许各联邦机构绕过 Anthropic 的供应链风险认定(SCRD),并引入包括 Anthropic 旗下 Mythos 模型在内的新模型供政府使用。就此,白宫发表官方声明称,任何政策声明都将直接由总统发布,其他任何说法都纯属猜测。

Market Whisper2小时前

泰勒·斯威夫特申请声音和图像商标,防范 AI 仿冒内容传播

根据 BBC 于 4 月 28 日的报道,美国流行歌手泰勒·斯威夫特(Taylor Swift)已在美国提交三项商标申请,涵盖声音音频片段及舞台图像,目的是保护其声音与外观免受 AI 仿冒;商标律师 Josh Gerben 首先在其博客上披露了上述申请细节。

Market Whisper2小时前
评论
0/400
暂无评论