Gate News 消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 于 4 月 24 日正式发布,并开源发布;上下文处理长度从 128K 大幅扩展至 1M,容量提升接近 10 倍。华为计算宣布其 Ascend 超算节点产品通过芯片与模型技术的紧密协作,全面支持 DeepSeek V4 系列模型。
华为 Ascend 950 通过融合算子内核与多流并行等技术,实现高吞吐、低时延的 DeepSeek V4 模型推理部署,以降低 Attention 计算及内存访问开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐达 4,700 TPS;对于输入低于 8K 的 DeepSeek V4-Flash,吞吐可达约 10ms TPOT、1,600 TPS。Ascend A3 超算节点系列同样实现全面兼容,并提供训练参考实现以便快速微调。基于采用大 EP 模式的 Ascend A3 64 卡超算节点,使用 vLLM 推理引擎,DeepSeek V4-Flash 在 8K/1K 输入输出场景下实现单卡 Decode 吞吐超过 2,000 TPS。华为全线 Ascend A2、A3 和 950 产品均支持 DeepSeek V4-Flash 与 V4-Pro。
华为云宣布与 DeepSeek V4 的“先发兼容”,通过其 MaaS 平台为开发者提供一键式 API Token 服务。华为云优化系统层、算子层和集群层能力,确保模型快速适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成了 DeepSeek 的新模型。
寒武纪同样宣布基于 vLLM 推理框架的 DeepSeek V4-Flash 与 V4-Pro Day 0 兼容性,并将适配代码开源至 GitHub 社区。寒武纪此前在去年 DeepSeek V3.2 发布时也实现了“先发适配”,在 DeepSeek 系列模型上开展了深度的软件-硬件协同性能优化。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
137 Ventures 在新资金中完成 $700M ,管理资产(AUM)达到 150 亿美元
据 ChainCatcher 报道,137 Ventures,这家是 SpaceX 的早期投资者,最近已完成两只新基金的募资,总计超过 7 亿美元,使其管理资产规模提升至超过 150 亿美元。新资金将支持在 AI 代理、机器人和太空推进方面的投资
GateNews2 分钟前
Reddit 在强劲的 Q2 展望带动下飙升 16%;苹果面临 Mac 供应短缺,因 AI 需求超过供给
Reddit 的股价在周五开盘前上涨了 16%,原因是该公司发布了高于预期的未来一个季度营收展望。日活跃访问者增长 17% 至 1.268 亿人次,而全球人均营收跃升 44%,受 AI 驱动的
GateNews12 分钟前
美国国防部与包括 OpenAI、Google 和 Microsoft 在内的 7 家 AI 公司达成协议
据美国国防部称,该机构今天(5 月 1 日)与七家领先的人工智能公司签署了协议:SpaceX、OpenAI、Google、Nvidia、Reflection、Microsoft 和亚马逊云服务(AWS)。这些协议旨在加速军事转型并建立 t
GateNews22 分钟前
Datavault AI 与 King Mining Capital 在 $150M Gold 代币化计划上达成合作
据 Businesswire 称,5 月 1 日,纳斯达克上市公司 Datavault AI 宣布与 King Mining Capital 达成战略合作,以推出 GoldVault,该金牌代币化计划规模超过 1.5 亿美元。根据该协议,Datavault AI 将收购 King Mining Capital 5% 的股权份额,并且
GateNews47 分钟前
Nebius 同意以 $643M 的现金与股票收购 Eigen AI
据 Nebius 称,这家 AI 基础设施公司已同意于 5 月 1 日以约 6.43 亿美元现金和 A 类股份收购 Eigen AI。交易价值基于 Nebius 在签署前的 30 天加权平均股价计算,并将进行符合惯例的调整。Eigen AI
GateNews1小时前
Meta 发债 250 亿美元支撑 AI:2026 资本支出冲 1,450 亿美元
Meta 于 4/30 完成 250 亿美元六批债发行,最长期至 2066 年,初价较美国国债高约 180 个基点,认购约 960 亿但低于上次。同步将 2026 年资本支出上修至 1,250–1,450 亿美元,创办人亦坦承尚无逐项 AI 产品计划。财报后股价下跌 7%,显示市场对 AI 投入“变现”仍存疑。若 ROI 未明朗,未来 12 个月科技巨头债发行潮与利差扩大风险并存。
鏈新聞abmedia2小时前