## NVIDIA Rubin平台官宣:推理成本狂降10倍,GPU缩减4倍,2026年下半年交付
NVIDIA在CES 2025上正式宣布了AI芯片的下一代重磅产品Rubin平台,这是该公司延续每年迭代更新的传统。根据CEO Jensen Huang的现场公布,Rubin的六大核心芯片已从代工厂返回,并完成了关键性测试验证,确认能够按计划部署。这意味着NVIDIA在AI加速器领域继续保持技术领先地位,同时也回应了华尔街对其竞争压力和AI投资持续性的担忧。
### 性能飙升,成本显著下降
在Rubin cena(价格)方面,虽然NVIDIA暂未公布具体报价,但其成本效益获得显著提升。与前代Blackwell平台相比,Rubin的训练性能提升3.5倍,推理性能提升5倍。更引人瞩目的是,Rubin能将推理过程中的token生成成本降低10倍——这对依赖大模型推理的企业而言意味着运营成本的大幅削减。
此外,Rubin将训练混合专家模型(MoE)所需的GPU数量减少了4倍。这意味着企业可以用更少的硬件投入实现相同的性能目标,直接改善了采购投资回报率。
### 技术创新六大支柱
Rubin平台集成了五项突破性技术。其中,全新Vera CPU采用88个定制Olympus核心,基于Armv9.2架构,单核性能是竞品方案的两倍。这款CPU特别为AI代理推理优化,是当前大规模AI工厂中能效最优的处理器