根据 Nvidia 最新博客分析,Blackwell GPU 的每小时成本几乎是 Hopper 代际的两倍,但每个 token 的推理成本却低 35 倍。以 DeepSeek-R1 作为测试模型,Blackwell(GB300 NVL72)按每 GPU 每小时 2.65 美元出租,而 Hopper 为 1.41 美元;但单个 GPU 的吞吐量从 90 跃升至 6,000 每秒 token。这样 65 倍的吞吐量增益使每百万 token 成本从 4.20 美元降至 0.12 美元。
0.12 美元这一数值假设完成了全套软件优化,包括 FP4 低精度推理和多 token 预测(MTP)。如果未启用 MTP,每百万 token 成本约为 2.35 美元,启用后降至 0.11 美元,表明仅该特性就带来了 21 倍的优化效果。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
Forefront Tech 完成 $100M IPO 定价,计划在 Nasdaq 上市
据 ChainCatcher 报道,Forefront Tech Holdings Acquisition Corp 于 4 月 30 日完成 1 亿美元 IPO 定价,计划在纳斯达克上市,股票代码为 FTHAU。募集资金将用于探索区块链、人工智能、金融科技及其他领域的并购机会
GateNews36 分钟前
前 Meta 高管为 AI 初创公司 Flourish 融资,并以 25 亿美元估值
据 Bloomberg,曾领导 Meta 的 Neural Band 相关工作的前 Meta 高管 Thomas Reardon 正在为 Flourish 融资,这是一家专注于低功耗 AI 系统的新 AI 初创公司。Lux Capital 和 Google Ventures 已同意成为主要投资方,支持者目前已承诺投入 5 亿美元,估值 2.5
GateNews38 分钟前
OpenAI 追踪 Goblin 问题到书呆子型人格奖励信号,Goblin 提到其在 GPT-5.1 中飙升 175%
根据 OpenAI, 该公司已找出从 GPT-5.1 起困扰 GPT 模型的“地精”问题的根本原因。用于强化“书呆子”人格特质的奖励信号会鼓励生成包含奇幻生物引用的内容,其中训练数据集有 76.2% 的内容显示
GateNews1小时前
并行 Web 系统以 $100M 估值进行 $2B 系列 B 融资,由红杉领投
据 TechCrunch 报道,Parallel Web Systems,这家由前 Twitter 首席执行官 Parag Agrawal 创立的人工智能初创公司,已在 Sequoia 领投的 B 轮融资中筹集 1 亿美元,估值 20 亿美元。该轮融资使公司的融资总额达到 2.3 亿美元,距离其 1 亿美元的 A 轮融资仅过去五个月。Parallel Web Systems
GateNews1小时前
BitMart 币市 8 周年晚宴:为台湾用户导入 AI 自动化交易与本地化服务
BitMart 币市於台北君品舉辦 8 週年晚宴,超过 150 位嘉賓出席,回顾八年发展並宣布在地化与 AI 自动交易策略。BitMart Skill 結合 Blave,让用戶无需程式即可透过 AI 自动交易並取得即时數據洞察。全球用戶突破 1300 万、上線項目超过 4800、交易量逾 1 万亿美元。晚宴设有真人财神爺与豐厚禮品,展现深耕台灣的決心。
鏈新聞abmedia2小时前
软银计划 2026 年上市 Roze,估值目标 1000 亿美元
根据《金融时报》(FT)于 4 月 30 日独家报道,软银(SoftBank)正计划在美国拆分成立一家全新独立公司,名为 Roze,业务涵盖 AI 机器人与数据中心基础设施,目标最快于 2026 年完成 IPO,估值目标定于 1,000 亿美元。《金融时报》同时报道,软银内部对估值目标及 IPO 时间表存在疑虑。
Market Whisper2小时前