O custo das GPUs Nvidia Blackwell dobra, mas a despesa com inferência por token cai 35x em comparação com a Hopper

De acordo com a análise mais recente do blog da Nvidia, as GPUs Blackwell custam quase o dobro por hora em comparação com a geração Hopper, mas entregam 35 vezes menos custos de inferência por token. Usando o modelo de teste DeepSeek-R1, Blackwell (GB300 NVL72) é alugado por US$ 2,65 por GPU por hora, enquanto o Hopper custa US$ 1,41. Ainda assim, o throughput de uma única GPU salta de 90 para 6.000 tokens por segundo. Esse ganho de throughput de 65x reduz os custos por milhão de tokens de US$ 4,20 para US$ 0,12.

O valor de US$ 0,12 pressupõe otimização total de software, incluindo inferência com FP4 em baixa precisão e previsão de múltiplos tokens (MTP). Sem MTP habilitado, os custos por milhão de tokens chegam a aproximadamente US$ 2,35, caindo para US$ 0,11 com ele ativo, demonstrando um impacto de otimização de 21x atribuível apenas a esse recurso.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Forefront Tech conclui a precificação do IPO $100M e planeja abrir listagem na Nasdaq

De acordo com a ChainCatcher, a Forefront Tech Holdings Acquisition Corp concluiu a precificação de uma IPO de US$ 100 milhões em 30 de abril, com previsão de listagem na Nasdaq sob o ticker FTHAU. Os recursos serão usados para explorar oportunidades de fusões e aquisições em blockchain, inteligência artificial, fintech e outras

GateNews36m atrás

Ex-executivo da Meta arrecada fundos para startup de IA Flourish em avaliação de US$ 2,5 bilhões

De acordo com a Bloomberg, Thomas Reardon, ex-executivo da Meta que liderou o trabalho na Meta's Neural Band, está levantando fundos para a Flourish, uma nova startup de IA focada em sistemas de IA de baixo consumo. A Lux Capital e a Google Ventures concordaram em ser grandes investidoras, com apoiadores que já se comprometeram com US$ 500 milhões em uma avaliação de US$ 2,5

GateNews38m atrás

OpenAI rastreia o problema do Goblin até um sinal de recompensa de personalidade nerd, menções ao Goblin disparam 175% no GPT-5.1

De acordo com a OpenAI, a empresa identificou a causa raiz do problema dos “goblins” que assolou os modelos de GPT a partir do GPT-5.1. Um sinal de recompensa usado para reforçar a característica de personalidade “Nerdy” incentivou outputs que continham referências a criaturas de fantasia, com 76,2% do conjunto de treinamento mostrando

GateNews1h atrás

A Parallel Web Systems capta uma Série B da $100M em uma avaliação de $2B , liderada pela Sequoia

De acordo com a TechCrunch, a Parallel Web Systems, uma startup de IA fundada pelo ex-CEO do Twitter Parag Agrawal, levantou US$ 100 milhões em uma rodada Series B liderada pela Sequoia, avaliando a empresa em US$ 2 bilhões. A rodada eleva o financiamento total da companhia para US$ 230 milhões, cinco meses após sua Series A de US$ 100 milhões. Parallel

GateNews1h atrás

Jantar de 8 anos da BitMart: apresenta negociações automatizadas com IA e serviços localizados para usuários de Taiwan

A BitMart sediou um jantar de comemoração de 8 anos em Tóquio, no King-Place em Taipei, com a presença de mais de 150 convidados, revisitando oito anos de desenvolvimento e anunciando iniciativas de localização e estratégias de trading automático com IA. O BitMart Skill, em conjunto com a Blave, permite que os usuários façam trading automático com IA sem necessidade de programação, obtendo insights de dados em tempo real. A base global de usuários ultrapassou 13 milhões, os projetos disponíveis passaram de 4.800 e o volume de negociações superou US$ 1 trilhão. O jantar contou com um Papai Noel real e muitos prêmios, demonstrando a determinação de se aprofundar no mercado de Taiwan.

ChainNewsAbmedia2h atrás

A SoftBank planeja abrir capital da Roze em 2026, com uma meta de valuation de US$ 100 bilhões

De acordo com uma reportagem exclusiva do Financial Times (FT) de 30 de abril, a SoftBank planeja desmembrar e criar uma nova empresa independente nos Estados Unidos, chamada Roze, com atividades que incluem robôs de IA e infraestrutura de data centers, com o objetivo de concluir um IPO o mais rápido possível em 2026, com uma meta de valuation de US$ 100 bilhões. O Financial Times também informou que, internamente, a SoftBank tem dúvidas sobre a meta de valuation e o cronograma do IPO.

MarketWhisper2h atrás
Comentário
0/400
Sem comentários