DeepSeek V4 será lançado no final de abril, confirmado internamente por Liang Wenfeng: uma janela de 1 milhão de tokens, totalmente executado nos chips Huawei Ascend 950 PR

動區BlockTempo

O fundador da DeepSeek, Liang Wenfeng, confirmou pessoalmente, numa comunicação interna, que o novo modelo de bandeira V4 da próxima geração será lançado oficialmente no final de abril. De acordo com especificações divulgadas, o número total de parâmetros aproxima-se de 1 bilião, com suporte a uma janela de contexto de cerca de 1 milhão de tokens e, além disso, será executado totalmente nos chips Huawei Ascend, sendo visto como um passo-chave para reduzir a dependência da NVIDIA e representar uma quebra para a IA na China.
(Antecedentes: DeepSeek V4 recusa a NVIDIA e escolhe a Huawei! A Alibaba, ByteDance e a Tencent correm para comprar chips Huawei 950PR)
(Informação adicional de contexto: A DeepSeek lançou o «Modo de Especialista» e o «Modo de Visão»; o V4 será o aquecimento final antes do lançamento oficial?)

Segundo o que foi citado pelo 《Sina Finance》, o fundador da DeepSeek, Liang Wenfeng, já revelou que o novo modelo de grandes proporções de bandeira, DeepSeek V4, será apresentado oficialmente no final de abril. Embora a empresa ainda não tenha divulgado uma data exata, a comunidade de programadores já sentiu antecipadamente os sinais de aquecimento: a variante V4-Lite está a ser testada em nós de API, a velocidade de inferência aumentou 30% face à geração anterior e a taxa de recuperação do contexto de 128K tokens atingiu 94%.

Mil milhões de parâmetros, janela de milhões de tokens

Com base nas informações não oficiais atualmente divulgadas, a arquitectura do V4 mantém o desenho Mixture-of-Experts (MoE), com um total de parâmetros na ordem de 1 bilião. No entanto, os parâmetros realmente activados por cada token rondam apenas cerca de 37 mil milhões, mantendo a eficiência de computação e o estilo habitual dos «actuários» da DeepSeek.

Quanto à janela de contexto: o V4, através de um novo módulo Engram, deverá suportar um contexto ultra-longo de 1 milhão de tokens, competindo com os modelos de topo actuais. O conceito central do Engram é a pesquisa de memória condicionada, permitindo que o modelo aceda ao conhecimento com uma complexidade de O(1), em vez de expandir linearmente com o comprimento da sequência.

Em termos de capacidades, os testes de referência divulgados indicam HumanEval a 90% e SWE-bench Verified acima de 80%; se os dados forem fiáveis, isso também se aproxima dos actuais modelos de bandeira dominantes. Quanto às modalidades, o V4 suporta nativamente entradas de texto, imagens e vídeos. A política de preços é de cerca de $0.30/MTok (entrada), mantendo a estratégia de baixo custo da DeepSeek.

Corre totalmente em chips da Huawei: o maior sinal geopolítico

Para além das especificações técnicas, o ponto que mais tem atraído a atenção do público no V4 é uma viragem total na estratégia de hardware: a empresa afirma que todo o modelo será executado inteiramente nos chips Huawei Ascend 950 PR, sem depender de quaisquer GPUs NVIDIA.

As implicações desta decisão vão muito além da própria DeepSeek. A Alibaba, a ByteDance e a Tencent já estão a comprar, em grandes quantidades, chips de próxima geração da Huawei. Se o V4 conseguir validar que o Ascend consegue sustentar as necessidades de treino e inferência dos modelos de bandeira de topo, isso será o caso de utilização prático mais convincente até agora na autonomização da cadeia de fornecimento de IA na China ao nível dos chips.

Neste contexto, as medidas de restrição dos EUA à exportação da NVIDIA podem, pelo contrário, tornar-se um catalisador para acelerar a maturidade do ecossistema autónomo da China.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Hong Kong vai anunciar amanhã a sexta lista de principais empresas

O secretário financeiro de Hong Kong, Paul Chan, anunciou a divulgação de uma nova lista de principais empresas, atraindo mais de 100 negócios avaliados acima de 100 bilhões de HKD em setores como ciências da vida, IA e fintech, destacando o apelo de Hong Kong para investimentos internacionais.

GateNews57m atrás

O Robô Lightning da Honor Vence a Meia Maratona de Robôs Humanoides de Pequim 2026 com 50:26

O robô humanoide "Lightning" da Honor estabeleceu um novo recorde na Meia Maratona de Robôs Humanoides Yizhuang de Pequim 2026, concluindo a corrida em 50 minutos e 26 segundos, superando o recorde mundial humano.

GateNews4h atrás

A ação da Meta sobe 1,73% enquanto a empresa planeja demitir 8.000 funcionários a partir de 20 de maio

A Meta Platforms planeja cortar cerca de 8.000 empregos, ou 10% de sua força de trabalho, a partir de 20 de maio, apesar da alta das cotações das ações. A empresa, com mais de $200 bilhões em receita, está focando investimentos em IA diante de uma reestruturação significativa, alinhando-se às tendências do setor de demissões.

GateNews11h atrás

O relatório anual do Google afirma que o Gemini realiza detecção em milissegundos, bloqueando 99% dos anúncios de golpes

O artigo discute como o Google, por meio de seu sistema de inteligência artificial generativa Gemini, fortalece a segurança de anúncios, e o relatório mostra que a velocidade com que ele intercepta anúncios em violação foi reduzida para milissegundos, com taxa de interceptação de 99%. No ano passado, o Google removeu 8,3 bilhões de anúncios e suspendeu 24,9 milhões de contas, indicando que a quantidade de anúncios fraudulentos aumentou significativamente. Especialistas apontam que se trata de um confronto entre inteligência artificial e inteligência artificial, e que, no futuro, ainda será necessário enfrentar os desafios das condutas legais e ilegais trazidas pela IA.

ChainNewsAbmedia13h atrás

Cofundador da Ethereum Lubin: a IA será um ponto de virada crítico para o cripto, mas o monopólio de gigantes de tecnologia traz risco sistêmico

O cofundador da Ethereum, Joseph Lubin, destacou o potencial transformador da IA para o setor de criptomoedas, ao mesmo tempo em que alertou sobre os riscos de centralização entre gigantes da tecnologia. Ele prevê transações autônomas impulsionadas por IA na blockchain e destaca a convergência entre as finanças tradicionais e a DeFi.

GateNews15h atrás

Elon Musk Defende Cheques de “Renda Universal Alta” como Solução Definitiva para o Desemprego na IA

Elon Musk defende uma Renda Universal de Alta Renda para combater o desemprego causado pela IA, vislumbrando um futuro com muitos bens e inflação zero. Em contraste, especialistas como Sam Altman levantam preocupações sobre perda de empregos e propõem medidas de proteção para os trabalhadores.

Coinpedia15h atrás
Comentário
0/400
Sem comentários