O laboratório chinês de IA DeepSeek está em conversas para levantar sua primeira rodada de investimentos em uma avaliação reportada de US$ 45 bilhões, segundo a TechCrunch. A avaliação representa um aumento significativo em relação a uma avaliação estimada de US$ 20 bilhões apenas algumas semanas antes, após a atenção ter sido atraída pelos modelos de IA da empresa por seus custos de treinamento mais baixos. O fundador Liang Wenfeng controla quase 90% da empresa.
A DeepSeek decidiu buscar financiamento depois que concorrentes tentaram recrutar pesquisadores oferecendo ações da empresa como incentivo. O China Integrated Circuit Industry Investment Fund pode liderar a rodada, enquanto Tencent e Alibaba também estão, segundo relatos, em conversas para participar.
O modelo V4 da DeepSeek é reportado como apresentando desempenho equivalente ao de modelos de ponta da OpenAI e da Anthropic em testes de benchmark, de acordo com a empresa. A vantagem competitiva se estende à precificação: o V4-Pro custa US$ 1,74 por 1 milhão de tokens de entrada, enquanto o V4-Flash custa aproximadamente US$ 0,14 por 1 milhão de tokens de entrada — significativamente abaixo do preço de modelos equivalentes dos EUA.
A estrutura de custos mais baixa decorre da arquitetura da DeepSeek otimizada para computação, incluindo um design de mixture-of-experts (MoE) que ativa apenas parte do modelo para cada tarefa, reduzindo as necessidades de computação durante a inferência. Segundo a DeepSeek, o V4-Pro usa 27% do poder de computação e 10% da memória exigidos pelo V3.2.
A rodada de financiamento da DeepSeek acontece enquanto a China busca construir uma infraestrutura de IA mais autossuficiente em resposta aos controles de exportação dos EUA sobre chips avançados. O V4 é o primeiro modelo da DeepSeek ajustado para chips chineses como a série Ascend, da Huawei, embora o relatório técnico da empresa indique que chips chineses fazem a inferência enquanto o treinamento ainda pode depender principalmente do hardware da Nvidia.
A DeepSeek também lança modelos com pesos abertos — parâmetros treinados que outros podem usar, fazer fine-tuning e implantar — ampliando o desenvolvimento de IA além da dominância dos EUA. Essa estratégia enfatiza eficiência algorítmica em vez de acesso exclusivo ao hardware mais avançado dos EUA, embora o avanço da IA da China ainda dependa parcialmente do hardware da Nvidia.
Related News
Apple eleva P&D ao maior nível em 30 anos com impulso de investimentos em IA
CITIC: Computação de IA impulsiona reestruturação do setor elétrico dos EUA, mercado de autoabastecimento se abre
Ações da Hut 8 Disparam 30% com contrato de locação de data center de IA no valor de US$ 9,8 bilhões
A IA impulsiona a demanda por semicondutores; Samsung dispara 12% e valor de mercado ultrapassa US$ 1 trilhão
A Anthropic compromete $200B com a Google Cloud ao longo de cinco anos