Phòng thí nghiệm AI Trung Quốc DeepSeek đang đàm phán để huy động vòng tài trợ đầu tiên với định giá được cho là 45 tỷ USD, theo TechCrunch. Mức định giá này đánh dấu mức tăng đáng kể so với định giá ước tính 20 tỷ USD chỉ vài tuần trước đó, sau khi sự chú ý được thu hút bởi các mô hình AI của công ty nhờ chi phí huấn luyện thấp hơn. Người sáng lập Liang Wenfeng hiện kiểm soát gần 90% công ty.
DeepSeek quyết định tìm kiếm vốn sau khi các đối thủ cố gắng chiêu mộ các nhà nghiên cứu bằng cách đưa cổ phần công ty làm động lực. Quỹ China Integrated Circuit Industry Investment Fund có thể dẫn dắt vòng tài trợ, trong khi Tencent và Alibaba cũng được cho là đang trong các cuộc đàm phán để tham gia.
Theo công ty, mô hình V4 của DeepSeek được cho là có hiệu suất tương đương các mô hình hàng đầu từ OpenAI và Anthropic trong các bài kiểm tra benchmark. Lợi thế cạnh tranh còn nằm ở giá: V4-Pro có giá 1,74 USD cho mỗi 1 triệu token đầu vào, trong khi V4-Flash có giá xấp xỉ 0,14 USD cho mỗi 1 triệu token đầu vào—thấp hơn đáng kể so với mức giá của các mô hình tương đương từ Mỹ.
Cơ cấu chi phí thấp hơn xuất phát từ kiến trúc tối ưu tính toán của DeepSeek, bao gồm thiết kế mixture-of-experts (MoE) chỉ kích hoạt một phần mô hình cho từng tác vụ, qua đó giảm nhu cầu tính toán trong giai đoạn suy luận. Theo DeepSeek, V4-Pro sử dụng 27% công suất tính toán và 10% bộ nhớ cần thiết so với V3.2.
Vòng tài trợ của DeepSeek diễn ra trong bối cảnh Trung Quốc tìm cách xây dựng hạ tầng AI tự chủ hơn để đáp ứng các biện pháp kiểm soát xuất khẩu chip tiên tiến của Mỹ. V4 là mô hình đầu tiên của DeepSeek được tinh chỉnh cho các chip Trung Quốc như dòng Ascend của Huawei, dù báo cáo kỹ thuật của công ty cho thấy chip Trung Quốc xử lý suy luận, còn việc huấn luyện có thể vẫn phụ thuộc chủ yếu vào phần cứng Nvidia.
DeepSeek cũng phát hành các mô hình open-weight—các tham số đã được huấn luyện mà bên khác có thể dùng, tinh chỉnh và triển khai—mở rộng phát triển AI vượt ra ngoài sự thống trị của Mỹ. Chiến lược này nhấn mạnh hiệu quả thuật toán thay vì chỉ tập trung vào quyền truy cập độc quyền với phần cứng Mỹ tiên tiến nhất, dù các nỗ lực đẩy mạnh AI của Trung Quốc vẫn phụ thuộc một phần vào phần cứng Nvidia.
Related News
Apple nâng chi tiêu R&D lên mức cao nhất trong 30 năm nhờ đẩy mạnh đầu tư AI
CITIC: Điện toán AI thúc đẩy tái cấu trúc nguồn điện của Mỹ, thị trường tự cung ứng mở ra
Hut 8 tăng 30% cổ phiếu nhờ hợp đồng thuê trung tâm dữ liệu AI trị giá 9,8 tỷ USD
AI thúc đẩy nhu cầu chất bán dẫn, Samsung tăng mạnh 12%, vốn hóa vượt 1 nghìn tỷ USD
Anthropic cam kết $200B với Google Cloud trong hơn 5 năm