Pesan Berita Gate, 24 April — Cambricon mengumumkan hari ini bahwa mereka telah menyelesaikan adaptasi Day 0 dari DeepSeek-V4, model bahasa besar terbaru dari DeepSeek, menggunakan ekosistem perangkat lunak NeuWare milik mereka sendiri dan framework vLLM. Kode adaptasinya juga telah dibuka-sumber secara bersamaan, menandai yang kedua berturut-turut saat Cambricon menghadirkan dukungan chip native pada hari peluncuran model baru DeepSeek.
Untuk mengoptimalkan arsitektur baru DeepSeek-V4, Cambricon memanfaatkan pustaka operator Torch-MLU-Ops berperforma tinggi untuk akselerasi khusus pada modul seperti Compressor dan mHC. Perusahaan ini juga menggunakan bahasa pemrograman BangC untuk mengembangkan kernel yang sangat dioptimalkan untuk operator penting seperti Attention jarang/terkompresi dan GroupGemm, dengan sepenuhnya memanfaatkan kemampuan dasar perangkat keras. Upaya ko-optimasi perangkat lunak-perangkat keras sebelumnya antara kedua perusahaan telah mencapai tingkat utilisasi komputasi terdepan di industri.
DeepSeek-V4, yang diluncurkan hari ini dan bersifat open-source, hadir dengan jendela konteks diperpanjang satu juta token, kemampuan Agent yang kuat, dan performa inferensi yang sangat baik. Cambricon menyatakan bahwa DeepSeek-V4 yang berjalan secara native di chip Cambricon merupakan tonggak penting bagi industri AI Tiongkok.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Meta Platforms Rencana Pengurangan Tenaga Kerja 10% pada 20 Mei, Berdampak pada Kira-kira 8.000 Posisi
Berita Gerbang, 24 April — Meta Platforms berencana mengurangi jumlah karyawannya sekitar 10%, memengaruhi kira-kira 8.000 posisi, pada 20 Mei. PHK tersebut dimaksudkan untuk meningkatkan efisiensi operasional sekaligus meningkatkan investasi dalam kecerdasan buatan.
Restrukturisasi yang direncanakan mencerminkan
GateNews40menit yang lalu
Pemerintahan Trump mengumumkan rencana penindakan terhadap pemurnian AI, menuduh perusahaan Tiongkok melakukan pencurian sistematis kemampuan model
Kantor Kebijakan Teknologi Gedung Putih (OSTP), Asisten Presiden Michael J. Kratsios, pada 23 April mengeluarkan pernyataan resmi yang menyatakan bahwa pemerintahan Trump memiliki informasi, yang menunjukkan bahwa entitas asing (terutama yang berbasis di Tiongkok) secara sengaja menargetkan perusahaan-perusahaan besar kecerdasan buatan (AI) Amerika melalui serangkaian ekstraksi kemampuan model AI AS secara sistematis, menggunakan “puluhan ribu akun agen” dan sistem teknologi jailbreak, serta sekaligus mengumumkan empat langkah respons.
MarketWhisper1jam yang lalu
DeepSeek meluncurkan V4 versi pratinjau sumber terbuka, penilaian teknis 3206 melampaui GPT-5.4
DeepSeek pada 24 April secara resmi meluncurkan rangkaian pratinjau V4, dengan lisensi MIT, dan merilis kode sumber secara terbuka. Bobot model telah disinkronkan dan tersedia di Hugging Face serta ModelScope. Berdasarkan laporan teknis DeepSeek V4, V4-Pro-Max (mode kekuatan penalaran tertinggi) memperoleh 3206 poin pada benchmark Codeforces, melampaui GPT-5.4.
MarketWhisper1jam yang lalu
Tencent merilis Hy3 versi pratinjau sumber terbuka, tolok ukur pengujian kode meningkat 40% dibanding pendahulunya
Tencent pada 23 April secara resmi membuka sumber model bahasa besar Hy3 versi pratinjau di platform GitHub, Hugging Face, dan ModelScope, serta turut menyediakan layanan API berbayar melalui Tencent Cloud. Menurut laporan Decrypt pada 24 April, Hy3 versi pratinjau memulai pelatihan pada akhir Januari, dan hingga tanggal rilis kurang dari tiga bulan.
MarketWhisper1jam yang lalu
Investasi Portofolio FTX Senilai 158 Triliun Won Jika Tidak Bangkrut
FTX, bursa perdagangan mata uang kripto terpusat yang mengajukan perlindungan kebangkrutan Chapter 11 pada November 2022 karena kekurangan likuiditas dan penarikan modal, akan memiliki investasi senilai sekitar 158,796 triliun won jika tidak runtuh, menurut analisis yang dikutip oleh Park
CryptoFrontier1jam yang lalu
Xiaomi Mengungkap Detail Pelatihan MiMo-V2-Pro: Parameter Model 1T, Ribuan GPU Diterjunkan
Pesan Gate News, 24 April — Pemimpin tim model bahasa besar Xiaomi, Luo Fuli, mengungkapkan dalam wawancara mendalam bahwa model MiMo-V2-Pro memiliki total 1 triliun parameter dan memerlukan ribuan GPU untuk pelatihan. Ia mencatat bahwa skala 1T mewakili ambang batas minimum untuk mencapai kinerja yang mendekati tingkat Claude Opus 4.6 dan mendapatkan tiket masuk yang kompetitif untuk fase berikutnya dari agen AI.
GateNews1jam yang lalu