Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3

Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya “mencengangkan: biasa saja dan rawan kesalahan” dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.

Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.

Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin “secara sengaja melemahkan bagian ini.”

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Cohere Mengakuisisi Perusahaan AI Jerman Aleph Alpha, Mengamankan $600M Investasi untuk Ekspansi Eropa

Berita Gate, 24 April — Perusahaan AI Kanada Cohere mengumumkan rencana untuk mengakuisisi perusahaan AI Jerman Aleph Alpha guna memperkuat kehadirannya di Eropa. Schwarz Group, pendukung Aleph Alpha, berencana untuk menginvestasikan $600 juta dalam putaran pendanaan Seri E Cohere. Putaran pendanaan diperkirakan akan ditutup pada 202

GateNews1menit yang lalu

Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show

Gate News message, April 24 — Chinese automakers showcased advanced in-car AI systems at the Beijing Auto Show on April 24, as the country accelerates its AI Plus strategy and seeks greater independence from foreign semiconductors. Xpeng demonstrated voice-controlled parking that allows drivers to

GateNews41menit yang lalu

Mantan Insinyur Seed ByteDance: Iterasi AI ByteDance Butuh Enam Bulan vs Tiga Bulan Google

Pesan Berita Gate, 24 April — Zhang Chi, mantan insinyur di tim Seed ByteDance dan kini asisten profesor di Universitas Peking, mengungkapkan dalam podcast "Into Asia" bahwa ByteDance membutuhkan sekitar enam bulan untuk menyelesaikan satu siklus penuh pelatihan pra-pelatihan model bahasa besar (pretraining

GateNews57menit yang lalu

Naver Meluncurkan Beta AI Tab saat Google Gemini Masuk Pasar Pencarian Korea Selatan

Pesan Berita Gate, 24 April — Naver mengumumkan dimulainya beta tertutup untuk AI Tab, fitur pencarian percakapan barunya, setelah peluncuran Gemini oleh Google di Chrome di Korea Selatan. AI Tab akan muncul berdampingan dengan tab pencarian Naver yang sudah ada, memberi pengguna ruang khusus untuk pertanyaan percakapan

GateNews1jam yang lalu

Perekrutan Kejuruan AI di India Melonjak 59,5%, Meluas di Luar Pusat Teknologi

Laporan Pasar Tenaga Kerja AI LinkedIn 2026, yang dirilis pada 24 April, menemukan bahwa perekrutan untuk insinyur AI di India naik 59,5% dari tahun ke tahun, menandai laju tercepat di antara pasar-pasar yang diteliti oleh platform tersebut. Pertumbuhan ini didorong oleh permintaan yang menyebar melampaui pusat teknologi yang sudah mapan. Kota-kota termasuk

CryptoFrontier2jam yang lalu

Commonwealth Bank Memotong 120 Pekerjaan di Tengah Perluasan AI

Bank Persemakmuran Australia mengumumkan bahwa pihaknya akan memangkas sekitar 120 pekerjaan karena bank terbesar di negara itu meninjau peran-peran dan memperluas penggunaan kecerdasan buatan, menurut Bloomberg. Pemangkasan tersebut mencakup 43 peran di Bankwest di Australia Barat, dengan enam posisi terdampak oleh otomatisasi. Ini a

CryptoFrontier2jam yang lalu
Komentar
0/400
Tidak ada komentar