Grok baru saja merebut posisi puncak di papan peringkat Text Arena milik LMArena. Angkanya? Elo 1483 yang luar biasa di mode Thinking—meninggalkan selisih 31 poin dengan pesaing non-xAI terdekat. Yang menarik: bahkan tanpa mode reasoning diaktifkan, Grok tetap berada di posisi #2 dengan Elo 1465. Itu eksekusi yang lebih cepat dibandingkan apa yang bisa dicapai sebagian besar pesaing dengan seluruh arsenal mereka. Apakah selisih performa ini akan terus melebar atau hanya lonjakan sementara? Apa pun itu, tolak ukurnya sudah bicara banyak.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
17 Suka
Hadiah
17
4
Posting ulang
Bagikan
Komentar
0/400
ExpectationFarmer
· 12-06 09:20
Gila, Grok bener-bener langsung melejit nih, elo 1483 itu emang bukan main... Tapi apa alat ini harus pakai thinking mode lagi biar bisa ngalahin yang lain?
Lihat AsliBalas0
gas_fee_therapy
· 12-05 13:02
grok mulai pamer lagi, 1483 elo? Tunggu dulu, lihat saja nanti, angka ini bisa bertahan berapa lama...
Lihat AsliBalas0
ZKSherlock
· 12-05 12:58
sebenarnya... tolok ukur seperti ini selalu mengabaikan beban komputasi yang mereka jalankan untuk mencapai angka-angka tersebut. 31 poin memang lumayan, tapi berapa sih biaya inferensinya yang sebenarnya? nggak ada yang ngomongin bagian itu lol
Lihat AsliBalas0
ClassicDumpster
· 12-05 12:53
1483 poin langsung mendominasi seluruh arena, inilah efek yang diinginkan xAI, bukan?
Grok baru saja merebut posisi puncak di papan peringkat Text Arena milik LMArena. Angkanya? Elo 1483 yang luar biasa di mode Thinking—meninggalkan selisih 31 poin dengan pesaing non-xAI terdekat. Yang menarik: bahkan tanpa mode reasoning diaktifkan, Grok tetap berada di posisi #2 dengan Elo 1465. Itu eksekusi yang lebih cepat dibandingkan apa yang bisa dicapai sebagian besar pesaing dengan seluruh arsenal mereka. Apakah selisih performa ini akan terus melebar atau hanya lonjakan sementara? Apa pun itu, tolak ukurnya sudah bicara banyak.