2025-12-05 12:32:29

Grok 剛剛在 LMArena 的 Text Arena 排行榜上稱王。數據如何？在 Thinking 模式下，Elo 分高達 1483——比最近的非 xAI 競爭對手高出 31 分。更厲害的是：即使未啟用 reasoning 模式，Elo 也有 1465，穩居第二。這比多數對手全力運作時還要快。是效能差距正在擴大，還是暫時性激增？無論如何，這個基準成績都說明了一切。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

15人點讚了這條動態

留言

0/400

gas_fee_therapy

· 15小時前

grok又開始吹了，1483elo？等等再看看，這數字能維持多久...

查看原文回復0

ZKSherlock

· 15小時前

其實……這類基準測試總是忽略了為了達到那些數字所產生的運算開銷。31分不是沒意義，但實際的推理成本是多少？沒有人討論這部分，笑死。

查看原文回復0

经典割韭机

· 15小時前

1483分直接壓制全場，這就是xAI要的效果吧

查看原文回復0