Grok 剛剛在 LMArena 的 Text Arena 排行榜上稱王。數據如何?在 Thinking 模式下,Elo 分高達 1483——比最近的非 xAI 競爭對手高出 31 分。更厲害的是:即使未啟用 reasoning 模式,Elo 也有 1465,穩居第二。這比多數對手全力運作時還要快。是效能差距正在擴大,還是暫時性激增?無論如何,這個基準成績都說明了一切。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 3
  • 轉發
  • 分享
留言
0/400
gas_fee_therapyvip
· 15小時前
grok又開始吹了,1483elo?等等再看看,這數字能維持多久...
查看原文回復0
ZKSherlockvip
· 15小時前
其實……這類基準測試總是忽略了為了達到那些數字所產生的運算開銷。31分不是沒意義,但實際的推理成本是多少?沒有人討論這部分,笑死。
查看原文回復0
经典割韭机vip
· 15小時前
1483分直接壓制全場,這就是xAI要的效果吧
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)