Grok刚刚在LMArena的Text Arena排行榜上称王。数据如何?在思考模式下,它的Elo分高达1483——与最近的非xAI竞争对手拉开了31分的差距。更厉害的是:即使没有启用推理模式,它也以1465 Elo排名第二。这一分数的执行速度,比大多数对手全力以赴时还要快。是性能差距正在扩大,还是只是暂时的高峰?无论如何,基准测试已经说明了一切。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 4
  • 转发
  • 分享
评论
0/400
ExpectationFarmervip
· 4小时前
卧槽grok这波直接起飞了,1483的elo真不是盖的...不过这玩意儿是不是又得靠thinking mode才能吊打别人啊
回复0
gas_fee_therapyvip
· 12-05 13:02
grok又开始吹了,1483elo?等等再看看,这数字能维持多久...
回复0
ZKSherlockvip
· 12-05 12:58
其实……像这样的基准测试总是忽略了为达到这些数字所付出的计算开销。31分确实不算少,但是,实际的推理成本是多少呢?没有人讨论这部分,哈哈。
查看原文回复0
经典割韭机vip
· 12-05 12:53
1483分直接压制全场,这就是xAI要的效果吧
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)