2025-12-05 12:32:29

Grok刚刚在LMArena的Text Arena排行榜上称王。数据如何？在思考模式下，它的Elo分高达1483——与最近的非xAI竞争对手拉开了31分的差距。更厉害的是：即使没有启用推理模式，它也以1465 Elo排名第二。这一分数的执行速度，比大多数对手全力以赴时还要快。是性能差距正在扩大，还是只是暂时的高峰？无论如何，基准测试已经说明了一切。

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

16人点赞了这条动态

0/400

ExpectationFarmer

· 4小时前

卧槽grok这波直接起飞了，1483的elo真不是盖的...不过这玩意儿是不是又得靠thinking mode才能吊打别人啊

gas_fee_therapy

· 12-05 13:02

grok又开始吹了，1483elo？等等再看看，这数字能维持多久...

ZKSherlock

· 12-05 12:58

其实……像这样的基准测试总是忽略了为达到这些数字所付出的计算开销。31分确实不算少，但是，实际的推理成本是多少呢？没有人讨论这部分，哈哈。

查看原文回复0

经典割韭机

· 12-05 12:53

1483分直接压制全场，这就是xAI要的效果吧