Grok acaba de reclamar el trono en la clasificación de Text Arena de LMArena. ¿Los números? Un asombroso Elo de 1483 en modo Thinking, dejando una brecha de 31 puntos con respecto al competidor más cercano que no es de xAI. Y aquí viene lo mejor: incluso sin el modo de razonamiento activado, se sitúa en el puesto #2 con un Elo de 1465. Eso es una ejecución más rápida que la que la mayoría de sus rivales logra con todo su arsenal desplegado. ¿Brecha de rendimiento que se amplía o pico temporal? En cualquier caso, el benchmark lo dice todo.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
15 me gusta
Recompensa
15
3
Republicar
Compartir
Comentar
0/400
gas_fee_therapy
· hace4h
grok vuelve a presumir, ¿1483 elo? Espera un poco más, a ver cuánto dura ese número...
Ver originalesResponder0
ZKSherlock
· hace4h
En realidad... los benchmarks como estos siempre pasan por alto la sobrecarga computacional que requieren para alcanzar esos números. 31 puntos no está mal, pero, ¿cuál es el coste real de inferencia? Nadie habla de esa parte, jajaja.
Ver originalesResponder0
ClassicDumpster
· hace4h
1483 puntos dominando toda la partida, este debe ser el efecto que busca xAI, ¿no?
Grok acaba de reclamar el trono en la clasificación de Text Arena de LMArena. ¿Los números? Un asombroso Elo de 1483 en modo Thinking, dejando una brecha de 31 puntos con respecto al competidor más cercano que no es de xAI. Y aquí viene lo mejor: incluso sin el modo de razonamiento activado, se sitúa en el puesto #2 con un Elo de 1465. Eso es una ejecución más rápida que la que la mayoría de sus rivales logra con todo su arsenal desplegado. ¿Brecha de rendimiento que se amplía o pico temporal? En cualquier caso, el benchmark lo dice todo.