Grok vient de s’emparer de la première place du classement Text Arena de LMArena. Les chiffres ? Un impressionnant 1483 Elo en mode Thinking—soit 31 points d’avance sur le meilleur concurrent non-xAI. Et ce n’est pas tout : même sans le mode reasoning activé, il décroche la 2e place avec 1465 Elo. C’est une exécution plus rapide que ce que la plupart des rivaux obtiennent avec tous leurs atouts déployés. Écart de performance durable ou pic temporaire ? Quoi qu’il en soit, la référence est parlante.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
15 J'aime
Récompense
15
3
Reposter
Partager
Commentaire
0/400
gas_fee_therapy
· Il y a 4h
Grok recommence à se vanter, 1483 elo ? Attendons de voir combien de temps ce chiffre va tenir...
Voir l'originalRépondre0
ZKSherlock
· Il y a 4h
En fait... les benchmarks comme ceux-ci passent toujours sous silence la surcharge de calcul nécessaire pour atteindre ces chiffres. 31 points, ce n'est pas rien, mais quel est le vrai coût d'inférence ? Personne n'en parle, lol.
Voir l'originalRépondre0
ClassicDumpster
· Il y a 4h
1483 points pour dominer directement la scène, c'est sûrement l'effet recherché par xAI.
Grok vient de s’emparer de la première place du classement Text Arena de LMArena. Les chiffres ? Un impressionnant 1483 Elo en mode Thinking—soit 31 points d’avance sur le meilleur concurrent non-xAI. Et ce n’est pas tout : même sans le mode reasoning activé, il décroche la 2e place avec 1465 Elo. C’est une exécution plus rapide que ce que la plupart des rivaux obtiennent avec tous leurs atouts déployés. Écart de performance durable ou pic temporaire ? Quoi qu’il en soit, la référence est parlante.