Grok vient de s’emparer de la première place du classement Text Arena de LMArena. Les chiffres ? Un impressionnant 1483 Elo en mode Thinking—soit 31 points d’avance sur le meilleur concurrent non-xAI. Et ce n’est pas tout : même sans le mode reasoning activé, il décroche la 2e place avec 1465 Elo. C’est une exécution plus rapide que ce que la plupart des rivaux obtiennent avec tous leurs atouts déployés. Écart de performance durable ou pic temporaire ? Quoi qu’il en soit, la référence est parlante.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Reposter
  • Partager
Commentaire
0/400
gas_fee_therapyvip
· Il y a 4h
Grok recommence à se vanter, 1483 elo ? Attendons de voir combien de temps ce chiffre va tenir...
Voir l'originalRépondre0
ZKSherlockvip
· Il y a 4h
En fait... les benchmarks comme ceux-ci passent toujours sous silence la surcharge de calcul nécessaire pour atteindre ces chiffres. 31 points, ce n'est pas rien, mais quel est le vrai coût d'inférence ? Personne n'en parle, lol.
Voir l'originalRépondre0
ClassicDumpstervip
· Il y a 4h
1483 points pour dominer directement la scène, c'est sûrement l'effet recherché par xAI.
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)