Grok только что занял первое место в рейтинге Text Arena на LMArena. Цифры? Ошеломляющие 1483 Elo в режиме Thinking — отрыв в 31 очко от ближайшего конкурента не из xAI. И вот что интересно: даже без включенного режима reasoning он занимает 2-е место с 1465 Elo. Это более быстрая работа, чем у большинства соперников с полным набором возможностей. Разрыв в производительности увеличивается или это временный всплеск? В любом случае, результаты говорят сами за себя.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
15 Лайков
Награда
15
3
Репост
Поделиться
комментарий
0/400
gas_fee_therapy
· 4ч назад
grok опять начал хвастаться, 1483 elo? Подожду, посмотрю, сколько продержится эта цифра...
Посмотреть ОригиналОтветить0
ZKSherlock
· 4ч назад
На самом деле... в таких бенчмарках всегда замалчивают вычислительные издержки, которые требуются для достижения этих результатов. 31 балл — это, конечно, неплохо, но какова реальная стоимость инференса? Об этом никто не говорит, лол.
Посмотреть ОригиналОтветить0
ClassicDumpster
· 4ч назад
1483 очка полностью доминируют на площадке, именно такого эффекта, наверное, и добивается xAI.
Grok только что занял первое место в рейтинге Text Arena на LMArena. Цифры? Ошеломляющие 1483 Elo в режиме Thinking — отрыв в 31 очко от ближайшего конкурента не из xAI. И вот что интересно: даже без включенного режима reasoning он занимает 2-е место с 1465 Elo. Это более быстрая работа, чем у большинства соперников с полным набором возможностей. Разрыв в производительности увеличивается или это временный всплеск? В любом случае, результаты говорят сами за себя.