Grok щойно очолив таблицю лідерів Text Arena на LMArena. Цифри вражають: 1483 Elo в режимі Thinking — з відривом у 31 бал від найближчого конкурента не від xAI. І це ще не все: навіть без активованого режиму reasoning він посідає друге місце з 1465 Elo. Це швидше, ніж більшість суперників можуть досягти, використовуючи весь свій арсенал. Розрив у продуктивності збільшується чи це тимчасовий сплеск? У будь-якому разі, результати говорять самі за себе.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
15 лайків
Нагородити
15
3
Репост
Поділіться
Прокоментувати
0/400
gas_fee_therapy
· 4год тому
grok знову почав вихвалятися, 1483 elo? Зачекаю, подивлюся ще, скільки цей показник протримається...
Переглянути оригіналвідповісти на0
ZKSherlock
· 4год тому
насправді... у таких бенчмарках завжди замовчують обчислювальні витрати, які потрібні для досягнення цих показників. 31 бал — це щось, але яка реальна вартість інференсу? про це ніхто не говорить, лол
Переглянути оригіналвідповісти на0
ClassicDumpster
· 4год тому
1483 балів повністю домінували на майданчику, саме такого ефекту й прагне xAI, чи не так?
Grok щойно очолив таблицю лідерів Text Arena на LMArena. Цифри вражають: 1483 Elo в режимі Thinking — з відривом у 31 бал від найближчого конкурента не від xAI. І це ще не все: навіть без активованого режиму reasoning він посідає друге місце з 1465 Elo. Це швидше, ніж більшість суперників можуть досягти, використовуючи весь свій арсенал. Розрив у продуктивності збільшується чи це тимчасовий сплеск? У будь-якому разі, результати говорять самі за себе.