2025-12-05 12:32:29

GrokがLMArenaのText Arenaリーダーボードで王座を獲得しました。数字はというと、Thinkingモードで驚異の1483 Eloを記録し、最も近いxAI以外の競合との差は31ポイントです。さらに注目すべきは、Reasoningモードを有効にしていなくても1465 Eloで2位にランクインしている点です。これは、多くの競合が全機能を駆使しても達成できないほどの高速な実行です。パフォーマンスの差が広がっているのか、それとも一時的な急上昇なのか。いずれにせよ、このベンチマークがその実力を物語っています。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

15 いいね

0/400

gas_fee_therapy

· 10時間前

grokまた自慢し始めたね、1483elo？ちょっと待って様子を見てみよう、この数字がどれくらい維持できるか...

原文表示返信0

ZKSherlock

· 10時間前

実際のところ…こういったベンチマークは、その数値を達成するためにどれだけの計算オーバーヘッドがかかっているかをいつもごまかしてるよね。31ポイントって確かに悪くないけど、実際の推論コストはどうなの？その部分について誰も話さないんだよな、笑

原文表示返信0

ClassicDumpster

· 10時間前

1483ポイントで全体を圧倒、これがxAIの求めている効果でしょう。

原文表示返信0