GrokがLMArenaのText Arenaリーダーボードで王座を獲得しました。数字はというと、Thinkingモードで驚異の1483 Eloを記録し、最も近いxAI以外の競合との差は31ポイントです。さらに注目すべきは、Reasoningモードを有効にしていなくても1465 Eloで2位にランクインしている点です。これは、多くの競合が全機能を駆使しても達成できないほどの高速な実行です。パフォーマンスの差が広がっているのか、それとも一時的な急上昇なのか。いずれにせよ、このベンチマークがその実力を物語っています。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 3
  • リポスト
  • 共有
コメント
0/400
gas_fee_therapyvip
· 10時間前
grokまた自慢し始めたね、1483elo?ちょっと待って様子を見てみよう、この数字がどれくらい維持できるか...
原文表示返信0
ZKSherlockvip
· 10時間前
実際のところ…こういったベンチマークは、その数値を達成するためにどれだけの計算オーバーヘッドがかかっているかをいつもごまかしてるよね。31ポイントって確かに悪くないけど、実際の推論コストはどうなの?その部分について誰も話さないんだよな、笑
原文表示返信0
ClassicDumpstervip
· 10時間前
1483ポイントで全体を圧倒、これがxAIの求めている効果でしょう。
原文表示返信0
  • 人気の Gate Funもっと見る
  • 時価総額:$3.51K保有者数:2
    0.09%
  • 時価総額:$3.47K保有者数:1
    0.00%
  • 時価総額:$3.52K保有者数:2
    0.00%
  • 時価総額:$3.51K保有者数:1
    0.00%
  • 時価総額:$3.54K保有者数:1
    0.00%
  • ピン