Grok vừa giành ngôi vương trên bảng xếp hạng Text Arena của LMArena. Con số? Một mức Elo 1483 ấn tượng ở chế độ Thinking—bỏ xa đối thủ không phải xAI gần nhất tới 31 điểm. Đặc biệt hơn: ngay cả khi chưa kích hoạt chế độ reasoning, Grok vẫn giữ vị trí #2 với Elo 1465. Đó là tốc độ xử lý vượt trội so với hầu hết các đối thủ dù họ sử dụng toàn bộ "vũ khí". Khoảng cách hiệu năng đang ngày càng rộng ra hay chỉ là sự bứt phá tạm thời? Dù thế nào đi nữa, kết quả này đã nói lên tất cả.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
15 thích
Phần thưởng
15
3
Đăng lại
Retweed
Bình luận
0/400
gas_fee_therapy
· 4giờ trước
grok lại bắt đầu khoe khoang rồi, 1483 elo? Đợi xem đã, con số này duy trì được bao lâu...
Xem bản gốcTrả lời0
ZKSherlock
· 4giờ trước
thực ra... các bài benchmark như thế này luôn bỏ qua chi phí tính toán mà họ phải chạy để đạt được những con số đó. 31 điểm không phải là ít nhưng mà, chi phí suy luận thực tế là bao nhiêu? không ai nói về phần đó cả lol
Xem bản gốcTrả lời0
ClassicDumpster
· 4giờ trước
1483 điểm trực tiếp áp đảo toàn sân, đây chính là hiệu quả mà xAI muốn phải không?
Grok vừa giành ngôi vương trên bảng xếp hạng Text Arena của LMArena. Con số? Một mức Elo 1483 ấn tượng ở chế độ Thinking—bỏ xa đối thủ không phải xAI gần nhất tới 31 điểm. Đặc biệt hơn: ngay cả khi chưa kích hoạt chế độ reasoning, Grok vẫn giữ vị trí #2 với Elo 1465. Đó là tốc độ xử lý vượt trội so với hầu hết các đối thủ dù họ sử dụng toàn bộ "vũ khí". Khoảng cách hiệu năng đang ngày càng rộng ra hay chỉ là sự bứt phá tạm thời? Dù thế nào đi nữa, kết quả này đã nói lên tất cả.