امسح ضوئيًا لتحميل تطبيق Gate
qrCode
خيارات تحميل إضافية
لا تذكرني بذلك مرة أخرى اليوم

حقق Kimi K2 Thinking أرقامًا قياسية جديدة في تقييمات الأداء الأساسية التي تقيم قدرات الاستنتاج، والبرمجة، والوكالة

بيانات جينشيو 8 نوفمبر، وفقًا لموقع ويب مونث الظلام، حقق Kimi K2 Thinking رقمًا قياسيًا جديدًا في تقييمات المعايير التي تقيم قدرات الاستنتاج، الترميز، والوكيل. حقق K2 Thinking معدل أداء قياسي (SOTA) بنسبة 44.9% في تقييم HLE، ووصل إلى 60.2% في اختبار BrowseComp، وحقق 71.3% في اختبار SWE-Bench Verified، مما يظهر قدرته القوية على التعميم كنموذج وكيل تفكير متقدم.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
مواضيع ذات صلة
#
ai
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخنعرض المزيد
  • القيمة السوقية:$4.14Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.21Kعدد الحائزين:2
    0.04%
  • القيمة السوقية:$4.16Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.16Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$4.15Kعدد الحائزين:1
    0.00%
  • تثبيت