أصدرت OpenAI اختبار المعيار GDPval: نموذج GPT-5 يقترب من مستوى الخبراء البشريين في عدة صناعات

【عملة】OpenAI أطلقت GDPval، وهو اختبار معياري جديد يهدف إلى قياس أداء الذكاء الاصطناعي مقابل المحترفين البشريين في تسعة صناعات رئيسية و44 مهنة. تظهر الاختبارات أن احتمالية أن تكون درجة GPT-5-high مماثلة أو تتجاوز درجة الخبراء هي 40.6%، بينما حصل نموذج الذكاء الاصطناعي لشركة معينة على 49% - رغم أن OpenAI تعزو الدرجة العالية لهذا النموذج إلى قدراته في معالجة الرسوميات. اعترف كبير الاقتصاديين في OpenAI بوجود قيود حالية على الذكاء الاصطناعي، لكنه أشار إلى أن هذه النتائج تدل على أن الذكاء الاصطناعي لديه القدرة على التعامل مع المهام اليومية، مما يمكّن المحترفين من التركيز على أعمال ذات قيمة أعلى. مقارنةً بدرجة GPT-4o قبل 15 شهرًا (13.7%)، حقق هذا الاختبار المعياري تقدمًا.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 6
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت