OpenAI a publié le test de benchmark GDPval : le modèle GPT-5 atteint le niveau d'experts humains dans plusieurs secteurs.

【jeton界】OpenAI a lancé GDPval, un nouveau Benchmark conçu pour mesurer la performance de l'IA par rapport aux professionnels humains dans neuf secteurs clés et 44 métiers. Les tests montrent que la probabilité que le score de GPT-5-high soit comparable ou supérieur à celui des experts est de 40,6 %, tandis qu'un modèle d'IA d'une certaine entreprise a obtenu un score de 49 % - bien qu'OpenAI attribue ce score élevé aux capacités de traitement graphique du modèle. Le chef économiste d'OpenAI reconnaît les limites actuelles de l'IA, mais souligne que ces résultats montrent que l'IA a le potentiel de gérer des tâches quotidiennes, permettant aux professionnels de se concentrer sur des travaux de plus grande valeur. Comparé au score de GPT-4o d'il y a 15 mois (13,7 %), ce Benchmark représente un progrès.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
RooftopReservervip
· Il y a 20h
Pas de diplôme, pas de travail, je suis bientôt remplacé par l'IA.
Voir l'originalRépondre0
LootboxPhobiavip
· 09-26 21:41
Ces données sont-elles si biaisées ?
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)