OpenAI a publié le test de benchmark GDPval : le modèle GPT-5 atteint le niveau d'experts humains dans plusieurs secteurs.

2025-09-25 16:40:21

【jeton界】OpenAI a lancé GDPval, un nouveau Benchmark conçu pour mesurer la performance de l'IA par rapport aux professionnels humains dans neuf secteurs clés et 44 métiers. Les tests montrent que la probabilité que le score de GPT-5-high soit comparable ou supérieur à celui des experts est de 40,6 %, tandis qu'un modèle d'IA d'une certaine entreprise a obtenu un score de 49 % - bien qu'OpenAI attribue ce score élevé aux capacités de traitement graphique du modèle. Le chef économiste d'OpenAI reconnaît les limites actuelles de l'IA, mais souligne que ces résultats montrent que l'IA a le potentiel de gérer des tâches quotidiennes, permettant aux professionnels de se concentrer sur des travaux de plus grande valeur. Comparé au score de GPT-4o d'il y a 15 mois (13,7 %), ce Benchmark représente un progrès.

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

9 J'aime

Récompense
9
6
Reposter
Partager

Commentaire

0/400

RooftopReserver

· Il y a 20h

Pas de diplôme, pas de travail, je suis bientôt remplacé par l'IA.

Voir l'originalRépondre0

LootboxPhobia

· 09-26 21:41

Ces données sont-elles si biaisées ?

Voir l'originalRépondre0

Sujets populairesAfficher plus
#Joingrowthpointsdrawtowiniphone17
41.6K Popularité
#Hasthemarketdipped?
89.7K Popularité
#Fedofficialsspeakup
2.8K Popularité
#ShowMyAlphaPoints
163K Popularité
#Pcedataincoming
242 Popularité

Épingler