OpenAI发布GDPval基准测试：GPT-5模型在多个行业逼近人类专家水平

2025-09-25 16:40:21

【币界】OpenAI 推出了 GDPval，这是一项新的基准测试，旨在衡量 AI 与人类专业人员在九大关键行业 44 个职业中的表现。测试显示，GPT-5-high 的得分与专家相当或超过专家的概率为 40.6%，而某公司的 AI 模型得分为 49%——尽管 OpenAI 将该模型的高分归功于其图形处理能力。OpenAI 首席经济学家承认 AI 存在当前的局限性，但指出这些结果表明 AI 具有处理日常任务的潜力，使专业人员能够专注于更高价值的工作。相比 15 个月前 GPT-4o 的得分（13.7%），这一基准测试取得了进步。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

9人点赞了这条动态

赞赏
9
6
转发
分享

0/400

天台预订师

· 16小时前

没学历没工作快被ai替代啦

盲盒恐惧症

· 09-26 21:41

这数据水分这么大的吗

热门话题查看更多
#成长值抽奖赢iPhone17和周边
3.5万热度
#GateLayer正式上线
472.2万热度
#BTC走势分析
13.1万热度
#今日你看涨还是看跌？
7.8万热度
#晒出我的Alpha积分
16.5万热度