OpenAI发布GDPval基准测试:GPT-5模型在多个行业逼近人类专家水平

【币界】OpenAI 推出了 GDPval,这是一项新的基准测试,旨在衡量 AI 与人类专业人员在九大关键行业 44 个职业中的表现。测试显示,GPT-5-high 的得分与专家相当或超过专家的概率为 40.6%,而某公司的 AI 模型得分为 49%——尽管 OpenAI 将该模型的高分归功于其图形处理能力。OpenAI 首席经济学家承认 AI 存在当前的局限性,但指出这些结果表明 AI 具有处理日常任务的潜力,使专业人员能够专注于更高价值的工作。相比 15 个月前 GPT-4o 的得分(13.7%),这一基准测试取得了进步。

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
天台预订师vip
· 16小时前
没学历没工作快被ai替代啦
回复0
盲盒恐惧症vip
· 09-26 21:41
这数据水分这么大的吗
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)