OpenAI發布GDPval基準測試:GPT-5模型在多個行業逼近人類專家水平

【幣界】OpenAI 推出了 GDPval,這是一項新的基準測試,旨在衡量 AI 與人類專業人員在九大關鍵行業 44 個職業中的表現。測試顯示,GPT-5-high 的得分與專家相當或超過專家的概率爲 40.6%,而某公司的 AI 模型得分爲 49%——盡管 OpenAI 將該模型的高分歸功於其圖形處理能力。OpenAI 首席經濟學家承認 AI 存在當前的局限性,但指出這些結果表明 AI 具有處理日常任務的潛力,使專業人員能夠專注於更高價值的工作。相比 15 個月前 GPT-4o 的得分(13.7%),這一基準測試取得了進步。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
天台预订师vip
· 09-27 13:40
沒學歷沒工作快被ai替代啦
查看原文回復0
盲盒恐惧症vip
· 09-26 21:41
這數據水分這麼大的嗎
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)