OpenAI發布GDPval基準測試：GPT-5模型在多個行業逼近人類專家水平

2025-09-25 16:40:21

【幣界】OpenAI 推出了 GDPval，這是一項新的基準測試，旨在衡量 AI 與人類專業人員在九大關鍵行業 44 個職業中的表現。測試顯示，GPT-5-high 的得分與專家相當或超過專家的概率爲 40.6%，而某公司的 AI 模型得分爲 49%——盡管 OpenAI 將該模型的高分歸功於其圖形處理能力。OpenAI 首席經濟學家承認 AI 存在當前的局限性，但指出這些結果表明 AI 具有處理日常任務的潛力，使專業人員能夠專注於更高價值的工作。相比 15 個月前 GPT-4o 的得分（13.7%），這一基準測試取得了進步。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

10人點讚了這條動態