【通貨界】OpenAIはGDPvalを発表しました。これはAIと人間の専門家が9つの主要な業界の44の職業でのパフォーマンスを測定するための新しいベンチマークテストです。テストの結果、GPT-5-highのスコアが専門家と同等または超える確率は40.6%であり、ある企業のAIモデルのスコアは49%でした——ただしOpenAIはそのモデルの高スコアをそのグラフィック処理能力に起因するとしています。OpenAIの首席経済学者は、AIには現在の限界があることを認めていますが、これらの結果はAIが日常的なタスクを処理する潜在能力を持っていることを示しており、専門家がより高い価値のある仕事に集中できるようにすると指摘しています。15ヶ月前のGPT-4oのスコア(13.7%)と比較して、このベンチマークテストは進展を遂げました。
OpenAIがGDPvalベンチマークテストを発表:GPT-5モデルが複数の業界で人間の専門家レベルに迫る
【通貨界】OpenAIはGDPvalを発表しました。これはAIと人間の専門家が9つの主要な業界の44の職業でのパフォーマンスを測定するための新しいベンチマークテストです。テストの結果、GPT-5-highのスコアが専門家と同等または超える確率は40.6%であり、ある企業のAIモデルのスコアは49%でした——ただしOpenAIはそのモデルの高スコアをそのグラフィック処理能力に起因するとしています。OpenAIの首席経済学者は、AIには現在の限界があることを認めていますが、これらの結果はAIが日常的なタスクを処理する潜在能力を持っていることを示しており、専門家がより高い価値のある仕事に集中できるようにすると指摘しています。15ヶ月前のGPT-4oのスコア(13.7%)と比較して、このベンチマークテストは進展を遂げました。