OpenAIがGDPvalベンチマークテストを発表：GPT-5モデルが複数の業界で人間の専門家レベルに迫る

2025-09-25 16:40:21

【通貨界】OpenAIはGDPvalを発表しました。これはAIと人間の専門家が9つの主要な業界の44の職業でのパフォーマンスを測定するための新しいベンチマークテストです。テストの結果、GPT-5-highのスコアが専門家と同等または超える確率は40.6%であり、ある企業のAIモデルのスコアは49%でした——ただしOpenAIはそのモデルの高スコアをそのグラフィック処理能力に起因するとしています。OpenAIの首席経済学者は、AIには現在の限界があることを認めていますが、これらの結果はAIが日常的なタスクを処理する潜在能力を持っていることを示しており、専門家がより高い価値のある仕事に集中できるようにすると指摘しています。15ヶ月前のGPT-4oのスコア（13.7%）と比較して、このベンチマークテストは進展を遂げました。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

8 いいね