OpenAIは2026年4月23日に、実世界のアプリケーションにおけるネイティブなコンピュータ利用能力を通じてユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を正式にリリースしました。OpenAIの発表によると、このモデルは汎用のネイティブ能力を備えており、デスクトップアプリケーションのナビゲート、ボタンのクリック、テキストの入力を可能にし、多段階のワークフローをこなせます。

GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせ、上級の専門的タスクに必要なソフトウェアツールを自律的にナビゲートします。このモデルの約110万トークンのコンテキストウィンドウにより、従来は手作業でチャンク化する必要があった大規模な金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って24,771のK-1税務フォーム(71,637ページ)をレビューし、前年度より2週間早くタスクを完了しました。

パフォーマンス指標

GPT-5.5は社内の投資銀行モデリング業務で88.5%、FinancialAgent v1.1ベンチマークで60%を達成し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を獲得しました。これは44の職業にまたがって、エージェントが特定の知識労働を生み出す能力をテストするものです。OSWorld-Verifiedでは、モデルの自律的な実コンピュータ操作を測定し、78.7%に到達しました。GPT-5.5はTau2-bench Telecomで98%を獲得しました。これは非常に難しいカスタマーサービスのワークフローをテストするものです。

Go-to-Marketチームの従業員は、毎週のビジネスレポートを自動化すれば、毎週の手作業が約5〜10時間節約できると確認しました。

コード生成とシステム最適化

OpenAIは、GPT-5.5が自社の提供（サービング）インフラストラクチャ用のコード作成を支援するために使われたと報告しています。このモデルは、生産トラフィックのパターンを分析してカスタムの負荷分散ヒューリスティックを書くことで、「システムレベルの最適化」を達成し、自身のトークン生成速度を20%向上させました。

開発者向けのテストで、モデルには「マークダウンエディタを再アーキテクチャしろ」と依頼され、最小限の人手による修正で、ほぼ完成した12-diffのスタックを返しました。OpenAIは、新しいモデルが従来より少ないターンで正しい回答に到達し、同じCodexのタスクではGPT-5.4と比べてトークン使用量を40%削減すると述べています。

Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「深刻な概念的明確さ」を備えた最初のコーディングモデルだと説明しました。Shipperは、彼と最良のエンジニアがローンチ後の問題のデバッグに数日かけた後にGPT-5.5をテストしました。Shipperによれば、GPT-5.5はGPT-5.4にできなかったことを達成しました。つまり、壊れたコードを調べて、最終的にエンジニアが採用した書き直しを生成したのです。このモデルは「記憶」し、全ライブラリの情報を参照しつつ、居場所を失わずに済むため、以前のバージョンで問題になっていた「ハルシネーション」を減らせます。

自律的な能力と自己修正

OpenAIは、GPT-5.5が「自己修正」と自律のために最適化されていると主張しています。曖昧な指示を解釈し、コンピュータ・インターフェース(clicking, typing, browsing)を使って、人間の介入なしに目的を達成するのが得意です。モデルは、ソフトウェアを操作するためのエージェントが必要なとき、ターミナル中心のワークフローを管理するとき、またはコードベース全体にわたって推論するとき(500K+ tokens)に高い検索精度で特に役立ちます。

GPT-5.5思考機能

ChatGPTでは、OpenAIが「GPT-5.5 Thinking」を導入しました。企業によれば、これにより、より難しい問題に対してより速い支援が解放されます。この機能は、複雑なタスクをより効率よく完了できるようにするため、より賢く、より簡潔な回答を提供します。情報の統合と分析、コーディング、そしてリサーチのようなドキュメント量の多いタスクなど、専門的な仕事に特に強みを発揮します。特にプラグインを使用する場合です。

初期のGPT-5.5 Proテスターは、ChatGPTが引き受けられる仕事の質と難易度の両方が大幅に改善したと報告しています。低遅延により、GPT-5.4 Proよりも要求の厳しいタスクに実用的です。GPT-5.5 Proの応答は、よく構造化されており、関連性があり、有用で正確で、法務、データサイエンス、ビジネス、教育で特に優れた性能を示しています。

料金と利用可能性

基本版は利用可能ですが、最も高性能なバージョン(GPT-5.5 Pro)は個人の加入者向けに月100ドルです。企業向けでは、40%高いトークン効率があっても、出力トークンあたりのコストはGPT-5.4の約2倍です。大規模なエージェント型導入にかかる総支出は、相当な金額になり得ます。最上位の推論が、資金の潤沢な企業だけが利用できる「贅沢品」になるのではないかという懸念が高まっており、その結果、大企業と小規模なスタートアップとの間で生産性の格差が広がる可能性があります。

ソースを表示

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

0/400

AprDaydream

· 2時間前

希望公式提供一个可审计的行动日志/回放机制，否则出现问题时很难追责，尤其是自动操作资产类账户。

原文表示返信0

PaperHandsPro

· 2時間前

現実の応用における「意図の理解」こそが難点であり、もう二度とあなたが航空券を予約したいのに履歴書を修正されるという恥ずかしい事態が起きないことを願います。

原文表示返信0

Half-SectionedSucculent

· 2時間前

少し期待している一方で、少し怖い：マウスをクリックできることは、多くの「人間のクリック」でしかできないことができることと同じであり、リスク管理と反不正行為対策の強化が必要になる。

原文表示返信0

ACalmnessWithAHintOfPomelo

· 2時間前

この波はWeb3にも影響を与えるでしょう。自動化されたオンチェーン操作、署名プロセス、ウォレットのインタラクションがシームレスに行えるようになれば、製品の形態は変わるでしょう。

原文表示返信0

StarsInTheGlassDome

· 2時間前

APIと価格は急がず、まず複雑なデスクトップ環境でポップアップ、マルチウィンドウ、ネットワークのジッターに耐えられるかどうかを見てみましょう。

原文表示返信0

GateUser-b665e41c

· 2時間前

「話せて書ける」から「できて納品できる」へ進化するのを感じている。次のステップは、より良い記憶とタスク管理を提供することだ。

原文表示返信0

LintCollector

· 2時間前

もし本当にアプリ間の連携が可能になれば：ブラウザで資料を検索→Excelで処理→PPTでプレゼン資料作成→メールで送信、これがオフィスの全工程のクローズド・ループとなる。

原文表示返信0

DegenWithNotebook

· 2時間前

ついにデスクトップネイティブ操作が登場したのか？これで本当に「デジタルインターン生」になるぞ。

原文表示返信0