OpenAIは2026年4月23日に、実世界のアプリケーションにおけるネイティブなコンピュータ利用能力を通じてユーザーの意図を理解するよう設計された新しいAIモデル「GPT-5.5」を正式にリリースしました。OpenAIの発表によると、このモデルは汎用のネイティブ能力を備えており、デスクトップアプリケーションのナビゲート、ボタンのクリック、テキストの入力を可能にし、多段階のワークフローをこなせます。
GPT-5.5は、ネイティブなコンピュータ利用と高度な推論を組み合わせ、上級の専門的タスクに必要なソフトウェアツールを自律的にナビゲートします。このモデルの約110万トークンのコンテキストウィンドウにより、従来は手作業でチャンク化する必要があった大規模な金融データセットを処理できます。OpenAIの金融チームはGPT-5.5を使って24,771のK-1税務フォーム(71,637ページ)をレビューし、前年度より2週間早くタスクを完了しました。
GPT-5.5は社内の投資銀行モデリング業務で88.5%、FinancialAgent v1.1ベンチマークで60%を達成し、GPT-5.4を4ポイント上回りました。このモデルはGDPvalで84.9%を獲得しました。これは44の職業にまたがって、エージェントが特定の知識労働を生み出す能力をテストするものです。OSWorld-Verifiedでは、モデルの自律的な実コンピュータ操作を測定し、78.7%に到達しました。GPT-5.5はTau2-bench Telecomで98%を獲得しました。これは非常に難しいカスタマーサービスのワークフローをテストするものです。
Go-to-Marketチームの従業員は、毎週のビジネスレポートを自動化すれば、毎週の手作業が約5〜10時間節約できると確認しました。
OpenAIは、GPT-5.5が自社の提供(サービング)インフラストラクチャ用のコード作成を支援するために使われたと報告しています。このモデルは、生産トラフィックのパターンを分析してカスタムの負荷分散ヒューリスティックを書くことで、「システムレベルの最適化」を達成し、自身のトークン生成速度を20%向上させました。
開発者向けのテストで、モデルには「マークダウンエディタを再アーキテクチャしろ」と依頼され、最小限の人手による修正で、ほぼ完成した12-diffのスタックを返しました。OpenAIは、新しいモデルが従来より少ないターンで正しい回答に到達し、同じCodexのタスクではGPT-5.4と比べてトークン使用量を40%削減すると述べています。
Everyの創業者兼CEOであるDan Shipperは、GPT-5.5を「深刻な概念的明確さ」を備えた最初のコーディングモデルだと説明しました。Shipperは、彼と最良のエンジニアがローンチ後の問題のデバッグに数日かけた後にGPT-5.5をテストしました。Shipperによれば、GPT-5.5はGPT-5.4にできなかったことを達成しました。つまり、壊れたコードを調べて、最終的にエンジニアが採用した書き直しを生成したのです。このモデルは「記憶」し、全ライブラリの情報を参照しつつ、居場所を失わずに済むため、以前のバージョンで問題になっていた「ハルシネーション」を減らせます。
OpenAIは、GPT-5.5が「自己修正」と自律のために最適化されていると主張しています。曖昧な指示を解釈し、コンピュータ・インターフェース(clicking, typing, browsing)を使って、人間の介入なしに目的を達成するのが得意です。モデルは、ソフトウェアを操作するためのエージェントが必要なとき、ターミナル中心のワークフローを管理するとき、またはコードベース全体にわたって推論するとき(500K+ tokens)に高い検索精度で特に役立ちます。
ChatGPTでは、OpenAIが「GPT-5.5 Thinking」を導入しました。企業によれば、これにより、より難しい問題に対してより速い支援が解放されます。この機能は、複雑なタスクをより効率よく完了できるようにするため、より賢く、より簡潔な回答を提供します。情報の統合と分析、コーディング、そしてリサーチのようなドキュメント量の多いタスクなど、専門的な仕事に特に強みを発揮します。特にプラグインを使用する場合です。
初期のGPT-5.5 Proテスターは、ChatGPTが引き受けられる仕事の質と難易度の両方が大幅に改善したと報告しています。低遅延により、GPT-5.4 Proよりも要求の厳しいタスクに実用的です。GPT-5.5 Proの応答は、よく構造化されており、関連性があり、有用で正確で、法務、データサイエンス、ビジネス、教育で特に優れた性能を示しています。
基本版は利用可能ですが、最も高性能なバージョン(GPT-5.5 Pro)は個人の加入者向けに月100ドルです。企業向けでは、40%高いトークン効率があっても、出力トークンあたりのコストはGPT-5.4の約2倍です。大規模なエージェント型導入にかかる総支出は、相当な金額になり得ます。最上位の推論が、資金の潤沢な企業だけが利用できる「贅沢品」になるのではないかという懸念が高まっており、その結果、大企業と小規模なスタートアップとの間で生産性の格差が広がる可能性があります。