Gemini 3 Deep Think モードは、知能の境界をさらに拡張し、推論とマルチモーダル理解能力において Gemini 3 の大きな進歩をもたらし、より複雑な問題を解決する手助けをします。
テストでは、Gemini 3 Deep Thinkは、Humanity's Last Exam(ツールを使用せずに41.0%のスコア)とGPQA Diamond(93.8%のスコア)で、すでに相当優れた成績を収めているGemini 3 Proを上回るパフォーマンスを示しました。さらに、ARC-AGI-2(コード実行、ARC Prizeによって検証済み)でも前例のない45.1%のスコアを達成し、新たな課題を解決する能力を示しています。
Gemini 3 Deep Think モードは、いくつかの最も挑戦的な AI ベンチマークテストで優れたパフォーマンスを発揮しました。
現在、ユーザーは Google AI Studio、Vertex AI、Gemini CLI、および Google の全く新しいインテリジェントエージェント開発プラットフォーム Google Antigravity 内の Gemini 3 を使用して構築できます。また、Cursor、GitHub、JetBrains、Manus、Replit などのサードパーティプラットフォームにも対応しています。
Gemini 3は現在全面的にオープンしています。即日より、一般ユーザーとサブスクリプションユーザーはそれぞれGeminiアプリと検索AIモードを通じて新しいモデルを使用できます。開発者や企業顧客もAIスタジオ、Vertex AIなどのチャネルを通じて接続できます。期待されている「深い思考モード」は、今後数週間以内にGoogle AI Ultraサブスクリプションユーザーに独占的にリリースされる予定です。
Google Antigravity は、Google の新しいインテリジェントエージェント開発プラットフォームであり、開発者がより高いタスク指向のレベルで操作できるようにします。Gemini 3 の高度な推論、ツール使用、インテリジェントエージェントプログラミング能力を活用することで、Google Antigravity は AI 支援を開発者ツールボックスの一つのツールから積極的なパートナーへと変革します。
Google Antigravityのコアはお馴染みのAI IDE(統合開発環境)体験ですが、そのエージェントは専用インターフェースにアップグレードされ、エディタ、ターミナル、ブラウザに直接アクセスする権限が与えられました。現在、エージェントはあなたに代わって自主的に複雑なエンドツーエンドのソフトウェアタスクを計画し、同時に実行し、自らのコードを検証することができます。
ジェミニ3 深夜に襲来:GPT 5.1 を圧倒し、大規模モデルのグーグル時代が来た
Gemini 3 はまだ姿を現していませんが、まずはTwitterが崩壊しました。
Gemini 3 のリリースほど注目を集めているモデルはありません。Gemini が以前は 3 ヶ月ごとに更新されていたことから、AI コミュニティは 9 月から Gemini 3 を心待ちにしていました。
今日、Googleの開発者関係責任者であり、Google AI Studioの責任者が「Gemini」という単語だけが含まれたツイートを投稿し、数ヶ月間の期待がついに爆発的な瞬間を迎え、Twitterの関連トピックは瞬時に盛り上がりました。
興味深いことに、リリースノードが近づくと、Twitterは何度も「タイミングよく」ダウンしました。背後の「黒幕」はCloudflareですが、このダウンのタイミングはあまりにも正確で、誰かが裏で手を引いているのではないかと疑ってしまいます(小声でコオロギ:結局、Twitterは各社のモデルの宣伝の主要な舞台です)。
今朝Grok 4.1を発表したマスクが今何を思っているのかはわかりませんが、ネットユーザーのミームはすでにあふれています。
ついに、Gemini 3が正式に登場しました。大勢の注目を浴びている中で、その実力を見てみましょう。
最もスマートなモデル
事実は、Googleが待っている人々を失望させなかったことを証明しています。Gemini 3が正式に発表され、再びSOTAを定義しました。ウルトラマンとマスクも祝電を送りました。
Googleはこれを「AGIへの重要な一歩」と定義し、現在世界で最も多様な理解能力を持ち、最も深いインタラクションを持つ知能体であることを強調しています。
Gemini 3 は、基礎的な推論能力において SOTA 標準を刷新しただけでなく、新しい Google Antigravity プラットフォームと Deep Think モードを導入することで、開発者エコシステムと AI 支援体験を再構築しようとしています。
全面制覇した推理モンスター
Gemini 3 Proは公式に「最先端の推論モデル」と称され、ほぼすべての主要なAIベンチマークテストで前代のGemini 2.5 Proを著しく上回り、Claude Sonnet 4.5やGPT-5.1などの主要な競合製品を完全に抑えています。
Gemini 3 Proは、1501 Eloという画期的な高得点でLMArenaリーダーボードのトップに立ち、Humanity's Last Exam(ツールを使用せずに37.5%)とGPQA Diamond(91.9%)で最高スコアを獲得し、博士号レベルの推論を示しました。 また、数学の最先端モデルの新たな基準を打ち立て、MathArena Apex で 23.4% という最先端の SOTA レベルを達成しました。
テキストと論理に加えて、Gemini 3 Pro はマルチモーダル推論の限界も再定義しました。MMMU-Pro と Video-MMMU でそれぞれ 81% と 87.6% の高得点を獲得しており、複雑な科学的図表を解析することも、動的なビデオストリームを理解することもお手の物です。
特に注目すべきは、SimpleQA Verifiedで72.1%のスコアを取得し、事実の正確性において大きな進歩を示していることです——それは強力であるだけでなく、信頼性もあります。
お世辞を拒否する思考パートナー
Gemini 3 Proの進化は、スコアだけでなく、インタラクションの質感にもあります。従来のAIによく見られる陳腐な表現や過度な賛美を排除し、賢く、シンプルかつ直接的になりました:あなたが必要としていることを伝え、単にあなたが聞きたいことだけではありません。
それは真の思考パートナーとして機能し、難解な科学概念を高忠実度の視覚化コードに変換することから、創造的なブレインストーミングまで、自分自身を表現し情報を理解する新しい方法を提供します。
ジェミニ 3 ディープ シンク
Gemini 3 Deep Think モードは、知能の境界をさらに拡張し、推論とマルチモーダル理解能力において Gemini 3 の大きな進歩をもたらし、より複雑な問題を解決する手助けをします。
テストでは、Gemini 3 Deep Thinkは、Humanity's Last Exam(ツールを使用せずに41.0%のスコア)とGPQA Diamond(93.8%のスコア)で、すでに相当優れた成績を収めているGemini 3 Proを上回るパフォーマンスを示しました。さらに、ARC-AGI-2(コード実行、ARC Prizeによって検証済み)でも前例のない45.1%のスコアを達成し、新たな課題を解決する能力を示しています。
Gemini 3 Deep Think モードは、いくつかの最も挑戦的な AI ベンチマークテストで優れたパフォーマンスを発揮しました。
学ぶ、構築する、計画する
何かを学ぶ
Geminiは、当初からテキスト、画像、動画、音声、コードなど、さまざまなモダリティ情報をシームレスに統合することを目的としています。Gemini 3は、その高度な推論、視覚的および空間的理解能力、先進的な多言語性能、百万トークンのコンテキストウィンドウを組み合わせて、多モダリティ推論の境界をさらに広げ、あなたが最も適した方法で学ぶ手助けをします。
例えば、家族の伝統料理の作り方を学びたい場合、Gemini 3 は異なる言語の手書きのレシピを解読し、家族と共有できるレシピを生成します。
または、新しいテーマを学びたい場合は、学術論文、長編ビデオ講義、またはチュートリアルを提供することができ、インタラクティブなメモカード、視覚化、またはその他の形式のコードを生成して、関連知識を習得するのを助けます。
それはあなたのピックルボールの試合のビデオを分析し、改善できる点を見つけ出し、トレーニングプランを作成して、あなたのスキルを全体的に向上させるのを助けることさえできます。
ネット上の情報をよりよく理解するために、検索の AI モードは現在、Gemini 3 を使用して新しい生成型 UI 経験を実現しています。これには、没入型ビジュアルレイアウト、インタラクティブツール、シミュレーションが含まれ、すべてあなたのクエリに基づいて即座に生成されます。
何かを開発する
2.5 Pro の成功を基に、Gemini 3 は開発者のあらゆるアイデアを実現するという約束を果たしました。ゼロショット生成において優れた性能を発揮し、複雑なプロンプトや指示を処理することで、より豊かでインタラクティブなウェブユーザーインターフェースをレンダリングします。
Gemini 3は、Googleがこれまでに構築した最高のVibeコーディングおよびエージェントコーディングモデルであり、Googleの製品をより自律的にし、開発者の効率を大幅に向上させました。WebDev Arenaランキングでは首位に立ち、注目の1487 Eloスコアを獲得しました。さらに、Terminal-Bench 2.0テストでも54.2%の成績を収めており、このテストはモデルが端末操作を通じてコンピュータのツールを使用する能力を評価することを目的としています。同時に、SWE-bench Verifiedテストでも2.5 Proバージョン(スコア76.2%)を大幅に上回りました。このテストはコーディングエージェントのパフォーマンスを測定するために使用されます。
現在、ユーザーは Google AI Studio、Vertex AI、Gemini CLI、および Google の全く新しいインテリジェントエージェント開発プラットフォーム Google Antigravity 内の Gemini 3 を使用して構築できます。また、Cursor、GitHub、JetBrains、Manus、Replit などのサードパーティプラットフォームにも対応しています。
例えば、より豊かな視覚効果とより強いインタラクティブ性を持つレトロな3D宇宙船ゲームを作成すること。
たとえば、より豊かでインタラクティブなWeb UIやアプリケーションを作成することです:
何事も計画する
Gemini 2のインテリジェントボディ以降、Geminiは長期タスクにおける計画能力を大幅に向上させました。
Gemini 3の計画能力は、Vending-Bench 2テストでさらに証明されました:Gemini 3は、模擬自動販売機運営テストでこのランキングのトップに立ち、長期計画を通じて仮想ビジネス運営を管理しました。
完全な年度運営のシミュレーションにおいて、Gemini 3 Proは常に安定したツールの呼び出しと意思決定の一貫性を維持し、タスク目標に継続的に集中しながらより高い投資利益を実現しました。
Gemini 3 Proは、他の最先端モデルと比較して、より優れた長期計画能力を示し、より高いリターンを生み出すことができます。
Gemini Agent は Gmail の受信トレイを整理するのにも役立ちます。
Gemini 3は現在全面的にオープンしています。即日より、一般ユーザーとサブスクリプションユーザーはそれぞれGeminiアプリと検索AIモードを通じて新しいモデルを使用できます。開発者や企業顧客もAIスタジオ、Vertex AIなどのチャネルを通じて接続できます。期待されている「深い思考モード」は、今後数週間以内にGoogle AI Ultraサブスクリプションユーザーに独占的にリリースされる予定です。
さらに、以前に漏洩したモデルカードによれば、注目すべき多くの重要な情報があります:Google は TPU を使用してこのモデルをゼロからトレーニングし、MoE として 1M の入力と 64k トークンの出力を持っています。MoE とは、彼らがそれを安価にすることができるという意味です。
価格設定に関して、Gemini 3.0 Pro はコンテキスト長に基づく階層的な価格設定メカニズムを導入しました:200k トークン未満のタスクでは、入力 / 出力の価格は $2.00/$12.00(百万トークンあたり);200k トークンを超える場合は、それぞれ $4.00 と $18.00 になります。
全く新しい「インテリジェントエージェント優先」の開発体験
Google Antigravity は、Google の新しいインテリジェントエージェント開発プラットフォームであり、開発者がより高いタスク指向のレベルで操作できるようにします。Gemini 3 の高度な推論、ツール使用、インテリジェントエージェントプログラミング能力を活用することで、Google Antigravity は AI 支援を開発者ツールボックスの一つのツールから積極的なパートナーへと変革します。
Google Antigravityのコアはお馴染みのAI IDE(統合開発環境)体験ですが、そのエージェントは専用インターフェースにアップグレードされ、エディタ、ターミナル、ブラウザに直接アクセスする権限が与えられました。現在、エージェントはあなたに代わって自主的に複雑なエンドツーエンドのソフトウェアタスクを計画し、同時に実行し、自らのコードを検証することができます。
Gemini 3 Proに加えて、Google Antigravityは、ブラウザ制御用のGoogleの最新のGemini 2.5コンピュータ使用モデル、および最上位の画像編集モデルであるNano Banana (Gemini 2.5 Image)と密接に統合されています。
直接の体験
Gemini 3 ProのプレビューバージョンがAI Studioプラットフォームに登場したので、私たちも実際に体験してみました。
プロンプト : ニューヨークのスカイラインのSVG この作業を行うために好きなライブラリを使用してください。ただし、すべてを1つのHTMLファイルに貼り付けてChromeで開けるようにしてください。興味深く、非常に詳細にし、誰も予期しない詳細を示し、創造的で美しいコードブロック全体を作成してください。
プロンプト: 視覚的に驚くべきスペースインベーダーゲームを作成してください。
ペリカンが自転車に乗っているアニメーションSVG。
以前のバージョンと比べて、Gemini 3 は大きな進歩を遂げましたが、まだバグがあります。例えば、自転車のペダルが空中で回転しています。
より明確なプロンプトに変更しました: 外部ファイル(no 1 つの完全な自己完結型のアニメーション SVG コードを作成するか、自転車に乗ったかわいいペリカンの images) を作成します。 側面図。 今回、Gemini 3で生成されたバイクにはペダルがないようです。
最後に書く
X ブロガー Chubby が開始した「2026 年末までに、どの会社が最良の LLM を持つか?」の投票で、Google Gemini が圧倒的にリードしています。
この市場の信頼の回復はデータにも表れており、AlphabetのCEOであるSundar Pichaiは公式ブログでGeminiの過去2年間の進展を振り返りました:AI Overviewsの月間アクティブユーザーは20億人に達し、Geminiアプリの月間アクティブユーザーは6.5億人を突破しました。さらに、70%以上のクラウド顧客と1300万人の開発者がその生成モデルを使用しています。
過去2年間を振り返ると、Bard(Geminiの前身)が発表された際の慌ただしい対応と株価の暴落から、痛みを乗り越えてGoogle DeepMindを統合し、創業者を呼び戻し、ノーベル賞を受賞するまで、Googleは教科書のような「象の転回」を成し遂げた。
かつてトランスフォーマーを定義した巨人、今では「双子座のすべて」は、全面的な反撃の準備ができています。
それが「最良のLLM」争いを終わらせることができるのか?焦らないで、弾(とサーバー)がもう少し飛ぶのを待ちましょう。