Скануйте, щоб завантажити додаток Gate

Більше варіантів завантаження

Не нагадувати сьогодні

Gemini 3 глибокої ночі наступає: перевершує GPT 5.1, ера великих моделей Google прийшла

DeepFlowTech

2025-11-19 01:35:34

Gemini 3 ще не з'явився, Twitter спочатку впав на знак поваги.

Ні одна модель не викликала такої уваги, як Gemini 3. Відповідно до частоти оновлень Gemini раз на три місяці, AI спільнота з вересня з нетерпінням чекає на Gemini 3.

Сьогодні керівник відносин з розробниками Google та керівник Google AI Studio опублікував твіт, що містив лише слово «Gemini», і нарешті настав момент вибуху очікувань, які накопичувалися протягом кількох місяців, тема в Twitter миттєво спалахнула.

Цікаво, що напередодні випуску вузлів, Twitter несподівано кілька разів “зламався”. Хоча “за лаштунками” винен Cloudflare, такий точний збіг часу просто настільки підозрілий, що виникають думки, чи не стоять за цим чиясь маніпуляція (пошепки: адже Twitter є основним майданчиком для реклами моделей різних компаній).

Не знаю, які враження у Маска, який сьогодні вранці випустив Grok 4.1, але меми від користувачів вже заполонили інтернет.

Щойно, Gemini 3 нарешті офіційно дебютував, давайте подивимося, наскільки він потужний під пильною увагою.

Найрозумніша модель

Виявилося, що Google не розчарував тих, хто чекав, Gemini 3 офіційно випущено, ще раз визначивши SOTA, а також отримали привітання від Ультрамена та Маска.

Google визначає це як “важливий крок до AGI” і підкреслює, що це найсильніший у світі агент з багатомодального розуміння та найглибшою взаємодією.

Gemini 3 не тільки оновив стандарти SOTA в базових здібностях розуміння, але й намагається перетворити екосистему розробників та досвід AI-підтримки через запуск нової платформи Google Antigravity та режиму Deep Think.

Всеосяжний монстр міркувань, який домінує в рейтингах

Gemini 3 Pro офіційно називається «найсучаснішою моделлю інференції», яка значно перевершила попередню версію Gemini 2.5 Pro у майже всіх основних AI бенчмарках і повністю домінує над основними конкурентами, такими як Claude Sonnet 4.5 і GPT-5.1.

Gemini 3 Pro досяг рекордного високого балу в 1501 Elo, очоливши LMArena Leaderboard, отримавши найвищі бали в Humanity’s Last Exam (досягнувши 37.5% без використання будь-яких інструментів) і GPQA Diamond (91.9%), продемонструвавши докторський рівень аналітичних здібностей. Він також встановив нові стандарти для передових моделей у математиці, досягнувши 23.4% останнього SOTA рівня в MathArena Apex.

Окрім тексту та логіки, Gemini 3 Pro також переосмислює межі мультимодального мислення. Він набрав 81% та 87,6% на MMMU-Pro та Video-MMMU відповідно, що означає, що він впевнено справляється як з аналізом складних наукових графіків, так і з розумінням динамічних відеопотоків.

Ще варто зазначити, що він досягнув 72,1% на SimpleQA Verified, що демонструє величезний прогрес у фактичній точності — він не лише сильний, а й надійний.

Відмовитися від підлабузництвом мислення партнера

Еволюція Gemini 3 Pro полягає не лише в тестових показниках, але й у якості взаємодії. Він відмовляється від звичних кліше та надмірної лестощів, стає розумнішим, простішим та прямолінійним: говорить вам те, що вам потрібно почути, а не лише те, що вам хочеться чути.

Він виступає справжнім партнером у мисленні, пропонуючи нові способи розуміння інформації та вираження себе, від перекладу складних наукових концепцій через генерацію високоякісних візуалізацій коду до креативного мозкового штурму.

Gemini 3 Глибоке мислення

Режим Gemini 3 Deep Think ще більше розширює межі інтелекту, забезпечуючи значний прогрес Gemini 3 у здатності до міркування та мультимодального розуміння, що допомагає вам вирішувати більш складні проблеми.

У тестуванні Gemini 3 Deep Think показав кращі результати, ніж вже досить вражаючі результати Gemini 3 Pro, в Humanity's Last Exam (без використання інструментів, результат 41,0%) та GPQA Diamond (результат 93,8%). Крім того, він також досяг небаченого результату в ARC-AGI-2 (виконання коду, підтверджено ARC Prize) з оцінкою 45,1%, демонструючи свою здатність вирішувати нові виклики.

Режим Gemini 3 Deep Think показав відмінні результати в деяких із найскладніших тестів на базі ШІ.

Навчання, побудова та планування

Вивчення будь-якої справи

Gemini з самого початку був спроектований для безшовної інтеграції різноманітної модальної інформації на будь-яку тему, включаючи текст, зображення, відео, аудіо та код. Gemini 3 поєднує в собі свої передові можливості міркування, візуального та просторового розуміння, провідну багатомовну продуктивність та контекстне вікно з мільйонами токенів, ще більше розширюючи межі мультимодального міркування, допомагаючи вам навчатися найбільш зручним для вас способом.

Наприклад, якщо ви хочете навчитися готувати традиційні страви родини, Gemini 3 може інтерпретувати та перекладати рукописні рецепти різними мовами, створюючи рецепти, які можна поділитися з родиною.

Або, якщо ви хочете вивчити якусь нову тему, ви можете надати наукові статті, довгі відеолекції або навчальні посібники, він може генерувати інтерактивні картки пам'яті, візуалізації або код в інших форматах, щоб допомогти вам оволодіти відповідними знаннями.

Воно навіть може аналізувати відео ваших матчів з пікл-болу, виявляти аспекти, які можна покращити, та розробляти тренувальний план, щоб допомогти вам всебічно покращити свої навички.

Щоб допомогти вам краще зрозуміти інформацію в Інтернеті, AI-режим у пошуку тепер використовує Gemini 3 для реалізації нового генеративного UI-досвіду, такого як занурювальні візуальні макети, інтерактивні інструменти та симуляції, які всі миттєво генеруються відповідно до вашого запиту.

Розробити що-небудь

На основі успіху 2.5 Pro, Gemini 3 реалізував обіцянку перетворити будь-які ідеї розробників у реальність. Він демонструє видатні результати в генерації без зразків, здатний обробляти складні підказки та інструкції, що дозволяє створювати більш багаті та інтерактивні веб-інтерфейси.

Gemini 3 є найкращою моделлю кодування Vibe та кодування Agent, яку Google побудував до цього часу, що робить продукти Google більш автономними та значно підвищує ефективність розробників. Він займає перше місце в рейтингу WebDev Arena, отримавши вражаючий бал 1487 Elo. Крім того, він також продемонстрував результат 54.2% у тесті Terminal-Bench 2.0, який спрямований на оцінку здатності моделі використовувати інструменти для роботи з комп'ютером через термінал. Водночас він значно перевершив версію 2.5 Pro (з результатом 76.2%) у тестуванні SWE-bench Verified, яке використовується для оцінки продуктивності кодувальних агентів.

Зараз користувачі можуть використовувати Google AI Studio, Vertex AI, Gemini CLI, а також нову платформу розробки інтелектуальних агентів Google Antigravity для створення з Gemini 3. Це також підходить для сторонніх платформ, таких як Cursor, GitHub, JetBrains, Manus, Replit.

Наприклад, розробка ретро 3D космічної гри з більш багатими візуальними ефектами та більшою інтерактивністю.

Наприклад, розробка більш багатих і інтерактивних веб-інтерфейсів та додатків:

Планування будь-чого

Після розумного тіла Gemini 2, Gemini значно покращив здатність до планування в довгострокових завданнях.

Потужність планування Gemini 3 ще більше підтверджена в тестуванні Vending-Bench 2: Gemini 3 зайняв перше місце в рейтингу під час тестування управління віртуальними торговими автоматами, здійснюючи управління віртуальним бізнесом протягом тривалого періоду.

Протягом повного року роботи Gemini 3 Pro завжди забезпечував стабільну виклику інструментів та узгодженість рішень, досягаючи вищої прибутковості інвестицій при постійному зосередженні на завданнях.

Gemini 3 Pro демонструє видатні можливості довгострокового планування, здатний забезпечити вищий прибуток порівняно з іншими передовими моделями.

Gemini Agent також може допомогти впорядкувати вхідні повідомлення Gmail.

Gemini 3 вже повністю відкрито. З сьогоднішнього дня звичайні користувачі та підписники можуть використовувати нову модель через додаток Gemini та режим пошуку AI; розробники та корпоративні клієнти також можуть підключитися через AI Studio, Vertex AI та інші канали. Щодо довгоочікуваного «глибокого режиму мислення», очікується, що він буде ексклюзивно запущений для підписників Google AI Ultra в найближчі кілька тижнів.

Крім того, відповідно до раніше витеклих карт моделей, є багато ключової інформації, на яку варто звернути увагу: Google використовує TPU для навчання цієї моделі з нуля, як MoE, з 1M вхідних даних і 64k вихідних токенів, MoE означає, що вони можуть собі дозволити зробити це дешевше.

У ціновій політиці Gemini 3.0 Pro було запроваджено механізм диференційованого ціноутворення на основі довжини контексту: для завдань до 200 тисяч токенів ціна за введення/виведення становить $2.00/$12.00 (за мільйон токенів); для завдань, що перевищують 200 тисяч токенів, ціни становлять відповідно $4.00 і $18.00.

Цілком новий досвід розробки «Пріоритет розумних агентів»

Google Antigravity — це нова платформа розробки інтелектуальних агентів від Google, що дозволяє розробникам працювати на більш високому, орієнтованому на завдання рівні. Використовуючи передові можливості міркування, використання інструментів та програмування агентів Gemini 3, Google Antigravity перетворює AI-підтримку з інструмента в інструментарії розробника на активного партнера.

Хоча основою Google Antigravity є знайомий досвід AI IDE (інтегроване середовище розробки), його агент був піднятий до спеціалізованого інтерфейсу та наділений правом прямого доступу до редактора, терміналу та браузера. Тепер агент може самостійно планувати та одночасно виконувати складні завдання програмного забезпечення «від початку до кінця», перевіряючи свій власний код.

Окрім Gemini 3 Pro, Google Antigravity також тісно інтегрував останню модель Gemini 2.5 Computer Use для керування браузером від Google, а також свою провідну модель редагування зображень Nano Banana (Gemini 2.5 Image).

один досвід

Оскільки попередня версія Gemini 3 Pro з'явилася на платформі AI Studio, ми також вирішили спробувати її.

Запит : SVG НЬЮ-ЙОРКСЬКИЙ ГОРИЗОНТ Використовуйте будь-які бібліотеки для цього, але переконайтеся, що я можу вставити все в один HTML-файл і відкрити його в Chrome. зробіть його цікавим і дуже деталізованим, покажіть деталі, яких ніхто не очікував, будьте повністю творчими та прекрасними в одному кодовому блоці.

Підказка: Створіть візуально вражаючу гру Space Invaders.

Пелікан на велосипеді раніше ставив у складне становище безліч великих моделей, цього разу ми також дали можливість Gemini 3 спробувати. Запит: Анімаційний SVG пелікан, що їде на велосипеді.

У порівнянні з попередньою версією, Gemini 3 має значні покращення, але все ще є баги, наприклад, педалі велосипеда обертаються в повітрі.

Ми знову змінили на більш зрозуміле підказування: Створіть один, повний, самодостатній анімований код SVG ( без зовнішніх файлів або зображень) з милим пеліканом, що їде на велосипеді збоку. Цього разу велосипед, що його згенерував Gemini 3, здається, не має педалей.

Написано наприкінці

У голосуванні, ініційованому блогером X Chubby «Яка компанія матиме найкращий LLM до кінця 2026 року?», Google Gemini значно випереджає.

Цей відновлення довіри до ринку також відображається в даних: генеральний директор Alphabet Сундар Пічаї у офіційному блозі підсумував досягнення Gemini за останні два роки: щомісячна кількість активних користувачів AI Overviews досягла 2 мільярдів, щомісячна активність застосунку Gemini перевищила 650 мільйонів, а також більше 70% клієнтів хмари та 13 мільйонів розробників використовують його генеративні моделі.

Оглядаючись назад на останні два роки, від поспішної реакції на випуск Bard (попередник Gemini) і падіння акцій до болісного об'єднання з Google DeepMind, повернення засновника та здобуття Нобелівської премії, Google здійснив класичний «поворот слона».

Той, хто колись визначав Transformer, а тепер «All in Gemini», вже підготувався до повного контрнаступу.

Щодо того, чи зможе він покласти край суперечці про «найкращу LLM»? Не поспішайте, нехай кулі (і сервери) ще деякий час летять.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.