Отсканируйте, чтобы загрузить приложение Gate
qrCode
Больше вариантов загрузки
Не напоминай мне больше сегодня.

Gemini 3 наступает глубокой ночью: превосходит GPT 5.1, эпоха больших моделей от Google пришла

Gemini 3 еще не появился, твиттер сначала рухнул в уважение.

Нет ни одной модели, которая бы привлекала больше внимания, чем Gemini 3. Согласно частоте обновлений Gemini раз в три месяца, сообщество ИИ с сентября с нетерпением ожидало Gemini 3.

Сегодня глава отдела по связям с разработчиками Google и глава Google AI Studio опубликовали твит, содержащий только слово «Gemini». Месяцы ожидания наконец достигли своего апогея, и связанные с этим темы в Твиттере мгновенно вспыхнули.

Интересно, что незадолго до публикации узла Твиттер несколько раз «потерпел крах» в подходящий момент. Хотя «за кулисами» стоит Cloudflare, время этих сбоев настолько точно, что вызывает подозрения, что кто-то замешан за кулисами (тихо шепчу: в конце концов, Твиттер является главной площадкой для продвижения моделей всех компаний).

Не знаю, какие у Маска чувства после того, как сегодня утром выпустили Grok 4.1, в любом случае мемы от пользователей уже заполонили интернет.

Только что Gemini 3 наконец-то официально представлен, давайте посмотрим, насколько он силен, появившись на глазах у всех.

Самая умная модель

Факты показывают, что Google не разочаровал ожидающих, Gemini 3 официально выпущен, снова определяя SOTA, Ultraman и Маск также отправили свои поздравления.

Google определяет это как «важный шаг к AGI» и подчеркивает, что это самый мощный в мире многомодальный интеллект с самой глубокой интерактивностью.

Gemini 3 не только обновил стандарт SOTA в базовых способностях рассуждения, но и пытается переосмыслить экосистему разработчиков и опыт с помощью ИИ, запустив новую платформу Google Antigravity и режим Deep Think.

Полностью доминирующее логическое чудовище

Gemini 3 Pro официально называется «самой продвинутой моделью вывода», которая значительно превзошла своего предшественника Gemini 2.5 Pro в почти всех основных AI бенчмарках, а также полностью подавила основные конкуренты, такие как Claude Sonnet 4.5 и GPT-5.1.

Gemini 3 Pro занял первое место в LMArena Leaderboard с прорывом на 1501 Elo, получив наивысшие баллы в Humanity’s Last Exam (37.5% без использования каких-либо инструментов) и GPQA Diamond (91.9%), демонстрируя докторскую степень в способности рассуждения. Он также установил новый стандарт для передовых моделей в математике, достигнув последнего уровня SOTA 23.4% в MathArena Apex.

Помимо текста и логики, Gemini 3 Pro также переопределяет пределы мультимодального рассуждения. Он набрал 81% и 87,6% на MMMU-Pro и Video-MMMU соответственно, что означает, что он уверенно справляется как с анализом сложных научных графиков, так и с пониманием динамических видеопотоков.

Стоит также отметить, что он получил 72,1% на SimpleQA Verified, что показывает значительный прогресс в точности фактов — он не только силен, но и надежен.

Отказ от мышления комплиментарного партнера

Эволюция Gemini 3 Pro заключается не только в производительности, но и в качестве взаимодействия. Он отказывается от привычных клише и чрезмерной лести, свойственных ИИ, становясь умным, лаконичным и прямым: говорит вам то, что вам нужно услышать, а не только то, что вам нравится слушать.

Он служит настоящим мыслительным партнером, предоставляя вам новые способы понимания информации и самовыражения, от перевода сложных научных концепций с помощью генерации высококачественной визуализации кода до творческого мозгового штурма.

Близнецы 3: Глубокие размышления

Модель Gemini 3 Deep Think значительно расширяет границы интеллекта, обеспечивая значительные улучшения в способности Gemini 3 к рассуждению и многомодальному пониманию, помогая вам решать более сложные задачи.

В тестах Gemini 3 Deep Think показал себя лучше, чем уже весьма выдающиеся результаты Gemini 3 Pro, с оценками 41,0% на Humanity's Last Exam (без использования инструментов) и 93,8% на GPQA Diamond. Кроме того, он также достиг беспрецедентного результата 45,1% на ARC-AGI-2 (выполнение кода, подтвержденное ARC Prize), продемонстрировав свою способность решать совершенно новые задачи.

Модуль Gemini 3 Deep Think показывает отличные результаты в некоторых из самых сложных тестов на ИИ.

Изучение, создание и планирование

Учить что-либо

Gemini с самого начала был нацелен на бесшовную интеграцию многомодальной информации по любой теме, включая текст, изображения, видео, аудио и код. Gemini 3 сочетает в себе свои передовые способности к рассуждению, визуальному и пространственному пониманию, ведущую многоязычную производительность и контекстное окно на миллионы токенов, что еще больше расширяет границы многомодального рассуждения и помогает вам учиться наиболее подходящим для вас способом.

Например, если вы хотите научиться готовить традиционные семейные блюда, Gemini 3 может интерпретировать и переводить рукописные рецепты на разных языках, создавая рецепты, которые можно поделиться с семьей.

Или, если вы хотите изучить какую-то новую тему, вы можете предоставить научные статьи, длинные видеолекции или учебные пособия, и он сможет генерировать интерактивные карточки памяти, визуализации или код в других форматах, чтобы помочь вам овладеть соответствующими знаниями.

Он даже может анализировать видео ваших матчей по пиклболу, выявлять области для улучшения и разрабатывать тренировочный план, чтобы помочь вам всесторонне улучшить свои навыки игры.

Чтобы помочь вам лучше понять информацию в Интернете, AI-режим в поиске теперь использует Gemini 3 для реализации нового генеративного пользовательского интерфейса, такого как погружающая визуальная компоновка, интерактивные инструменты и симуляции, все из которых мгновенно создаются в зависимости от вашего запроса.

Разработка чего-либо

На основе успеха 2.5 Pro, Gemini 3 выполнил обещание реализовать любые идеи разработчиков. Он отлично справляется с генерацией нулевых образцов и способен обрабатывать сложные подсказки и инструкции, создавая более богатый и интерактивный веб-интерфейс.

Gemini 3 — это лучшая модель Vibe-кодирования и Agent-кодирования, которую Google когда-либо создавал, она делает продукты Google более автономными и значительно повышает эффективность разработчиков. Она занимает первое место в рейтинге WebDev Arena с впечатляющим результатом 1487 Elo. Кроме того, она также показала 54.2% в тесте Terminal-Bench 2.0, который предназначен для оценки способности модели использовать инструменты для работы с компьютером через терминал. В то же время она значительно превзошла версию 2.5 Pro (с результатом 76.2%) в тесте SWE-bench Verified, который используется для оценки производительности кодирующих агентов.

Теперь пользователи могут строить с использованием Google AI Studio, Vertex AI, Gemini CLI и совершенно новой платформы для разработки интеллектуальных агентов Google Antigravity с Gemini 3. Он также подходит для сторонних платформ, таких как Cursor, GitHub, JetBrains, Manus, Replit.

Например, создать ретро 3D космическую игру с более богатой визуализацией и более сильной интерактивностью.

Например, создание более богатых и интерактивных веб-интерфейсов и приложений:

Планировать что угодно

После Gemini 2, Gemini значительно улучшил свои способности к планированию в долгосрочных задачах.

Способности планирования Gemini 3 были дополнительно подтверждены в тестировании Vending-Bench 2: Gemini 3 занял первое место в рейтинге во время тестирования симуляции управления торговыми автоматами, управляя виртуальной коммерческой операцией с помощью долгосрочного планирования.

В полном симуляционном годовом цикле Gemini 3 Pro всегда поддерживает стабильные вызовы инструментов и согласованность решений, достигая более высокой доходности инвестиций при постоянном сосредоточении на задачах.

Gemini 3 Pro демонстрирует более выдающиеся возможности долгосрочного планирования и может создавать более высокую доходность по сравнению с другими передовыми моделями.

Gemini Agent также может помочь организовать папку «Входящие» в Gmail.

Gemini 3 теперь полностью доступен. С сегодняшнего дня обычные пользователи и подписчики могут использовать новую модель через приложение Gemini и режим поиска AI; разработчики и корпоративные клиенты также могут подключаться через AI Studio, Vertex AI и другие каналы. Что касается долгожданного «глубокого мыслительного режима», он ожидается в эксклюзивном запуске для подписчиков Google AI Ultra в ближайшие несколько недель.

Кроме того, согласно ранее утеченным данным модели, есть множество ключевой информации, на которую стоит обратить внимание: Google использует TPU для обучения этой модели с нуля, как MoE, с 1M входных данных и 64k выходных токенов, MoE означает, что они могут позволить себе сделать это дешевле.

В отношении ценообразования Gemini 3.0 Pro вводит механизмы дифференцированного ценообразования на основе длины контекста: для задач до 200k токенов цены на ввод / вывод составляют $2.00/$12.00 (за миллион токенов); свыше 200k токенов - соответственно $4.00 и $18.00.

Совершенно новый опыт разработки с приоритетом “умных тел”

Google Antigravity — это новая платформа разработки интеллектуальных агентов от Google, которая позволяет разработчикам работать на более высоком, ориентированном на задачи уровне. Используя передовые возможности рассуждения, работы с инструментами и программирования агентов Gemini 3, Google Antigravity превращает AI-поддержку из инструмента в инструменте разработчика в активного партнера.

Хотя основа Google Antigravity — это знакомый опыт AI IDE (интегрированная среда разработки), его интеллект был улучшен до специализированного интерфейса и получил прямой доступ к редактору, терминалу и браузеру. Теперь интеллект может самостоятельно планировать и одновременно выполнять сложные задачи программного обеспечения от начала до конца, а также проверять свой собственный код.

Кроме Gemini 3 Pro, Google Antigravity также тесно связана с последней моделью Gemini 2.5 Computer Use для управления браузером от Google, а также с ее первоклассной моделью редактирования изображений Nano Banana (Gemini 2.5 Image).

первоеhand体验

Раз уж бета-версия Gemini 3 Pro вышла на платформу AI Studio, мы тоже решили попробовать ее.

Подсказка: SVG НЬЮ-ЙОРКСКИЙ СИЛУЭТ Используйте любые библиотеки, чтобы выполнить это задание, но убедитесь, что я могу вставить всё это в один HTML-файл и открыть его в Chrome. Сделайте это интересно и очень детализированно, покажите детали, которых никто не ожидал, дайте волю креативности и красоте в одном кодовом блоке.

Задача: Создайте визуально впечатляющую игру Space Invaders.

Анимированная SVG-иллюстрация пеликана, катающегося на велосипеде.

По сравнению с предыдущей версией, Gemini 3 значительно улучшился, однако все еще есть ошибки, например, педали велосипеда вращаются в воздухе.

Мы снова изменили подсказку на более четкую: Создайте один, полный, самодостаточный анимированный SVG-код (без внешних файлов или изображений) милого пеликана, едущего на велосипеде в профиль. На этот раз велосипед, созданный Gemini 3, кажется, не имеет педалей.

Написано в конце

В голосовании, инициированном блогером X Chubby под названием «Какая компания будет иметь лучший LLM к концу 2026 года?», Google Gemini значительно впереди.

Этот восстановление рыночной уверенности также отражено в данных: генеральный директор Alphabet Сундар Пичаи в официальном блоге подвел итоги прогресса Gemini за последние два года: активные пользователи AI Overviews достигли 2 миллиардов, месячное количество активных пользователей приложения Gemini превысило 650 миллионов, кроме того, более 70% клиентов облачных услуг и 13 миллионов разработчиков используют его генеративные модели.

Оглядываясь на последние два года, от поспешного реагирования на выпуск Bard (предшественника Gemini) и падения акций до болезненного осознания необходимости объединения с Google DeepMind, возвращения основателей и завоевания Нобелевской премии, Google завершила учебный процесс по “развороту слона”.

Тот гигант, который когда-то определял Transformer и теперь «All in Gemini», уже готов к全面反击.

Что касается того, сможет ли он положить конец борьбе за «лучший LLM», не торопитесь, пусть пули (и серверы) пока полетают.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
0/400
Нет комментариев
  • Горячее на Gate FunПодробнее
  • РК:$3.69KДержатели:1
    0.00%
  • РК:$3.61KДержатели:1
    0.00%
  • РК:$3.61KДержатели:1
    0.00%
  • РК:$3.62KДержатели:2
    0.14%
  • РК:$3.65KДержатели:2
    0.18%
  • Закрепить