OpenAI официально выпустила GPT-5.5 23 апреля 2026 года — новую модель ИИ, предназначенную для понимания намерений пользователя в реальных приложениях благодаря возможностям нативного использования компьютера. Модель обладает универсальными нативными возможностями, которые позволяют ей ориентироваться в десктопных приложениях, нажимать кнопки и вводить текст для многошаговых рабочих процессов, как говорится в объявлении OpenAI.

GPT-5.5 сочетает нативное использование компьютера с продвинутыми механизмами рассуждений, автономно навигируя по программным инструментам, необходимым для задач высокого уровня профессиональной деятельности. Контекстное окно модели ~1,1 млн токенов позволяет ей обрабатывать огромные массивы финансовых данных, которые ранее требовали ручного разбиения на фрагменты. Финансовая команда OpenAI использовала GPT-5.5 для проверки 24,771 форм K-1 (71,637 страниц) и завершила задачу на две недели быстрее, чем в предыдущем году.

Эталонные показатели производительности

GPT-5.5 набрала 88,5% на внутренних задачах моделирования для инвестиционного банкинга и 60% на бенчмарке FinancialAgent v1.1, опередив GPT-5.4 на четыре пункта. Модель достигла 84,9% на GDPval — тесте, оценивающем способности агентов выполнять конкретную интеллектуальную работу в 44 профессиях. На OSWorld-Verified, где измеряются автономные операции модели на реальном компьютере, она достигла 78,7%. GPT-5.5 набрала 98% на Tau2-bench Telecom — тесте крайне сложных рабочих процессов клиентской поддержки.

Сотрудник команды Go-to-Market подтвердил, что автоматизация еженедельных бизнес-отчетов сэкономит примерно 5–10 часов ручной работы в неделю.

Генерация кода и оптимизация системы

OpenAI сообщает, что GPT-5.5 использовалась, чтобы помочь написать код для собственной инфраструктуры обслуживания. Модель достигла «оптимизации уровня системы», анализируя паттерны производственного трафика, чтобы написать пользовательские эвристики балансировки нагрузки, увеличив собственную скорость генерации токенов на 20%.

В разработческом тесте модели предложили «переработать архитектуру markdown-редактора», и она вернула почти полный стек из 12 диффов с минимальными правками человека. OpenAI отмечает, что новая модель приходит к правильному ответу за меньшее число шагов и использует на 40% меньше токенов для тех же задач Codex по сравнению с GPT-5.4.

Дэн Шиппер, основатель и CEO Every, описал GPT-5.5 как первую кодирующую модель, обладающую «серьезной концептуальной ясностью». Шиппер протестировал GPT-5.5 после того, как он и его лучший инженер провели дни, отлаживая проблему после запуска в приложении. По словам Шиппера, GPT-5.5 достигла того, чего не смогла GPT-5.4: она проанализировала сломанный код и сгенерировала переписывание, которое инженер в итоге выбрал. Модель может «вспоминать» и делать перекрестные ссылки на целые библиотеки информации, не теряя своего места, снижая «галлюцинации», которые преследовали более ранние версии.

Автономные возможности и самокоррекция

OpenAI утверждает, что GPT-5.5 оптимизирована для «самокоррекции» и автономности. Она лучше справляется с интерпретацией неоднозначных инструкций и использованием компьютерного интерфейса (clicking, typing, browsing) для достижения целей без вмешательства человека. Модель становится особенно полезной, когда агенту нужно работать с программным обеспечением, управлять рабочими процессами, перегруженными терминалом, или рассуждать по всему кодовому базу (500K+ tokens) с высокой точностью извлечения.

Функция мышления GPT-5.5

В ChatGPT OpenAI представила «GPT-5.5 Thinking», которую компания называет тем, что позволяет быстрее помогать при более сложных проблемах. Функция дает более умные, более краткие ответы, чтобы помочь пользователям завершать сложные задачи более эффективно. Она особенно сильна в профессиональной работе вроде синтеза и анализа информации, кодинга и документозатратных задачах вроде исследований — особенно при использовании плагинов.

Ранние тестировщики Pro GPT-5.5 сообщают о колоссальном улучшении как качества, так и сложности работы, которую ChatGPT может брать на себя. Более низкая задержка делает GPT-5.5 Pro более практичной для требовательных задач, чем GPT-5.4 Pro. Ответы GPT-5.5 Pro хорошо структурированы, релевантны, полезны и точны, с особенно сильной производительностью в праве, data science, бизнесе и образовании.

Ценообразование и доступность

Хотя базовая версия доступна, наиболее мощная версия (GPT-5.5 Pro) стоит $100 в месяц для индивидуальных подписчиков. Для бизнеса стоимость за токен выходных данных примерно вдвое выше, чем у GPT-5.4, даже при 40% более высокой эффективности токенов. Общие расходы для крупномасштабных развертываний агентных систем могут быть существенными. Растет обеспокоенность, что максимальный уровень рассуждений станет «привилегией», доступной только хорошо финансируемым компаниям, потенциально расширяя разрыв в производительности между крупными предприятиями и небольшими стартапами.

Посмотреть источник

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

комментарий

0/400

AprDaydream

· 2ч назад

Надеюсь, что официальные органы предоставят возможность проверки действий/воспроизведения, иначе при возникновении проблем будет трудно привлечь к ответственности, особенно в случае автоматического управления активами.

Посмотреть ОригиналОтветить0

PaperHandsPro

· 2ч назад

Реальное понимание намерений — это настоящая сложность, надеюсь, больше не будет неловких ситуаций, когда вы хотите забронировать билет, а он изменяет ваше резюме.

Посмотреть ОригиналОтветить0

Half-SectionedSucculent

· 2ч назад

Есть небольшое ожидание, и немного опасения: возможность щелкнуть мышью равносильно выполнению многих задач, которые требуют «человеческих кликов», поэтому системы управления рисками и антифрод должны быть усовершенствованы.

Посмотреть ОригиналОтветить0

ACalmnessWithAHintOfPomelo

· 2ч назад

Эта волна также повлияет на Web3, если автоматизированные операции в цепочке, процессы подписи и взаимодействие с кошельками смогут выполняться без швов, форма продукта изменится.

Посмотреть ОригиналОтветить0

StarsInTheGlassDome

· 2ч назад

API и цены пока не спешите, сначала посмотрите, сможет ли он выдержать всплывающие окна, многозадачность и сетевые колебания в сложной настольной среде.

Посмотреть ОригиналОтветить0

GateUser-b665e41c

· 2ч назад

Чувствуется, что эволюция идет от «умения говорить и писать» к «умению делать и сдавать», а следующий шаг — обеспечить ей лучшее запоминание и управление задачами.

Посмотреть ОригиналОтветить0

LintCollector

· 2ч назад

Если действительно возможно связать приложения: поиск информации в браузере → обработка в Excel → подготовка презентации в PPT → отправка по электронной почте, тогда это будет полный цикл работы в офисе.

Посмотреть ОригиналОтветить0

DegenWithNotebook

· 2ч назад

Наконец-то появилась нативная десктопная версия? Теперь действительно придется играть роль «цифрового стажера».

Посмотреть ОригиналОтветить0