A OpenAI lançou oficialmente o GPT-5.5 em 23 de abril de 2026, um novo modelo de IA projetado para entender a intenção do usuário em aplicações do mundo real por meio de capacidades nativas de uso do computador. O modelo traz capacidades nativas de propósito geral que permitem que ele navegue por aplicativos de desktop, clique em botões e digite texto para fluxos de trabalho de múltiplas etapas, de acordo com o anúncio da OpenAI.

GPT-5.5 combina uso nativo de computador com raciocínio avançado, navegando de forma autônoma pelas ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto de ~1,1 milhão de tokens do modelo permite que ele processe enormes conjuntos de dados financeiros que antes exigiam chunking manual. A equipe financeira da OpenAI usou o GPT-5.5 para revisar 24.771 formulários fiscais K-1 (71.637 páginas) e concluiu a tarefa duas semanas mais rápido do que no ano anterior.

Métricas de Desempenho

O GPT-5.5 obteve 88,5% em tarefas internas de modelagem de banco de investimento e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos. O modelo alcançou 84,9% no GDPval, que testa as habilidades de agentes para produzir trabalho do conhecimento específico em 44 ocupações. No OSWorld-Verified, medindo as operações autônomas reais do modelo em computador, ele chegou a 78,7%. O GPT-5.5 pontuou 98% no Tau2-bench Telecom, que testa fluxos de trabalho de atendimento ao cliente extremamente difíceis.

Um funcionário da equipe Go-to-Market confirmou que automatizar relatórios comerciais semanais economizará aproximadamente 5-10 horas de trabalho manual por semana.

Geração de Código e Otimização de Sistema

A OpenAI relata que o GPT-5.5 foi usado para ajudar a escrever código para sua própria infraestrutura de atendimento. O modelo alcançou a “Otimização de Nível de Sistema” ao analisar padrões de tráfego de produção para escrever heurísticas personalizadas de balanceamento de carga, aumentando em 20% sua própria velocidade de geração de tokens.

Em um teste para desenvolvedores, o modelo foi solicitado a “re-arquitetar um editor de markdown” e retornou uma pilha de 12 diffs quase completa com correção humana mínima. A OpenAI observa que o novo modelo chega à resposta correta em menos turnos e usa 40% menos tokens para as mesmas tarefas do Codex em comparação com o GPT-5.4.

Dan Shipper, fundador e CEO da Every, descreveu o GPT-5.5 como o primeiro modelo de codificação que tem “clareza conceitual séria”. Shipper testou o GPT-5.5 depois que ele e seu melhor engenheiro passaram dias depurando um problema pós-lançamento em um aplicativo. Segundo Shipper, o GPT-5.5 conseguiu o que o GPT-5.4 não conseguiu: ele examinou o código quebrado e produziu a reescrita que o engenheiro acabou decidindo. O modelo pode “lembrar” e cruzar referências a bibliotecas inteiras de informações sem perder seu lugar, reduzindo as “alucinações” que assombraram versões anteriores.

Capacidades Autônomas e Autocorreção

A OpenAI afirma que o GPT-5.5 é otimizado para “autocorreção” e autonomia. Ele é melhor em interpretar instruções ambíguas e usar uma interface de computador (clicando, digitando, navegando) para concluir objetivos sem intervenção humana. O modelo se torna especificamente útil quando um agente é necessário para operar software, gerenciar fluxos de trabalho pesados em terminal ou raciocinar por meio de uma base de código inteira (500K+ tokens) com alta precisão de recuperação.

Recurso de Pensamento do GPT-5.5

No ChatGPT, a OpenAI introduziu o “GPT-5.5 Thinking”, que a empresa diz liberar ajuda mais rápida para problemas mais difíceis. O recurso fornece respostas mais inteligentes e concisas para ajudar os usuários a concluir tarefas complicadas com mais eficiência. Ele se destaca em trabalho profissional como síntese e análise de informações, codificação e tarefas com grande volume de documentos como pesquisa, especialmente ao usar plugins.

Testadores Pro iniciais do GPT-5.5 relatam uma melhoria enorme tanto na qualidade quanto na dificuldade do trabalho que o ChatGPT consegue assumir. Sua latência menor o torna mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro são bem estruturadas, relevantes, úteis e precisas, com desempenho particularmente forte em direito, ciência de dados, negócios e educação.

Preços e Acessibilidade

Embora uma versão básica esteja disponível, a versão mais capaz (GPT-5.5 Pro) custa US$ 100/mês para assinantes individuais. Para empresas, o custo por token de saída é aproximadamente o dobro do da GPT-5.4, mesmo com 40% a mais de eficiência de tokens. O gasto total para implantações agentic em larga escala pode ser substancial. Há preocupação crescente de que o raciocínio de mais alto nível se torne um “luxo” acessível apenas a empresas bem financiadas, potencialmente ampliando a lacuna de produtividade entre grandes empresas e startups menores.

Ver fonte

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Comentário

0/400

AprDaydream

· 2h atrás

Espero que as autoridades forneçam um mecanismo de registro de ações/audição auditável, caso contrário, será difícil responsabilizar alguém em caso de problemas, especialmente em contas de ativos operadas automaticamente.

Ver originalResponder0

PaperHandsPro

· 2h atrás

A "compreensão de intenção" na aplicação prática é realmente o ponto difícil, espero que não volte a acontecer aquela situação constrangedora de você querer reservar um voo e ela alterar seu currículo.

Ver originalResponder0

Half-SectionedSucculent

· 2h atrás

Estou um pouco ansioso, e um pouco assustado: poder clicar com o mouse equivale a fazer muitas das coisas que só podem ser feitas com "cliques humanos", então o controle de risco e a luta contra fraudes precisam ser aprimorados.

Ver originalResponder0

ACalmnessWithAHintOfPomelo

· 2h atrás

Essa onda também impacta o Web3, né? Se operações automatizadas na cadeia, processos de assinatura e interações com carteiras puderem ser feitos de forma fluida, a forma do produto vai mudar.

Ver originalResponder0

StarsInTheGlassDome

· 2h atrás

API e preços, primeiro não se apresse, primeiro veja se ele consegue resistir a janelas pop-up, múltiplas janelas e oscilações de rede em ambientes desktop complexos.

Ver originalResponder0

GateUser-b665e41c

· 2h atrás

Sentir a evolução de "saber falar e escrever" para "saber fazer e entregar", o próximo passo é fornecer a ela uma memória melhor e gerenciamento de tarefas.

Ver originalResponder0

LintCollector

· 2h atrás

Se realmente for possível conectar entre aplicativos: pesquisar no navegador → processar no Excel → criar apresentação no PPT → enviar por e-mail, então será um ciclo completo de fluxo de trabalho de escritório.

Ver originalResponder0

DegenWithNotebook

· 2h atrás

Finalmente chegou à operação nativa na área de trabalho? Agora realmente vai ser um "estagiário digital".

Ver originalResponder0