A OpenAI Lança o Modelo de IA GPT-5.5 Com Uso Nativo de Computadores

CryptoFrontier

A OpenAI lançou oficialmente o GPT-5.5 a 23 de abril de 2026, um novo modelo de IA concebido para compreender a intenção do utilizador em aplicações do mundo real através de capacidades nativas de utilização de computador. O modelo apresenta capacidades nativas de uso geral que lhe permitem navegar em aplicações de desktop, clicar em botões e escrever texto para fluxos de trabalho multi-etapa, de acordo com o anúncio da OpenAI.

O GPT-5.5 combina o uso de computador nativo com raciocínio avançado, navegando autonomamente pelas ferramentas de software necessárias para tarefas profissionais de alto nível. A janela de contexto do modelo de ~1,1 milhões de tokens permite-lhe processar enormes conjuntos de dados financeiros que anteriormente exigiam divisão manual em partes. A equipa financeira da OpenAI usou o GPT-5.5 para analisar 24.771 formulários fiscais K-1 (71.637 páginas) e concluiu a tarefa duas semanas mais rápido do que no ano anterior.

Indicadores de Desempenho

O GPT-5.5 obteve 88,5% em tarefas internas de modelação em banca de investimento e 60% no benchmark FinancialAgent v1.1, superando o GPT-5.4 em quatro pontos. O modelo atingiu 84,9% no GDPval, que testa a capacidade dos agentes para produzir trabalho de conhecimento específico em 44 profissões. No OSWorld-Verified, que mede as operações autónomas reais do modelo no computador, este atingiu 78,7%. O GPT-5.5 marcou 98% no Tau2-bench Telecom, que testa fluxos de trabalho de apoio ao cliente extremamente difíceis.

Um funcionário da equipa Go-to-Market confirmou que automatizar relatórios semanais de negócio poupará aproximadamente 5-10 horas de trabalho manual por semana.

Geração de Código e Optimização do Sistema

A OpenAI reporta que o GPT-5.5 foi usado para ajudar a escrever código para a sua própria infraestrutura de servir. O modelo atingiu a “Optimização a Nível de Sistema” ao analisar padrões de tráfego de produção para escrever heurísticas de balanceamento de carga personalizadas, aumentando a sua própria velocidade de geração de tokens em 20%.

Num teste com programadores, foi pedido ao modelo para “re-arquitectar um editor de markdown” e este devolveu uma stack quase completa de 12 diffs com correcção humana mínima. A OpenAI salienta que o novo modelo chega à resposta correcta em menos iterações e usa 40% menos tokens para as mesmas tarefas do Codex em comparação com o GPT-5.4.

Dan Shipper, fundador e CEO da Every, descreveu o GPT-5.5 como o primeiro modelo de codificação que tem “clareza conceptual séria”. Shipper testou o GPT-5.5 depois de ele e o seu melhor engenheiro passarem dias a debugar um problema pós-lançamento numa aplicação. Segundo Shipper, o GPT-5.5 alcançou aquilo que o GPT-5.4 não conseguiu: analisou o código avariado e produziu a reescrita que o engenheiro acabou por decidir. O modelo pode “memorizar” e referenciar cruzadamente bibliotecas inteiras de informação sem perder o seu lugar, reduzindo as “alucinações” que afectavam versões anteriores.

Capacidades Autónomas e Auto-Correção

A OpenAI afirma que o GPT-5.5 está optimizado para “auto-correção” e autonomia. É melhor a interpretar instruções ambíguas e a usar uma interface de computador (clicking, typing, browsing) para completar objectivos sem intervenção humana. O modelo torna-se particularmente útil quando é necessário que um agente opere software, gerencie fluxos de trabalho com forte dependência de terminal, ou raciocine através de uma base de código inteira (500K+ tokens) com elevada precisão de recuperação.

Funcionalidade de Pensamento do GPT-5.5

No ChatGPT, a OpenAI introduziu o “GPT-5.5 Thinking”, que a empresa diz libertar ajuda mais rápida para problemas mais difíceis. A funcionalidade fornece respostas mais inteligentes e mais concisas para ajudar os utilizadores a completar tarefas complicadas de forma mais eficiente. Destaca-se em trabalho profissional como síntese e análise de informação, programação e tarefas com forte carga documental como pesquisa, especialmente quando se usam plugins.

Os primeiros testers Pro do GPT-5.5 reportam uma melhoria massiva tanto na qualidade como na dificuldade do trabalho que o ChatGPT consegue assumir. A sua latência mais baixa torna-o mais prático para tarefas exigentes do que o GPT-5.4 Pro. As respostas do GPT-5.5 Pro são bem estruturadas, relevantes, úteis e precisas, com desempenho particularmente forte em direito, ciência de dados, negócios e educação.

Preços e Acessibilidade

Embora exista uma versão básica, a versão mais capaz (GPT-5.5 Pro) custa $100/mês para subscritores individuais. Para empresas, o custo por token de saída é aproximadamente o dobro do GPT-5.4, mesmo com 40% de eficiência de tokens superior. O gasto global em implementações agentic à escala pode ser substancial. Há uma preocupação crescente de que o raciocínio do topo de gama se torne um “luxo” acessível apenas a empresas bem financiadas, potencialmente alargando o fosso de produtividade entre grandes empresas e pequenos startups.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
AprDaydreamvip
· 2h atrás
Espero que o oficial forneça um mecanismo de registo de ações/audição que seja auditável, caso contrário, será difícil responsabilizar, especialmente em contas de ativos operadas automaticamente.
Ver originalResponder0
PaperHandsProvip
· 2h atrás
A "compreensão de intenção" na aplicação prática é realmente o ponto difícil, espero que não volte a acontecer aquela situação embaraçosa de você querer reservar um bilhete de avião e ele alterar o seu currículo.
Ver originalResponder0
Half-SectionedSucculentvip
· 2h atrás
Estou um pouco ansioso, mas também um pouco assustado: poder clicar com o mouse equivale a poder fazer muitas coisas que só os "cliques humanos" podem fazer, e o controle de risco e a luta contra fraudes precisam ser aprimorados.
Ver originalResponder0
ACalmnessWithAHintOfPomelovip
· 2h atrás
Esta onda também terá impacto no Web3, se as operações automáticas na cadeia, os processos de assinatura e a interação com carteiras puderem ser feitos de forma integrada, a forma do produto mudará.
Ver originalResponder0
StarsInTheGlassDomevip
· 2h atrás
API e preços, primeiro não se apresse, primeiro veja se ele consegue resistir a janelas pop-up, múltiplas janelas e oscilações de rede em ambientes de desktop complexos.
Ver originalResponder0
GateUser-b665e41cvip
· 2h atrás
Sinto que a evolução de "saber falar e escrever" para "saber fazer e entregar" passa a próxima etapa de fornecer a ela uma melhor memória e gestão de tarefas.
Ver originalResponder0
LintCollectorvip
· 2h atrás
Se realmente for possível conectar entre aplicações: pesquisar no navegador → processar no Excel → criar apresentação no PowerPoint → enviar por email, então será um ciclo completo de fluxo de trabalho de escritório.
Ver originalResponder0
DegenWithNotebookvip
· 2h atrás
Finalmente chegou à operação nativa na área de trabalho? Agora realmente vai ser um "estagiário digital".
Ver originalResponder0