OpenAI a officiellement publié GPT-5.5 le 23 avril 2026, un nouveau modèle d’IA conçu pour comprendre l’intention de l’utilisateur dans des applications du monde réel grâce à des capacités natives d’utilisation de l’ordinateur. Le modèle présente des capacités natives polyvalentes qui lui permettent de naviguer dans des applications de bureau, de cliquer sur des boutons et de saisir du texte pour des flux de travail multi-étapes, selon l’annonce d’OpenAI.

GPT-5.5 combine l’utilisation native de l’ordinateur avec un raisonnement avancé, en naviguant de manière autonome dans les outils logiciels nécessaires aux tâches professionnelles de haut niveau. La fenêtre de contexte d’environ 1,1 million de tokens permet au modèle de traiter d’énormes ensembles de données financières qui nécessitaient auparavant un découpage manuel. L’équipe financière d’OpenAI a utilisé GPT-5.5 pour examiner 24,771 formulaires fiscaux K-1 (71,637 pages) et a terminé la tâche deux semaines plus vite que l’année précédente.

Indicateurs de performance

GPT-5.5 a obtenu 88,5 % sur des tâches internes de modélisation en banque d’investissement et 60 % sur le benchmark FinancialAgent v1.1, dépassant GPT-5.4 de quatre points. Le modèle a atteint 84,9 % sur GDPval, qui teste les capacités des agents à produire un travail de connaissance spécifique dans 44 professions. Sur OSWorld-Verified, mesurant les opérations autonomes réelles sur ordinateur du modèle, il a atteint 78,7 %. GPT-5.5 a obtenu 98 % sur le Tau2-bench Telecom, qui teste des flux de travail de service client extrêmement difficiles.

Un employé de l’équipe Go-to-Market a confirmé que l’automatisation des rapports commerciaux hebdomadaires permettra de gagner environ 5-10 heures de travail manuel par semaine.

Génération de code et optimisation du système

OpenAI indique que GPT-5.5 a été utilisé pour aider à écrire du code pour sa propre infrastructure de déploiement. Le modèle a atteint la « System-Level Optimization » en analysant les schémas de trafic de production pour écrire des heuristiques de répartition de charge sur mesure, augmentant sa propre vitesse de génération de tokens de 20 %.

Lors d’un test développeur, il a été demandé au modèle de « re-architecturer un éditeur de markdown » et il a renvoyé une pile de 12 diffs presque complète avec une correction humaine minimale. OpenAI note que le nouveau modèle atteint la bonne réponse en moins de tours et utilise 40 % de tokens en moins pour les mêmes tâches Codex par rapport à GPT-5.4.

Dan Shipper, fondateur et PDG d’Every, a décrit GPT-5.5 comme le premier modèle de codage qui a une « clarté conceptuelle sérieuse ». Shipper a testé GPT-5.5 après que lui et son meilleur ingénieur ont passé plusieurs jours à déboguer un problème post-lancement dans une application. D’après Shipper, GPT-5.5 a réussi ce que GPT-5.4 n’a pas pu : il a examiné le code cassé et a produit la réécriture que l’ingénieur a finalement décidée. Le modèle peut « mémoriser » et recouper des bibliothèques entières d’informations sans perdre sa place, réduisant les « hallucinations » qui affectaient les versions précédentes.

Capacités autonomes et auto-correction

OpenAI affirme que GPT-5.5 est optimisé pour la « self-correction » et l’autonomie. Il est mieux à même d’interpréter des instructions ambiguës et d’utiliser une interface ordinateur (clicking, typing, browsing) pour atteindre des objectifs sans intervention humaine. Le modèle devient particulièrement utile lorsqu’un agent est nécessaire pour faire fonctionner un logiciel, gérer des flux de travail lourds en terminal, ou raisonner sur l’ensemble d’une base de code (500K+ tokens) avec une grande précision de récupération.

Fonctionnalité de réflexion de GPT-5.5

Dans ChatGPT, OpenAI a introduit « GPT-5.5 Thinking », que l’entreprise présente comme permettant une aide plus rapide pour des problèmes plus difficiles. La fonctionnalité fournit des réponses plus intelligentes, plus concises, afin d’aider les utilisateurs à accomplir des tâches compliquées plus efficacement. Elle excelle dans le travail professionnel comme la synthèse et l’analyse d’informations, le codage, et les tâches riches en documents comme la recherche, en particulier lors de l’utilisation de plugins.

Les premiers testeurs Pro de GPT-5.5 rapportent une amélioration massive à la fois de la qualité et de la difficulté du travail que ChatGPT peut prendre en charge. Sa latence plus faible le rend plus pratique pour des tâches exigeantes que GPT-5.4 Pro. Les réponses de GPT-5.5 Pro sont bien structurées, pertinentes, utiles et exactes, avec des performances particulièrement solides en droit, en science des données, en affaires et en éducation.

Tarification et accessibilité

Bien qu’une version de base soit disponible, la version la plus capable (GPT-5.5 Pro) coûte 100 $/mois pour les abonnés individuels. Pour les entreprises, le coût par token de sortie est environ le double de celui de GPT-5.4, même avec une efficacité de token 40 % plus élevée. La dépense globale pour des déploiements massifs d’agents peut être substantielle. Il existe une inquiétude croissante selon laquelle le raisonnement du plus haut niveau deviendra un « luxe » accessible uniquement aux entreprises bien financées, ce qui pourrait élargir l’écart de productivité entre les grandes entreprises et les plus petites startups.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Commentaire

0/400

AprDaydream

· Il y a 2h

J'espère que l'officiel fournira un mécanisme de journal d'action/relecture auditable, sinon il sera difficile de tenir pour responsable en cas de problème, surtout pour les comptes d'actifs gérés automatiquement.

Voir l'originalRépondre0

PaperHandsPro

· Il y a 2h

La « compréhension de l'intention » dans les applications réelles est le véritable défi, espérons qu'il n'y aura plus d'embarras où, lorsque vous souhaitez réserver un billet d'avion, il modifie votre CV à la place.

Voir l'originalRépondre0

Half-SectionedSucculent

· Il y a 2h

Un peu d'attente, et un peu de peur : pouvoir cliquer avec la souris équivaut à pouvoir faire beaucoup de choses que seul un « clic humain » peut réaliser, la gestion des risques et la lutte contre la fraude doivent être améliorées.

Voir l'originalRépondre0

ACalmnessWithAHintOfPomelo

· Il y a 2h

Cette vague aura également un impact sur le Web3, si l'automatisation des opérations en chaîne, le processus de signature et l'interaction avec le portefeuille pouvaient être réalisés de manière transparente, la forme du produit changerait.

Voir l'originalRépondre0

StarsInTheGlassDome

· Il y a 2h

API et les prix ne sont pas encore prioritaires, regardons d'abord s'il peut résister aux pop-ups, aux multi-fenêtres et aux fluctuations du réseau dans un environnement de bureau complexe.

Voir l'originalRépondre0

GateUser-b665e41c

· Il y a 2h

On a l'impression que l'évolution va de « savoir parler et écrire » à « savoir faire et livrer », la prochaine étape consiste à lui offrir une meilleure mémoire et une gestion des tâches améliorée.

Voir l'originalRépondre0

LintCollector

· Il y a 2h

Si cela pouvait vraiment s'interconnecter entre différentes applications : rechercher des informations dans le navigateur → traiter dans Excel → créer la présentation dans PowerPoint → envoyer par email, alors ce serait une boucle complète de processus de travail.

Voir l'originalRépondre0

DegenWithNotebook

· Il y a 2h

Enfin, une opération native sur le bureau ? Il va vraiment devoir devenir un « stagiaire numérique ».

Voir l'originalRépondre0