Introduction
Le 5 février 2026, OpenAI a annoncé GPT-5.3-Codex, son modèle de codage agentique le plus avancé à ce jour. Cette publication marque une étape importante dans l'intelligence artificielle, non seulement pour ses impressionnantes capacités techniques, mais aussi parce que c'est le premier modèle qui a contribué à sa propre création.
GPT-5.3-Codex représente un changement fondamental, passant d'un outil d'écriture de code à un collaborateur d'IA interactif capable de gérer un travail technique de longue haleine et réel dans tout le spectre des tâches informatiques professionnelles.
Qu'est-ce qui différencie GPT-5.3-Codex ?
Un véritable modèle agentique
Contrairement aux assistants de codage traditionnels qui génèrent simplement des fragments de code, GPT-5.3-Codex est conçu comme un modèle « agentique ». Cela signifie qu'il peut :
- Maintenir le contexte sur des tâches de longue durée qui s'étendent sur des heures, voire des jours
- Utiliser les outils de manière autonome, y compris les interfaces de ligne de commande, les systèmes de fichiers et les environnements de développement
- S'adapter et itérer en fonction des retours d'information en temps réel sans perdre sa position
- Gérer des flux de travail complexes en plusieurs étapes qui nécessitent de la recherche, de la planification et de l'exécution
Réalisation d'auto-construction
L'aspect le plus remarquable de GPT-5.3-Codex est peut-être que l'équipe Codex a utilisé les premières versions du modèle pour :
- Déboguer son propre processus de formation
- Gérer son propre déploiement
- Diagnostiquer les résultats des tests et les évaluations
- Optimiser l'infrastructure pour la version finale
Ce cycle de développement auto-référentiel montre comment l'IA commence à accélérer sa propre amélioration, une étape que les chercheurs d'OpenAI ont décrite comme les laissant « époustouflés par la mesure dans laquelle Codex a pu accélérer son propre développement ».
Améliorations des performances
GPT-5.3-Codex est 25 % plus rapide que son prédécesseur (GPT-5.2-Codex), grâce aux améliorations apportées à l'infrastructure et à la pile d'inférence d'OpenAI. Cette amélioration de la vitesse permet une collaboration en temps réel plus réactive et des cycles d'itération plus rapides.
Performances de référence : les données
GPT-5.3-Codex atteint des performances de pointe dans plusieurs benchmarks clés qui mesurent le codage, les capacités agentiques et l'utilisation de l'ordinateur dans le monde réel.
SWE-Bench Pro
SWE-Bench Pro est une évaluation rigoureuse de l'ingénierie logicielle du monde réel qui couvre quatre langages de programmation (Python, JavaScript, TypeScript et Go). Contrairement à son prédécesseur (SWE-Bench Verified) qui ne testait que Python, SWE-Bench Pro est conçu pour être plus résistant à la contamination et plus pertinent pour l'industrie.
Terminal-Bench 2.0
L'amélioration de 13,3 % sur Terminal-Bench 2.0 est particulièrement significative. Ce benchmark mesure les compétences en terminal dont un agent de codage a besoin : naviguer dans les systèmes de fichiers, exécuter des commandes et gérer les flux de travail de développement. Notamment, GPT-5.3-Codex y parvient avec moins de tokens que n'importe quel modèle précédent, ce qui le rend plus efficace.
OSWorld-Verified
Le saut de 26,5 % sur OSWorld-Verified démontre des capacités d'utilisation de l'ordinateur considérablement améliorées. OSWorld est un benchmark d'utilisation de l'ordinateur agentique où les agents doivent effectuer des tâches de productivité dans un environnement de bureau visuel. Cette amélioration massive montre que GPT-5.3-Codex est bien meilleur que les modèles précédents pour naviguer dans les interfaces du monde réel.
Au-delà du code : un agent à usage général
Bien que GPT-5.3-Codex excelle dans la programmation, ses capacités s'étendent bien au-delà de la génération de code. OpenAI le positionne comme un agent capable de gérer « presque tout ce que les développeurs et les professionnels peuvent faire sur un ordinateur ».
Prise en charge du cycle de vie des logiciels
Le modèle est conçu pour prendre en charge l'ensemble du cycle de vie du développement logiciel :
- Débogage - Identification et correction des bugs
- Déploiement - Gestion des versions et de l'infrastructure
- Surveillance - Suivi des performances et des métriques
- Rédaction de PRD - Documents d'exigences du produit
- Rédaction de textes - Documentation et textes marketing
- Étude des utilisateurs - Analyse des commentaires des utilisateurs
- Tests - Écriture et exécution de suites de tests
- Analyse des métriques - Prise de décision basée sur les données
Capacités de travail intellectuel
Sur GDPval (l'évaluation 2025 d'OpenAI mesurant les performances sur les tâches de travail intellectuel dans 44 professions), GPT-5.3-Codex correspond aux performances de GPT-5.2. Cela inclut des tâches telles que :
- Création de diaporamas et de présentations
- Analyse de données dans des feuilles de calcul
- Gestion et organisation des documents
Exemple de développement web
Pour démontrer les capacités du modèle, OpenAI a demandé à GPT-5.3-Codex de créer deux jeux complets à partir de zéro :
- Un jeu de course (version 2 du jeu de lancement de l'application Codex)
En utilisant uniquement une compétence « développer un jeu web » et des invites de suivi génériques comme « corriger le bug » ou « améliorer le jeu », GPT-5.3-Codex a itéré de manière autonome sur des millions de tokens, construisant des jeux très fonctionnels et soignés.
Meilleure compréhension de l'intention
Comparé à GPT-5.2-Codex, le nouveau modèle comprend mieux l'intention de l'utilisateur lors de la création de sites web. Les invites simples ou insuffisamment spécifiées se traduisent désormais par des sites avec :
- Des valeurs par défaut sensées
- Des fonctionnalités prêtes pour la production
Par exemple, lorsqu'on lui a demandé de créer une page de destination de tarification, GPT-5.3-Codex a automatiquement affiché le plan annuel sous forme de prix mensuel réduit (rendant la réduction claire) et a créé un carrousel de témoignages à transition automatique avec trois citations d'utilisateurs distinctes, ce qui a donné un design plus complet et soigné.
Collaboration interactive
L'une des améliorations les plus significatives de l'expérience utilisateur est la possibilité de guider le modèle pendant qu'il travaille.
Interaction en temps réel
Au lieu d'attendre une sortie finale, les utilisateurs peuvent désormais :
- Poser des questions pendant l'exécution
- Discuter de différentes approches
- Orienter vers des solutions spécifiques
- Fournir des commentaires en milieu de tâche
GPT-5.3-Codex explique ce qu'il fait, répond aux commentaires et tient les utilisateurs informés du début à la fin. Cela peut être activé dans l'application Codex via Paramètres > Général > Comportement de suivi.
Cela transforme l'expérience, qui passe de la commande à une machine à la collaboration avec un coéquipier, un changement fondamental dans la façon dont les humains interagissent avec les systèmes d'IA.
Capacités et sécurité en matière de cybersécurité
GPT-5.3-Codex est le premier modèle qu'OpenAI classe comme « Haute capacité » pour les tâches liées à la cybersécurité dans le cadre de son Preparedness Framework. C'est également le premier modèle directement formé à identifier les vulnérabilités logicielles.
Nature à double usage
Parce que la cybersécurité est intrinsèquement à double usage (utile à la fois pour la défense et l'attaque), OpenAI adopte une approche de précaution :
- Aucune preuve définitive qu'il puisse automatiser les cyberattaques de bout en bout
- Déploiement d'une pile de sécurité de cybersécurité complète
- Mise en œuvre d'une formation à la sécurité et d'une surveillance automatisée
- Exigence d'un accès de confiance pour les capacités avancées
Accès de confiance pour la cyber
OpenAI lance Trusted Access for Cyber, un programme pilote pour :
- Accélérer la recherche en cyberdéfense
- Fournir d'abord des outils aux défenseurs
- Soutenir la résilience de l'écosystème
Engagement de 10 millions de dollars
S'appuyant sur un programme de subventions de cybersécurité de 1 million de dollars de 2023, OpenAI s'engage à verser 10 millions de dollars en crédits API pour accélérer la cyberdéfense, en particulier pour :
- Systèmes d'infrastructures critiques
- Recherche en sécurité de bonne foi
Agent de sécurité Aardvark
OpenAI étend la bêta privée d'Aardvark, son agent de recherche en sécurité, en tant que première offre de sa suite de produits et d'outils de sécurité Codex. Ils s'associent également à des mainteneurs open source pour fournir une analyse gratuite du code base pour des projets largement utilisés comme Next.js.
Comment OpenAI a utilisé Codex pour construire Codex
Le développement de GPT-5.3-Codex fournit une étude de cas fascinante sur la recherche accélérée par l'IA.
Cas d'utilisation de l'équipe de recherche
L'équipe de recherche a utilisé les premières versions de GPT-5.3-Codex pour :
- Surveiller et déboguer l'exécution de la formation pour la publication
- Suivre les schémas tout au long de la formation
- Fournir une analyse approfondie sur la qualité de l'interaction
- Proposer des corrections et créer des applications riches pour les chercheurs humains
- Comprendre précisément en quoi le comportement du modèle différait des modèles précédents
Cas d'utilisation de l'équipe d'ingénierie
L'équipe d'ingénierie a utilisé Codex pour :
- Optimiser et adapter le harnais pour GPT-5.3-Codex
- Identifier les bugs de rendu de contexte ayant un impact sur les utilisateurs
- Identifier la cause profonde des faibles taux de réussite du cache
- Mettre à l'échelle dynamiquement les clusters GPU pour s'adapter aux pics de trafic
- Maintenir une latence stable pendant le lancement
Cas d'utilisation de la science des données
Pendant les tests alpha, un data scientist a travaillé avec GPT-5.3-Codex pour :
- Créer des classificateurs regex pour estimer la fréquence des clarifications, des réponses des utilisateurs et de la progression des tâches
- Exécuter ces classificateurs de manière évolutive sur tous les journaux de session
- Créer de nouveaux pipelines de données et visualiser les résultats plus richement que les outils de tableau de bord standard
- Co-analyser les résultats, Codex résumant les principaux enseignements sur des milliers de points de données en moins de trois minutes
Gains de productivité
Le résultat ? Les personnes qui construisent avec Codex étaient plus heureuses car l'agent :
- Comprenait mieux leur intention
- Faisait plus de progrès par tour
- Posait moins de questions de clarification
Disponibilité et tarification
Comment y accéder
GPT-5.3-Codex est disponible immédiatement pour les utilisateurs de ChatGPT payants sur toutes les surfaces Codex :
- Application de bureau (macOS et Windows)
- Interface de ligne de commande (CLI)
- Extensions IDE (VS Code, JetBrains, etc.)
Plans d'abonnement
Pour une durée limitée, les plans payants recevront le double des limites de débit normales.
Tarification de l'API
Au moment du lancement, OpenAI n'a pas publié de tarification API officielle pour GPT-5.3-Codex. L'accès à l'API est décrit comme « en cours de déploiement prochainement » et « dans les semaines suivantes ».
À titre de référence, la tarification API actuelle pour le modèle précédent (GPT-5.2-Codex) est :
Infrastructure
GPT-5.3-Codex a été co-conçu, entraîné et servi sur les systèmes NVIDIA GB200 NVL72, un témoignage de l'étroite collaboration entre OpenAI et NVIDIA pour repousser les limites des capacités de l'IA.
Comparaison avec les concurrents
La sortie de GPT-5.3-Codex est intervenue quelques minutes seulement après l'annonce par Anthropic de Claude Opus 4.6, établissant une comparaison immédiate entre les deux modèles.
Points forts de GPT-5.3-Codex
- Terminal-Bench 2.0 : 77,3 contre 65,4 pour Opus 4.6 (avantage de +18,6 %)
- Performances 25 % plus rapides
- Philosophie de conception « Haute fiabilité, faible variance »
- Capacité d'auto-construction (a contribué à sa propre création)
- Première classification de cybersécurité « Haute capacité »
Points forts de Claude Opus 4.6
- Fenêtre de contexte de 1 million de tokens (nettement plus grande)
- Fonctionnalité collaborative Agent Teams
- Polyvalence plus large dans les scénarios de travail intellectuel
- Température de créativité plus élevée (plus de personnalité)
Différences de philosophie de conception
La vue d'ensemble
GPT-5.3-Codex représente plus qu'une simple mise à niveau incrémentale : c'est un changement radical vers des agents à usage général capables de raisonner, de construire et d'exécuter dans tout le spectre du travail technique réel.
D'agent de code à agent informatique
OpenAI encadre explicitement cette évolution : « Codex passe de l'écriture de code à son utilisation comme outil pour faire fonctionner un ordinateur et effectuer un travail de bout en bout. »
Il s'agit d'un changement profond. Ce qui a commencé comme un objectif d'être « le meilleur agent de codage » est devenu la base d'un collaborateur plus général sur l'ordinateur, élargissant à la fois qui peut construire et ce qui est possible avec l'IA.
Accélérer le développement de l'IA
Le fait que GPT-5.3-Codex ait contribué à sa propre construction est un aperçu de ce qui est à venir. Comme le notent les chercheurs d'OpenAI, « de nombreux chercheurs et ingénieurs d'OpenAI décrivent leur travail aujourd'hui comme étant fondamentalement différent de ce qu'il était il y a à peine deux mois ».
Cela suggère que nous entrons dans une période de rendements accélérés dans le développement de l'IA, où chaque génération de modèles contribue à la construction de la suivante, ce qui pourrait comprimer les délais de plusieurs années à quelques mois.
Implications pour les développeurs
Pour les développeurs de logiciels, les implications sont importantes :
- Cycles de développement plus rapides - L'IA gère une plus grande partie du travail de routine
- Abstraction de niveau supérieur - Les développeurs peuvent se concentrer sur l'architecture et la conception
- Collaboration interactive - Moins comme utiliser un outil, plus comme travailler avec un coéquipier
- Nouvelles capacités - Les tâches qui nécessitaient auparavant des connaissances spécialisées sont désormais accessibles
Implications pour les entreprises
Pour les entreprises, GPT-5.3-Codex représente :
- Productivité accrue - Plus de travail est effectué en moins de temps
- Barrières plus faibles - Moins de compétences spécialisées nécessaires pour certaines tâches
- Nouvelles considérations de sécurité - La classification de cybersécurité « Haute capacité » nécessite une gouvernance prudente
- Avantage concurrentiel - Adoption précoce de l'IA agentique puissante
Conclusion
GPT-5.3-Codex est une réalisation marquante dans le domaine de l'intelligence artificielle. Il combine :
- Des performances de codage de pointe
- Des capacités agentiques avancées
- Collaboration interactive
- Auto-amélioration (il a contribué à sa propre construction)
- Utilisation de l'ordinateur dans le monde réel
Le fait qu'il ait joué un rôle déterminant dans sa propre création est à la fois une prouesse technique et une métaphore de la direction que prend l'IA. À mesure que les modèles deviennent plus performants, ils ne sont pas seulement des outils que nous utilisons, ils deviennent des partenaires dans le processus de création et de développement lui-même.
La sortie simultanée avec Claude Opus 4.6, à quelques minutes d'intervalle, souligne l'intensité de la concurrence dans le domaine de l'IA. Mais surtout, cela signale que nous sommes entrés dans une nouvelle phase de capacité de l'IA, une phase où les agents peuvent gérer de manière fiable des tâches complexes et de longue haleine dans tout le spectre du travail informatique professionnel.
Comme le dit OpenAI : « Ce qui a commencé comme un objectif d'être le meilleur agent de codage est devenu la base d'un collaborateur plus général sur l'ordinateur. »
La question n'est plus seulement de savoir ce que ces modèles peuvent faire, mais ce que nous choisirons de construire avec eux.
Sources
Avertissement : Cet article est basé sur les informations disponibles au 6 février 2026. Les spécifications, les prix et la disponibilité sont susceptibles de changer. Veuillez consulter la documentation officielle d'OpenAI pour obtenir les informations les plus récentes.