Introduction

Le 5 février 2026, OpenAI a annoncé GPT-5.3-Codex, son modèle de codage agentique le plus avancé à ce jour. Cette publication marque une étape importante dans l'intelligence artificielle, non seulement pour ses impressionnantes capacités techniques, mais aussi parce que c'est le premier modèle qui a contribué à sa propre création.

GPT-5.3-Codex représente un changement fondamental, passant d'un outil d'écriture de code à un collaborateur d'IA interactif capable de gérer un travail technique de longue haleine et réel dans tout le spectre des tâches informatiques professionnelles.

Qu'est-ce qui différencie GPT-5.3-Codex ?

Un véritable modèle agentique

Contrairement aux assistants de codage traditionnels qui génèrent simplement des fragments de code, GPT-5.3-Codex est conçu comme un modèle « agentique ». Cela signifie qu'il peut :

Maintenir le contexte sur des tâches de longue durée qui s'étendent sur des heures, voire des jours

Utiliser les outils de manière autonome, y compris les interfaces de ligne de commande, les systèmes de fichiers et les environnements de développement

S'adapter et itérer en fonction des retours d'information en temps réel sans perdre sa position

Gérer des flux de travail complexes en plusieurs étapes qui nécessitent de la recherche, de la planification et de l'exécution

Réalisation d'auto-construction

L'aspect le plus remarquable de GPT-5.3-Codex est peut-être que l'équipe Codex a utilisé les premières versions du modèle pour :

Déboguer son propre processus de formation

Gérer son propre déploiement

Diagnostiquer les résultats des tests et les évaluations

Optimiser l'infrastructure pour la version finale

Ce cycle de développement auto-référentiel montre comment l'IA commence à accélérer sa propre amélioration, une étape que les chercheurs d'OpenAI ont décrite comme les laissant « époustouflés par la mesure dans laquelle Codex a pu accélérer son propre développement ».

Améliorations des performances

GPT-5.3-Codex est 25 % plus rapide que son prédécesseur (GPT-5.2-Codex), grâce aux améliorations apportées à l'infrastructure et à la pile d'inférence d'OpenAI. Cette amélioration de la vitesse permet une collaboration en temps réel plus réactive et des cycles d'itération plus rapides.

Performances de référence : les données

GPT-5.3-Codex atteint des performances de pointe dans plusieurs benchmarks clés qui mesurent le codage, les capacités agentiques et l'utilisation de l'ordinateur dans le monde réel.

SWE-Bench Pro

SWE-Bench Pro est une évaluation rigoureuse de l'ingénierie logicielle du monde réel qui couvre quatre langages de programmation (Python, JavaScript, TypeScript et Go). Contrairement à son prédécesseur (SWE-Bench Verified) qui ne testait que Python, SWE-Bench Pro est conçu pour être plus résistant à la contamination et plus pertinent pour l'industrie.

Terminal-Bench 2.0

L'amélioration de 13,3 % sur Terminal-Bench 2.0 est particulièrement significative. Ce benchmark mesure les compétences en terminal dont un agent de codage a besoin : naviguer dans les systèmes de fichiers, exécuter des commandes et gérer les flux de travail de développement. Notamment, GPT-5.3-Codex y parvient avec moins de tokens que n'importe quel modèle précédent, ce qui le rend plus efficace.

OSWorld-Verified

Le saut de 26,5 % sur OSWorld-Verified démontre des capacités d'utilisation de l'ordinateur considérablement améliorées. OSWorld est un benchmark d'utilisation de l'ordinateur agentique où les agents doivent effectuer des tâches de productivité dans un environnement de bureau visuel. Cette amélioration massive montre que GPT-5.3-Codex est bien meilleur que les modèles précédents pour naviguer dans les interfaces du monde réel.

Au-delà du code : un agent à usage général

Bien que GPT-5.3-Codex excelle dans la programmation, ses capacités s'étendent bien au-delà de la génération de code. OpenAI le positionne comme un agent capable de gérer « presque tout ce que les développeurs et les professionnels peuvent faire sur un ordinateur ».

Prise en charge du cycle de vie des logiciels

Le modèle est conçu pour prendre en charge l'ensemble du cycle de vie du développement logiciel :

Débogage - Identification et correction des bugs

Déploiement - Gestion des versions et de l'infrastructure

Surveillance - Suivi des performances et des métriques

Rédaction de PRD - Documents d'exigences du produit

Rédaction de textes - Documentation et textes marketing

Étude des utilisateurs - Analyse des commentaires des utilisateurs

Tests - Écriture et exécution de suites de tests

Analyse des métriques - Prise de décision basée sur les données

Capacités de travail intellectuel

Sur GDPval (l'évaluation 2025 d'OpenAI mesurant les performances sur les tâches de travail intellectuel dans 44 professions), GPT-5.3-Codex correspond aux performances de GPT-5.2. Cela inclut des tâches telles que :

Création de diaporamas et de présentations

Analyse de données dans des feuilles de calcul

Gestion et organisation des documents

Recherche et synthèse

Exemple de développement web

Pour démontrer les capacités du modèle, OpenAI a demandé à GPT-5.3-Codex de créer deux jeux complets à partir de zéro :

Un jeu de course (version 2 du jeu de lancement de l'application Codex)

Un jeu de plongée

En utilisant uniquement une compétence « développer un jeu web » et des invites de suivi génériques comme « corriger le bug » ou « améliorer le jeu », GPT-5.3-Codex a itéré de manière autonome sur des millions de tokens, construisant des jeux très fonctionnels et soignés.

Meilleure compréhension de l'intention

Comparé à GPT-5.2-Codex, le nouveau modèle comprend mieux l'intention de l'utilisateur lors de la création de sites web. Les invites simples ou insuffisamment spécifiées se traduisent désormais par des sites avec :

Plus de fonctionnalités

Des valeurs par défaut sensées

Des fonctionnalités prêtes pour la production

Par exemple, lorsqu'on lui a demandé de créer une page de destination de tarification, GPT-5.3-Codex a automatiquement affiché le plan annuel sous forme de prix mensuel réduit (rendant la réduction claire) et a créé un carrousel de témoignages à transition automatique avec trois citations d'utilisateurs distinctes, ce qui a donné un design plus complet et soigné.

Collaboration interactive

L'une des améliorations les plus significatives de l'expérience utilisateur est la possibilité de guider le modèle pendant qu'il travaille.

Interaction en temps réel

Au lieu d'attendre une sortie finale, les utilisateurs peuvent désormais :

Poser des questions pendant l'exécution

Discuter de différentes approches

Orienter vers des solutions spécifiques

Fournir des commentaires en milieu de tâche

GPT-5.3-Codex explique ce qu'il fait, répond aux commentaires et tient les utilisateurs informés du début à la fin. Cela peut être activé dans l'application Codex via Paramètres > Général > Comportement de suivi.

Cela transforme l'expérience, qui passe de la commande à une machine à la collaboration avec un coéquipier, un changement fondamental dans la façon dont les humains interagissent avec les systèmes d'IA.

Capacités et sécurité en matière de cybersécurité

GPT-5.3-Codex est le premier modèle qu'OpenAI classe comme « Haute capacité » pour les tâches liées à la cybersécurité dans le cadre de son Preparedness Framework. C'est également le premier modèle directement formé à identifier les vulnérabilités logicielles.

Nature à double usage

Parce que la cybersécurité est intrinsèquement à double usage (utile à la fois pour la défense et l'attaque), OpenAI adopte une approche de précaution :

Aucune preuve définitive qu'il puisse automatiser les cyberattaques de bout en bout

Déploiement d'une pile de sécurité de cybersécurité complète

Mise en œuvre d'une formation à la sécurité et d'une surveillance automatisée

Exigence d'un accès de confiance pour les capacités avancées

Accès de confiance pour la cyber

OpenAI lance Trusted Access for Cyber, un programme pilote pour :

Accélérer la recherche en cyberdéfense

Fournir d'abord des outils aux défenseurs

Soutenir la résilience de l'écosystème

Engagement de 10 millions de dollars

S'appuyant sur un programme de subventions de cybersécurité de 1 million de dollars de 2023, OpenAI s'engage à verser 10 millions de dollars en crédits API pour accélérer la cyberdéfense, en particulier pour :

Logiciels open source

Systèmes d'infrastructures critiques

Recherche en sécurité de bonne foi

Agent de sécurité Aardvark

OpenAI étend la bêta privée d'Aardvark, son agent de recherche en sécurité, en tant que première offre de sa suite de produits et d'outils de sécurité Codex. Ils s'associent également à des mainteneurs open source pour fournir une analyse gratuite du code base pour des projets largement utilisés comme Next.js.

Comment OpenAI a utilisé Codex pour construire Codex

Le développement de GPT-5.3-Codex fournit une étude de cas fascinante sur la recherche accélérée par l'IA.

Cas d'utilisation de l'équipe de recherche

L'équipe de recherche a utilisé les premières versions de GPT-5.3-Codex pour :

Surveiller et déboguer l'exécution de la formation pour la publication

Suivre les schémas tout au long de la formation

Fournir une analyse approfondie sur la qualité de l'interaction

Proposer des corrections et créer des applications riches pour les chercheurs humains

Comprendre précisément en quoi le comportement du modèle différait des modèles précédents

Cas d'utilisation de l'équipe d'ingénierie

L'équipe d'ingénierie a utilisé Codex pour :

Optimiser et adapter le harnais pour GPT-5.3-Codex

Identifier les bugs de rendu de contexte ayant un impact sur les utilisateurs

Identifier la cause profonde des faibles taux de réussite du cache

Mettre à l'échelle dynamiquement les clusters GPU pour s'adapter aux pics de trafic

Maintenir une latence stable pendant le lancement

Cas d'utilisation de la science des données

Pendant les tests alpha, un data scientist a travaillé avec GPT-5.3-Codex pour :

Créer des classificateurs regex pour estimer la fréquence des clarifications, des réponses des utilisateurs et de la progression des tâches

Exécuter ces classificateurs de manière évolutive sur tous les journaux de session

Créer de nouveaux pipelines de données et visualiser les résultats plus richement que les outils de tableau de bord standard

Co-analyser les résultats, Codex résumant les principaux enseignements sur des milliers de points de données en moins de trois minutes

Gains de productivité

Le résultat ? Les personnes qui construisent avec Codex étaient plus heureuses car l'agent :

Comprenait mieux leur intention

Faisait plus de progrès par tour

Posait moins de questions de clarification

Disponibilité et tarification

Comment y accéder

GPT-5.3-Codex est disponible immédiatement pour les utilisateurs de ChatGPT payants sur toutes les surfaces Codex :

Application de bureau (macOS et Windows)

Interface de ligne de commande (CLI)

Extensions IDE (VS Code, JetBrains, etc.)

Interface web

Plans d'abonnement

Pour une durée limitée, les plans payants recevront le double des limites de débit normales.

Tarification de l'API

Au moment du lancement, OpenAI n'a pas publié de tarification API officielle pour GPT-5.3-Codex. L'accès à l'API est décrit comme « en cours de déploiement prochainement » et « dans les semaines suivantes ».

À titre de référence, la tarification API actuelle pour le modèle précédent (GPT-5.2-Codex) est :

Infrastructure

GPT-5.3-Codex a été co-conçu, entraîné et servi sur les systèmes NVIDIA GB200 NVL72, un témoignage de l'étroite collaboration entre OpenAI et NVIDIA pour repousser les limites des capacités de l'IA.

Comparaison avec les concurrents

La sortie de GPT-5.3-Codex est intervenue quelques minutes seulement après l'annonce par Anthropic de Claude Opus 4.6, établissant une comparaison immédiate entre les deux modèles.

Points forts de GPT-5.3-Codex

Terminal-Bench 2.0 : 77,3 contre 65,4 pour Opus 4.6 (avantage de +18,6 %)

Performances 25 % plus rapides

Philosophie de conception « Haute fiabilité, faible variance »

Capacité d'auto-construction (a contribué à sa propre création)

Première classification de cybersécurité « Haute capacité »

Points forts de Claude Opus 4.6

Fenêtre de contexte de 1 million de tokens (nettement plus grande)

Fonctionnalité collaborative Agent Teams

Polyvalence plus large dans les scénarios de travail intellectuel

Température de créativité plus élevée (plus de personnalité)

Différences de philosophie de conception

La vue d'ensemble

GPT-5.3-Codex représente plus qu'une simple mise à niveau incrémentale : c'est un changement radical vers des agents à usage général capables de raisonner, de construire et d'exécuter dans tout le spectre du travail technique réel.

D'agent de code à agent informatique

OpenAI encadre explicitement cette évolution : « Codex passe de l'écriture de code à son utilisation comme outil pour faire fonctionner un ordinateur et effectuer un travail de bout en bout. »

Il s'agit d'un changement profond. Ce qui a commencé comme un objectif d'être « le meilleur agent de codage » est devenu la base d'un collaborateur plus général sur l'ordinateur, élargissant à la fois qui peut construire et ce qui est possible avec l'IA.

Accélérer le développement de l'IA

Le fait que GPT-5.3-Codex ait contribué à sa propre construction est un aperçu de ce qui est à venir. Comme le notent les chercheurs d'OpenAI, « de nombreux chercheurs et ingénieurs d'OpenAI décrivent leur travail aujourd'hui comme étant fondamentalement différent de ce qu'il était il y a à peine deux mois ».

Cela suggère que nous entrons dans une période de rendements accélérés dans le développement de l'IA, où chaque génération de modèles contribue à la construction de la suivante, ce qui pourrait comprimer les délais de plusieurs années à quelques mois.

Implications pour les développeurs

Pour les développeurs de logiciels, les implications sont importantes :

Cycles de développement plus rapides - L'IA gère une plus grande partie du travail de routine

Abstraction de niveau supérieur - Les développeurs peuvent se concentrer sur l'architecture et la conception

Collaboration interactive - Moins comme utiliser un outil, plus comme travailler avec un coéquipier

Nouvelles capacités - Les tâches qui nécessitaient auparavant des connaissances spécialisées sont désormais accessibles

Implications pour les entreprises

Pour les entreprises, GPT-5.3-Codex représente :

Productivité accrue - Plus de travail est effectué en moins de temps

Barrières plus faibles - Moins de compétences spécialisées nécessaires pour certaines tâches

Nouvelles considérations de sécurité - La classification de cybersécurité « Haute capacité » nécessite une gouvernance prudente

Avantage concurrentiel - Adoption précoce de l'IA agentique puissante

Conclusion

GPT-5.3-Codex est une réalisation marquante dans le domaine de l'intelligence artificielle. Il combine :

Des performances de codage de pointe

Des capacités agentiques avancées

Collaboration interactive

Auto-amélioration (il a contribué à sa propre construction)

Utilisation de l'ordinateur dans le monde réel

Le fait qu'il ait joué un rôle déterminant dans sa propre création est à la fois une prouesse technique et une métaphore de la direction que prend l'IA. À mesure que les modèles deviennent plus performants, ils ne sont pas seulement des outils que nous utilisons, ils deviennent des partenaires dans le processus de création et de développement lui-même.

La sortie simultanée avec Claude Opus 4.6, à quelques minutes d'intervalle, souligne l'intensité de la concurrence dans le domaine de l'IA. Mais surtout, cela signale que nous sommes entrés dans une nouvelle phase de capacité de l'IA, une phase où les agents peuvent gérer de manière fiable des tâches complexes et de longue haleine dans tout le spectre du travail informatique professionnel.

Comme le dit OpenAI : « Ce qui a commencé comme un objectif d'être le meilleur agent de codage est devenu la base d'un collaborateur plus général sur l'ordinateur. »

La question n'est plus seulement de savoir ce que ces modèles peuvent faire, mais ce que nous choisirons de construire avec eux.

Sources

Présentation de GPT-5.3-Codex - Annonce officielle d'OpenAI

Carte système GPT-5.3-Codex - OpenAI

Tarification, benchmarks et fonctionnalités de GPT 5.3 Codex expliqués - eesel AI

OpenAI : Le nouveau modèle de codage GPT-5.3-Codex a contribué à sa propre construction - Mashable

Avec GPT-5.3-Codex, OpenAI lance Codex pour plus que simplement écrire du code - Ars Technica

OpenAI lance un nouveau modèle de codage agentique quelques minutes seulement après qu'Anthropic ait sorti le sien - TechCrunch

Opus 4.6 vs CODEX 5.3, première vraie comparaison - Reddit

GPT 5.3 Codex vs. Opus 4.6 : La grande convergence - Every

Tarification de la plateforme OpenAI

Tarification Codex

Classement officiel SWE-Bench

Avertissement : Cet article est basé sur les informations disponibles au 6 février 2026. Les spécifications, les prix et la disponibilité sont susceptibles de changer. Veuillez consulter la documentation officielle d'OpenAI pour obtenir les informations les plus récentes.

GPT-5.3-Codex : Le modèle de codage agentique le plus performant d'OpenAI