Introducció
El 5 de febrer de 2026, OpenAI va anunciar GPT-5.3-Codex, el seu model de codificació agentic més avançat fins ara. Aquest llançament marca una fita significativa en la intel·ligència artificial, no només per les seves impressionants capacitats tècniques, sinó també perquè és el primer model que va ser fonamental en la seva pròpia creació.
representa un canvi fonamental d'una eina d'escriptura de codi a un col·laborador interactiu d'IA capaç de gestionar treballs tècnics de llarg abast i del món real a través de tot l'espectre de tasques informàtiques professionals.
Què fa que sigui diferent?
Un veritable model agentic
A diferència dels assistents de codificació tradicionals que simplement generen fragments de codi, està dissenyat com un model "agentic". Això significa que pot:
- Mantenir el context durant tasques de llarga durada que s'estenen durant hores o fins i tot dies
- Utilitzar eines de forma autònoma, incloent interfícies de línia d'ordres, sistemes de fitxers i entorns de desenvolupament
- Adaptar-se i iterar basant-se en la retroalimentació en temps real sense perdre el fil
- Gestionar fluxos de treball complexos de diversos passos que requereixen investigació, planificació i execució
Assoliment d'autoconstrucció
Potser l'aspecte més notable de és que l'equip de Codex va utilitzar les primeres versions del model per a:
- Depurar el seu propi procés d'entrenament
- Gestionar el seu propi desplegament
- Diagnosticar els resultats de les proves i les avaluacions
- Optimitzar la infraestructura per a la versió final
Aquest cicle de desenvolupament autoreferencial demostra com la IA està començant a accelerar la seva pròpia millora, una fita que els investigadors d'OpenAI van descriure com que els va deixar "impressionats per quant Codex va poder accelerar el seu propi desenvolupament".
Millores de rendiment
un 25% més ràpid és un 25% més ràpid que el seu predecessor (GPT-5.2-Codex), gràcies a les millores en la infraestructura i la pila d'inferència d'OpenAI. Aquesta millora de velocitat permet una col·laboració en temps real més sensible i cicles d'iteració més ràpids.
Rendiment de referència: les dades
aconsegueix un rendiment d'avantguarda en diverses referències clau que mesuren la codificació, les capacitats agentic i l'ús informàtic del món real.
SWE-Bench Pro
SWE-Bench Pro és una avaluació rigorosa de l'enginyeria de programari del món real que abasta quatre llenguatges de programació (Python, JavaScript, TypeScript i Go). A diferència del seu predecessor (SWE-Bench Verified), que només va provar Python, SWE-Bench Pro està dissenyat per ser més resistent a la contaminació i rellevant per a la indústria.
Terminal-Bench 2.0
GPT-5.3-Codex a Terminal-Bench 2.0 és particularment significativa. Aquesta referència mesura les habilitats de terminal que necessita un agent de codificació: navegar per sistemes de fitxers, executar ordres i gestionar fluxos de treball de desenvolupament. En particular, GPT-5.3-Codex aconsegueix això amb menys tokens que qualsevol model anterior, cosa que el fa més eficient.
OSWorld-Verified
GPT-5.3-Codex a OSWorld-Verified demostra capacitats d'ús informàtic dramàticament millorades. OSWorld és una referència d'ús informàtic agentic on els agents han de completar tasques de productivitat en un entorn d'escriptori visual. Aquesta millora massiva demostra que GPT-5.3-Codex és molt millor per navegar per interfícies del món real que els models anteriors.
Més enllà del codi: un agent de propòsit general
Tot i que destaca en la programació, les seves capacitats s'estenen molt més enllà de la generació de codi. OpenAI el posiciona com un agent que pot gestionar "gairebé qualsevol cosa que els desenvolupadors i professionals puguin fer en un ordinador".
Suport al cicle de vida del programari
El model està construït per donar suport a tot el cicle de vida del desenvolupament de programari:
- Depuració - Identificació i correcció d'errors
- Implementació - Gestió de versions i infraestructura
- Monitoratge - Seguiment del rendiment i les mètriques
- Escriptura de PRD - Documents de requisits del producte
- Edició de text - Documentació i text de màrqueting
- Investigació d'usuaris - Anàlisi de la retroalimentació dels usuaris
- Proves - Escriptura i execució de conjunts de proves
- Anàlisi de mètriques - Presa de decisions basada en dades
Capacitats de treball del coneixement
A GPT-5.3-Codex (l'avaluació d'OpenAI del 2025 que mesura el rendiment en tasques de treball del coneixement en 44 ocupacions), GPT-5.3-Codex iguala el rendiment de GPT-5.2. Això inclou tasques com:
- Creació de presentacions de diapositives
- Anàlisi de dades en fulls de càlcul
- Gestió i organització de documents
Exemple de desenvolupament web
Per demostrar les capacitats del model, OpenAI va demanar a que construís dos jocs complets des de zero:
- Un joc de carreres (versió 2 del joc de llançament de l'aplicació Codex)
Utilitzant només una habilitat de "desenvolupar joc web" i indicacions de seguiment genèriques com "soluciona l'error" o "millora el joc", va iterar de forma autònoma sobre milions de tokens, construint jocs polits i altament funcionals.
Millor comprensió de la intenció
En comparació amb , el nou model entén millor la intenció de l'usuari en construir llocs web. Les indicacions simples o poc especificades ara es converteixen per defecte en llocs amb:
- Valors per defecte sensibles
- Funcions a punt per a la producció
Per exemple, quan se li va demanar que construís una pàgina de destinació de preus, va mostrar automàticament el pla anual com un preu mensual amb descompte (fent que el descompte sigui clar) i va crear un carrusel de testimonis de transició automàtica amb tres cites d'usuaris diferents, cosa que va resultar en un disseny més complet i polit.
Col·laboració interactiva
Una de les millores més significatives en l'experiència d'usuari és la capacitat de dirigir el model mentre treballa.
Interacció en temps real
En lloc d'esperar una sortida final, els usuaris ara poden:
- Fer preguntes durant l'execució
- Discutir diferents enfocaments
- Dirigir cap a solucions específiques
- Proporcionar retroalimentació a mitja tasca
Configuració > General > Comportament de seguiment explica el que està fent, respon a la retroalimentació i manté els usuaris informats de principi a fi. Això es pot activar a l'aplicació Codex mitjançant Configuració > General > Comportament de seguiment.
Això transforma l'experiència de donar ordres a una màquina a col·laborar amb un company d'equip, un canvi fonamental en la forma en què els humans interactuen amb els sistemes d'IA.
Capacitats i seguretat de ciberseguretat
primer model que OpenAI classifica com a "Alta capacitat" per a tasques relacionades amb la ciberseguretat és el primer model que OpenAI classifica com a "Alta capacitat" per a tasques relacionades amb la ciberseguretat sota el seu Marc de preparació. També és el primer model entrenat directament per identificar vulnerabilitats del programari.
Naturalesa de doble ús
Com que la ciberseguretat és inherentment de doble ús (útil tant per a la defensa com per a l'ofensa), OpenAI està adoptant un enfocament de precaució:
- Sense evidència definitiva que pugui automatitzar els atacs cibernètics d'extrem a extrem
- Implementació d'una pila de seguretat de ciberseguretat integral
- Implementació de formació de seguretat i monitoratge automatitzat
- Requeriment d'accés de confiança per a capacitats avançades
Accés de confiança per a Cyber
OpenAI està llançant Accés de confiança per a Cyber, un programa pilot per a:
- Accelerar la investigació de la defensa cibernètica
- Aconseguir eines per als defensors primer
- Donar suport a la resiliència de l'ecosistema
Compromís de 10 milions de dòlars
Basant-se en un programa de subvencions de ciberseguretat d'1 milió de dòlars del 2023, OpenAI es compromet amb 10 milions de dòlars en crèdits d'API per accelerar la defensa cibernètica, especialment per a:
- Sistemes d'infraestructura crítica
- Investigació de seguretat de bona fe
Agent de seguretat Aardvark
OpenAI està ampliant la beta privada d'Aardvark, el seu agent d'investigació de seguretat, com la primera oferta en la seva suite de productes i eines de seguretat de Codex. També s'estan associant amb mantenidors de codi obert per proporcionar escaneig gratuït de la base de codi per a projectes àmpliament utilitzats com Next.js.
Com OpenAI va utilitzar Codex per construir Codex
El desenvolupament de proporciona un cas d'estudi fascinant en la investigació accelerada per la IA.
Casos d'ús de l'equip d'investigació
L'equip d'investigació va utilitzar les primeres versions de per a:
- Supervisar i depurar l'execució de l'entrenament per a la versió
- Fer un seguiment dels patrons al llarg del curs de l'entrenament
- Proporcionar una anàlisi profunda sobre la qualitat de la interacció
- Proposar correccions i construir aplicacions riques per als investigadors humans
- Entendre amb precisió com el comportament del model diferia dels models anteriors
Casos d'ús de l'equip d'enginyeria
L'equip d'enginyeria va utilitzar Codex per a:
- Optimitzar i adaptar l'arnès per a <a2>GPT-5.3-Codex</a2>
- Identificar errors de representació de context que afecten els usuaris
- Averiguar la causa arrel de les baixes taxes d'èxit de la memòria cau
- Escalar dinàmicament els clústers de GPU per ajustar-se a les pujades de trànsit
- Mantenir la latència estable durant el llançament
Casos d'ús de la ciència de dades
Durant les proves alfa, un científic de dades va treballar amb per a:
- Construir classificadors regex per estimar la freqüència de les aclariments, les respostes dels usuaris i el progrés de la tasca
- Executar aquests classificadors de forma escalable sobre tots els registres de sessió
- Construir nous conductes de dades i visualitzar els resultats de manera més rica que les eines de tauler estàndard
- Coanalitzar els resultats, amb Codex resumint les idees clau sobre milers de punts de dades en menys de tres minuts
Guanys de productivitat
El resultat? Les persones que construïen amb Codex estaven més contentes ja que l'agent:
- Entenia millor la seva intenció
- Feia més progressos per torn
- Feia menys preguntes aclaridores
Disponibilitat i preus
Com accedir-hi
disponible immediatament està disponible immediatament per als usuaris de ChatGPT de pagament a través de totes les superfícies de Codex:
- Aplicació d'escriptori (macOS i Windows)
- Interfície de línia d'ordres (CLI)
- Extensions IDE (VS Code, JetBrains, etc.)
Plans de subscripció
Durant un temps limitat, els plans de pagament rebran el doble dels límits de velocitat normals.
Preus de l'API
A partir del llançament, GPT-5.3-Codex per a GPT-5.3-Codex. L'accés a l'API es descriu com a "llançament proper" i "arribarà en les properes setmanes".
Com a referència, el preu actual de l'API per al model anterior () és:
Infraestructura
sistemes NVIDIA GB200 NVL72 va ser co-dissenyat per, entrenat amb i servit a sistemes NVIDIA GB200 NVL72, un testimoni de la estreta col·laboració entre OpenAI i NVIDIA per superar els límits de la capacitat d'IA.
Comparació amb la competència
El llançament de Claude Opus 4.6 va arribar pocs minuts després de l'anunci d'Anthropic de Claude Opus 4.6, establint una comparació immediata entre els dos models.
Fortaleses de
- Terminal-Bench 2.0: 77,3 vs 65,4 d'Opus 4.6 (avantatge de +18,6%)
- Rendiment un 25% més ràpid
- Filosofia de disseny de "alta fiabilitat, baixa variància"
- Capacitat d'autoconstrucció (va ajudar a crear-se a si mateix)
- Primera classificació de ciberseguretat de "Alta capacitat"
Fortaleses de Claude Opus 4.6
- Finestra de context d'1 milió de tokens (significativament més gran)
- Funcionalitat col·laborativa d'Equips d'agents
- Versatilitat més àmplia en escenaris de treball del coneixement
- Temperatura de creativitat més alta (més personalitat)
Diferències de filosofia de disseny
La imatge més gran
agents de propòsit general que poden raonar, construir i executar representa més que una simple actualització incremental; és un canvi d'etapa cap a agents de propòsit general que poden raonar, construir i executar a través de tot l'espectre de treball tècnic del món real.
D'agent de codi a agent informàtic
OpenAI emmarca explícitament aquesta evolució: "Codex està anant més enllà d'escriure codi per utilitzar-lo com a eina per operar un ordinador i completar el treball d'extrem a extrem".
Aquest és un canvi profund. El que va començar com un enfocament en ser "el millor agent de codificació" s'ha convertit en la base d'un col·laborador més general a l'ordinador, expandint tant qui pot construir com el que és possible amb la IA.
Acceleració del desenvolupament de la IA
El fet que ajudés a construir-se a si mateix és una vista prèvia del que està per venir. Com assenyalen els investigadors d'OpenAI, "molts investigadors i enginyers d'OpenAI descriuen la seva feina avui com fonamentalment diferent del que era fa només dos mesos".
Això suggereix que estem entrant en un període de retorns accelerats en el desenvolupament de la IA, on cada generació de models ajuda a construir la següent, cosa que podria comprimir les cronologies d'anys a mesos.
Implicacions per als desenvolupadors
Per als desenvolupadors de programari, les implicacions són significatives:
- Cicles de desenvolupament més ràpids - La IA gestiona més del treball rutinari
- Abstracció de nivell superior - Els desenvolupadors poden centrar-se en l'arquitectura i el disseny
- Col·laboració interactiva - Menys com utilitzar una eina, més com treballar amb un company d'equip
- Noves capacitats - Les tasques que abans requerien coneixements especialitzats ara són accessibles
Implicacions per a les empreses
Per a les empreses, representa:
- Augment de la productivitat - Es fa més treball en menys temps
- Barreres més baixes - Es necessiten menys habilitats especialitzades per a determinades tasques
- Noves consideracions de seguretat - La classificació de ciberseguretat de "Alta capacitat" requereix una governança acurada
- Avantatge competitiu - Adopció primerenca d'una potent IA agentic
Conclusió
és un assoliment històric en la intel·ligència artificial. Combina:
- Rendiment de codificació d'avantguarda
- Capacitats agentic avançades
- Col·laboració interactiva
- Automillora (va ajudar a construir-se a si mateix)
- Ús informàtic del món real
El fet que fos fonamental en la seva pròpia creació serveix tant com un assoliment tècnic com una metàfora d'on es dirigeix la IA. A mesura que els models es tornen més capaços, no són només eines que utilitzem, sinó que s'estan convertint en socis en el procés creatiu i de desenvolupament mateix.
El llançament simultani amb Claude Opus 4.6, amb pocs minuts de diferència, subratlla la intensitat de la competència en l'espai de la IA. Però, més important encara, assenyala que hem entrat en una nova fase de capacitat de la IA, una on els agents poden gestionar de manera fiable tasques complexes i de llarg abast a través de tot l'espectre de treball informàtic professional.
Com diu OpenAI: "El que va començar com un enfocament en ser el millor agent de codificació s'ha convertit en la base d'un col·laborador més general a l'ordinador".
La pregunta ara no és només què poden fer aquests models, sinó què triarem construir amb ells.
Fonts
Avís: Aquest article es basa en la informació disponible a partir del 6 de febrer de 2026. Les especificacions, els preus i la disponibilitat poden canviar. Consulteu la documentació oficial d'OpenAI per obtenir la informació més actualitzada.