Introducció

El 5 de febrer de 2026, OpenAI va anunciar GPT-5.3-Codex, el seu model de codificació agentic més avançat fins ara. Aquest llançament marca una fita significativa en la intel·ligència artificial, no només per les seves impressionants capacitats tècniques, sinó també perquè és el primer model que va ser fonamental en la seva pròpia creació.

representa un canvi fonamental d'una eina d'escriptura de codi a un col·laborador interactiu d'IA capaç de gestionar treballs tècnics de llarg abast i del món real a través de tot l'espectre de tasques informàtiques professionals.

Què fa que sigui diferent?

Un veritable model agentic

A diferència dels assistents de codificació tradicionals que simplement generen fragments de codi, està dissenyat com un model "agentic". Això significa que pot:

Mantenir el context durant tasques de llarga durada que s'estenen durant hores o fins i tot dies

Utilitzar eines de forma autònoma, incloent interfícies de línia d'ordres, sistemes de fitxers i entorns de desenvolupament

Adaptar-se i iterar basant-se en la retroalimentació en temps real sense perdre el fil

Gestionar fluxos de treball complexos de diversos passos que requereixen investigació, planificació i execució

Assoliment d'autoconstrucció

Potser l'aspecte més notable de és que l'equip de Codex va utilitzar les primeres versions del model per a:

Depurar el seu propi procés d'entrenament

Gestionar el seu propi desplegament

Diagnosticar els resultats de les proves i les avaluacions

Optimitzar la infraestructura per a la versió final

Aquest cicle de desenvolupament autoreferencial demostra com la IA està començant a accelerar la seva pròpia millora, una fita que els investigadors d'OpenAI van descriure com que els va deixar "impressionats per quant Codex va poder accelerar el seu propi desenvolupament".

Millores de rendiment

un 25% més ràpid és un 25% més ràpid que el seu predecessor (GPT-5.2-Codex), gràcies a les millores en la infraestructura i la pila d'inferència d'OpenAI. Aquesta millora de velocitat permet una col·laboració en temps real més sensible i cicles d'iteració més ràpids.

Rendiment de referència: les dades

aconsegueix un rendiment d'avantguarda en diverses referències clau que mesuren la codificació, les capacitats agentic i l'ús informàtic del món real.

SWE-Bench Pro

SWE-Bench Pro és una avaluació rigorosa de l'enginyeria de programari del món real que abasta quatre llenguatges de programació (Python, JavaScript, TypeScript i Go). A diferència del seu predecessor (SWE-Bench Verified), que només va provar Python, SWE-Bench Pro està dissenyat per ser més resistent a la contaminació i rellevant per a la indústria.

Terminal-Bench 2.0

GPT-5.3-Codex a Terminal-Bench 2.0 és particularment significativa. Aquesta referència mesura les habilitats de terminal que necessita un agent de codificació: navegar per sistemes de fitxers, executar ordres i gestionar fluxos de treball de desenvolupament. En particular, GPT-5.3-Codex aconsegueix això amb menys tokens que qualsevol model anterior, cosa que el fa més eficient.

OSWorld-Verified

GPT-5.3-Codex a OSWorld-Verified demostra capacitats d'ús informàtic dramàticament millorades. OSWorld és una referència d'ús informàtic agentic on els agents han de completar tasques de productivitat en un entorn d'escriptori visual. Aquesta millora massiva demostra que GPT-5.3-Codex és molt millor per navegar per interfícies del món real que els models anteriors.

Més enllà del codi: un agent de propòsit general

Tot i que destaca en la programació, les seves capacitats s'estenen molt més enllà de la generació de codi. OpenAI el posiciona com un agent que pot gestionar "gairebé qualsevol cosa que els desenvolupadors i professionals puguin fer en un ordinador".

Suport al cicle de vida del programari

El model està construït per donar suport a tot el cicle de vida del desenvolupament de programari:

Depuració - Identificació i correcció d'errors

Implementació - Gestió de versions i infraestructura

Monitoratge - Seguiment del rendiment i les mètriques

Escriptura de PRD - Documents de requisits del producte

Edició de text - Documentació i text de màrqueting

Investigació d'usuaris - Anàlisi de la retroalimentació dels usuaris

Proves - Escriptura i execució de conjunts de proves

Anàlisi de mètriques - Presa de decisions basada en dades

Capacitats de treball del coneixement

A GPT-5.3-Codex (l'avaluació d'OpenAI del 2025 que mesura el rendiment en tasques de treball del coneixement en 44 ocupacions), GPT-5.3-Codex iguala el rendiment de GPT-5.2. Això inclou tasques com:

Creació de presentacions de diapositives

Anàlisi de dades en fulls de càlcul

Gestió i organització de documents

Investigació i síntesi

Exemple de desenvolupament web

Per demostrar les capacitats del model, OpenAI va demanar a que construís dos jocs complets des de zero:

Un joc de carreres (versió 2 del joc de llançament de l'aplicació Codex)

Un joc de busseig

Utilitzant només una habilitat de "desenvolupar joc web" i indicacions de seguiment genèriques com "soluciona l'error" o "millora el joc", va iterar de forma autònoma sobre milions de tokens, construint jocs polits i altament funcionals.

Millor comprensió de la intenció

En comparació amb , el nou model entén millor la intenció de l'usuari en construir llocs web. Les indicacions simples o poc especificades ara es converteixen per defecte en llocs amb:

Més funcionalitat

Valors per defecte sensibles

Funcions a punt per a la producció

Per exemple, quan se li va demanar que construís una pàgina de destinació de preus, va mostrar automàticament el pla anual com un preu mensual amb descompte (fent que el descompte sigui clar) i va crear un carrusel de testimonis de transició automàtica amb tres cites d'usuaris diferents, cosa que va resultar en un disseny més complet i polit.

Col·laboració interactiva

Una de les millores més significatives en l'experiència d'usuari és la capacitat de dirigir el model mentre treballa.

Interacció en temps real

En lloc d'esperar una sortida final, els usuaris ara poden:

Fer preguntes durant l'execució

Discutir diferents enfocaments

Dirigir cap a solucions específiques

Proporcionar retroalimentació a mitja tasca

Configuració > General > Comportament de seguiment explica el que està fent, respon a la retroalimentació i manté els usuaris informats de principi a fi. Això es pot activar a l'aplicació Codex mitjançant Configuració > General > Comportament de seguiment.

Això transforma l'experiència de donar ordres a una màquina a col·laborar amb un company d'equip, un canvi fonamental en la forma en què els humans interactuen amb els sistemes d'IA.

Capacitats i seguretat de ciberseguretat

primer model que OpenAI classifica com a "Alta capacitat" per a tasques relacionades amb la ciberseguretat és el primer model que OpenAI classifica com a "Alta capacitat" per a tasques relacionades amb la ciberseguretat sota el seu Marc de preparació. També és el primer model entrenat directament per identificar vulnerabilitats del programari.

Naturalesa de doble ús

Com que la ciberseguretat és inherentment de doble ús (útil tant per a la defensa com per a l'ofensa), OpenAI està adoptant un enfocament de precaució:

Sense evidència definitiva que pugui automatitzar els atacs cibernètics d'extrem a extrem

Implementació d'una pila de seguretat de ciberseguretat integral

Implementació de formació de seguretat i monitoratge automatitzat

Requeriment d'accés de confiança per a capacitats avançades

Accés de confiança per a Cyber

OpenAI està llançant Accés de confiança per a Cyber, un programa pilot per a:

Accelerar la investigació de la defensa cibernètica

Aconseguir eines per als defensors primer

Donar suport a la resiliència de l'ecosistema

Compromís de 10 milions de dòlars

Basant-se en un programa de subvencions de ciberseguretat d'1 milió de dòlars del 2023, OpenAI es compromet amb 10 milions de dòlars en crèdits d'API per accelerar la defensa cibernètica, especialment per a:

Programari de codi obert

Sistemes d'infraestructura crítica

Investigació de seguretat de bona fe

Agent de seguretat Aardvark

OpenAI està ampliant la beta privada d'Aardvark, el seu agent d'investigació de seguretat, com la primera oferta en la seva suite de productes i eines de seguretat de Codex. També s'estan associant amb mantenidors de codi obert per proporcionar escaneig gratuït de la base de codi per a projectes àmpliament utilitzats com Next.js.

Com OpenAI va utilitzar Codex per construir Codex

El desenvolupament de proporciona un cas d'estudi fascinant en la investigació accelerada per la IA.

Casos d'ús de l'equip d'investigació

L'equip d'investigació va utilitzar les primeres versions de per a:

Supervisar i depurar l'execució de l'entrenament per a la versió

Fer un seguiment dels patrons al llarg del curs de l'entrenament

Proporcionar una anàlisi profunda sobre la qualitat de la interacció

Proposar correccions i construir aplicacions riques per als investigadors humans

Entendre amb precisió com el comportament del model diferia dels models anteriors

Casos d'ús de l'equip d'enginyeria

L'equip d'enginyeria va utilitzar Codex per a:

Optimitzar i adaptar l'arnès per a <a2>GPT-5.3-Codex</a2>

Identificar errors de representació de context que afecten els usuaris

Averiguar la causa arrel de les baixes taxes d'èxit de la memòria cau

Escalar dinàmicament els clústers de GPU per ajustar-se a les pujades de trànsit

Mantenir la latència estable durant el llançament

Casos d'ús de la ciència de dades

Durant les proves alfa, un científic de dades va treballar amb per a:

Construir classificadors regex per estimar la freqüència de les aclariments, les respostes dels usuaris i el progrés de la tasca

Executar aquests classificadors de forma escalable sobre tots els registres de sessió

Construir nous conductes de dades i visualitzar els resultats de manera més rica que les eines de tauler estàndard

Coanalitzar els resultats, amb Codex resumint les idees clau sobre milers de punts de dades en menys de tres minuts

Guanys de productivitat

El resultat? Les persones que construïen amb Codex estaven més contentes ja que l'agent:

Entenia millor la seva intenció

Feia més progressos per torn

Feia menys preguntes aclaridores

Disponibilitat i preus

Com accedir-hi

disponible immediatament està disponible immediatament per als usuaris de ChatGPT de pagament a través de totes les superfícies de Codex:

Aplicació d'escriptori (macOS i Windows)

Interfície de línia d'ordres (CLI)

Extensions IDE (VS Code, JetBrains, etc.)

Interfície web

Plans de subscripció

Durant un temps limitat, els plans de pagament rebran el doble dels límits de velocitat normals.

Preus de l'API

A partir del llançament, GPT-5.3-Codex per a GPT-5.3-Codex. L'accés a l'API es descriu com a "llançament proper" i "arribarà en les properes setmanes".

Com a referència, el preu actual de l'API per al model anterior () és:

Infraestructura

sistemes NVIDIA GB200 NVL72 va ser co-dissenyat per, entrenat amb i servit a sistemes NVIDIA GB200 NVL72, un testimoni de la estreta col·laboració entre OpenAI i NVIDIA per superar els límits de la capacitat d'IA.

Comparació amb la competència

El llançament de Claude Opus 4.6 va arribar pocs minuts després de l'anunci d'Anthropic de Claude Opus 4.6, establint una comparació immediata entre els dos models.

Fortaleses de

Terminal-Bench 2.0: 77,3 vs 65,4 d'Opus 4.6 (avantatge de +18,6%)

Rendiment un 25% més ràpid

Filosofia de disseny de "alta fiabilitat, baixa variància"

Capacitat d'autoconstrucció (va ajudar a crear-se a si mateix)

Primera classificació de ciberseguretat de "Alta capacitat"

Fortaleses de Claude Opus 4.6

Finestra de context d'1 milió de tokens (significativament més gran)

Funcionalitat col·laborativa d'Equips d'agents

Versatilitat més àmplia en escenaris de treball del coneixement

Temperatura de creativitat més alta (més personalitat)

Diferències de filosofia de disseny

La imatge més gran

agents de propòsit general que poden raonar, construir i executar representa més que una simple actualització incremental; és un canvi d'etapa cap a agents de propòsit general que poden raonar, construir i executar a través de tot l'espectre de treball tècnic del món real.

D'agent de codi a agent informàtic

OpenAI emmarca explícitament aquesta evolució: "Codex està anant més enllà d'escriure codi per utilitzar-lo com a eina per operar un ordinador i completar el treball d'extrem a extrem".

Aquest és un canvi profund. El que va començar com un enfocament en ser "el millor agent de codificació" s'ha convertit en la base d'un col·laborador més general a l'ordinador, expandint tant qui pot construir com el que és possible amb la IA.

Acceleració del desenvolupament de la IA

El fet que ajudés a construir-se a si mateix és una vista prèvia del que està per venir. Com assenyalen els investigadors d'OpenAI, "molts investigadors i enginyers d'OpenAI descriuen la seva feina avui com fonamentalment diferent del que era fa només dos mesos".

Això suggereix que estem entrant en un període de retorns accelerats en el desenvolupament de la IA, on cada generació de models ajuda a construir la següent, cosa que podria comprimir les cronologies d'anys a mesos.

Implicacions per als desenvolupadors

Per als desenvolupadors de programari, les implicacions són significatives:

Cicles de desenvolupament més ràpids - La IA gestiona més del treball rutinari

Abstracció de nivell superior - Els desenvolupadors poden centrar-se en l'arquitectura i el disseny

Col·laboració interactiva - Menys com utilitzar una eina, més com treballar amb un company d'equip

Noves capacitats - Les tasques que abans requerien coneixements especialitzats ara són accessibles

Implicacions per a les empreses

Per a les empreses, representa:

Augment de la productivitat - Es fa més treball en menys temps

Barreres més baixes - Es necessiten menys habilitats especialitzades per a determinades tasques

Noves consideracions de seguretat - La classificació de ciberseguretat de "Alta capacitat" requereix una governança acurada

Avantatge competitiu - Adopció primerenca d'una potent IA agentic

Conclusió

és un assoliment històric en la intel·ligència artificial. Combina:

Rendiment de codificació d'avantguarda

Capacitats agentic avançades

Col·laboració interactiva

Automillora (va ajudar a construir-se a si mateix)

Ús informàtic del món real

El fet que fos fonamental en la seva pròpia creació serveix tant com un assoliment tècnic com una metàfora d'on es dirigeix la IA. A mesura que els models es tornen més capaços, no són només eines que utilitzem, sinó que s'estan convertint en socis en el procés creatiu i de desenvolupament mateix.

El llançament simultani amb Claude Opus 4.6, amb pocs minuts de diferència, subratlla la intensitat de la competència en l'espai de la IA. Però, més important encara, assenyala que hem entrat en una nova fase de capacitat de la IA, una on els agents poden gestionar de manera fiable tasques complexes i de llarg abast a través de tot l'espectre de treball informàtic professional.

Com diu OpenAI: "El que va començar com un enfocament en ser el millor agent de codificació s'ha convertit en la base d'un col·laborador més general a l'ordinador".

La pregunta ara no és només què poden fer aquests models, sinó què triarem construir amb ells.

Fonts

<a3>Presentació de <a2>GPT-5.3-Codex - Anunci oficial d'OpenAI</a3></a2>

<a3>Targeta del sistema <a2>GPT-5.3-Codex - OpenAI</a3></a2>

<a3>Preus, referències i funcions de <a2>GPT 5.3 Codex explicats - eesel AI</a3></a2>

<a3>OpenAI: El nou model de codificació <a2>GPT-5.3-Codex va ajudar a construir-se a si mateix - Mashable</a3></a2>

<a3>Amb <a2>GPT-5.3-Codex, OpenAI presenta Codex per a més que només escriure codi - Ars Technica</a3></a2>

OpenAI llança un nou model de codificació agentic només minuts després que Anthropic deixi caure el seu - TechCrunch

Opus 4.6 vs CODEX 5.3, primera comparació real - Reddit

<a3><a2>GPT 5.3 Codex vs. Opus 4.6: La gran convergència - Every</a3></a2>

Preus de la plataforma OpenAI

Preus de Codex

Tauler de classificació oficial de SWE-Bench

Avís: Aquest article es basa en la informació disponible a partir del 6 de febrer de 2026. Les especificacions, els preus i la disponibilitat poden canviar. Consulteu la documentació oficial d'OpenAI per obtenir la informació més actualitzada.

GPT-5.3-Codex: El Model de Codificació Agentiu Més Capaç d'OpenAI