Introducere

Pe 5 februarie 2026, OpenAI a anunțat GPT-5.3-Codex, cel mai avansat model de codare agentic de până acum. Această lansare marchează un moment semnificativ în inteligența artificială – nu doar pentru capacitățile sale tehnice impresionante, ci și pentru că este primul model care a contribuit în mod esențial la crearea propriei sale versiuni.

reprezintă o schimbare fundamentală de la un instrument de scriere a codului la un colaborator AI interactiv, capabil să gestioneze sarcini tehnice pe termen lung, din lumea reală, pe întregul spectru de sarcini de calcul profesional.

Ce face ca să fie diferit?

Un model agentic adevărat

Spre deosebire de asistenții de codare tradiționali, care pur și simplu generează fragmente de cod, este proiectat ca un model "agentic". Asta înseamnă că poate:

Menține contextul pe parcursul sarcinilor de lungă durată, care se întind pe ore sau chiar zile

Utilizează instrumente autonom, inclusiv interfețe de linie de comandă, sisteme de fișiere și medii de dezvoltare

Se adaptează și iterează pe baza feedback-ului în timp real, fără a-și pierde poziția

Gestionează fluxuri de lucru complexe, cu mai mulți pași care necesită cercetare, planificare și execuție

Realizare de auto-construire

Poate că cel mai remarcabil aspect al este că echipa Codex a folosit versiuni timpurii ale modelului pentru a:

Depana propriul proces de antrenament

Gestiona propria implementare

Diagnostica rezultatele testelor și evaluărilor

Optimiza infrastructura pentru versiunea finală

Acest ciclu de dezvoltare autoreferențial demonstrează modul în care inteligența artificială începe să-și accelereze propria îmbunătățire – un moment important pe care cercetătorii OpenAI l-au descris ca fiind "uimiți de cât de mult a fost capabil Codex să-și accelereze propria dezvoltare."

Îmbunătățiri de performanță

25% mai rapid este cu 25% mai rapid decât predecesorul său (GPT-5.2-Codex), datorită îmbunătățirilor aduse infrastructurii și stivei de inferență OpenAI. Această îmbunătățire a vitezei permite o colaborare în timp real mai receptivă și cicluri de iterație mai rapide.

Performanța de referință: Datele

atinge performanțe de ultimă oră în mai multe teste de referință cheie care măsoară codarea, capacitățile agentice și utilizarea computerelor în lumea reală.

SWE-Bench Pro

SWE-Bench Pro este o evaluare riguroasă a ingineriei software din lumea reală, care acoperă patru limbaje de programare (Python, JavaScript, TypeScript și Go). Spre deosebire de predecesorul său (SWE-Bench Verified), care a testat doar Python, SWE-Bench Pro este conceput pentru a fi mai rezistent la contaminare și relevant pentru industrie.

Terminal-Bench 2.0

Îmbunătățirea cu GPT-5.3-Codex pe Terminal-Bench 2.0 este deosebit de semnificativă. Acest test de referință măsoară abilitățile de terminal de care are nevoie un agent de codare – navigarea prin sistemele de fișiere, executarea comenzilor și gestionarea fluxurilor de lucru de dezvoltare. În special, GPT-5.3-Codex realizează acest lucru cu mai puține token-uri decât orice model anterior, făcându-l mai eficient.

OSWorld-Verified

Saltul cu GPT-5.3-Codex pe OSWorld-Verified demonstrează capacități de utilizare a computerului îmbunătățite dramatic. OSWorld este un test de referință agentic de utilizare a computerului, în care agenții trebuie să finalizeze sarcini de productivitate într-un mediu desktop vizual. Această îmbunătățire masivă arată că GPT-5.3-Codex este mult mai bun la navigarea interfețelor din lumea reală decât modelele anterioare.

Dincolo de cod: un agent de uz general

În timp ce excelează la programare, capacitățile sale se extind cu mult dincolo de generarea de cod. OpenAI îl poziționează ca pe un agent care poate gestiona "aproape orice pot face dezvoltatorii și profesioniștii pe un computer."

Suport pentru ciclul de viață al software-ului

Modelul este construit pentru a suporta întregul ciclu de viață al dezvoltării software-ului:

Depanare - Identificarea și remedierea erorilor

Implementare - Gestionarea lansărilor și a infrastructurii

Monitorizare - Urmărirea performanței și a valorilor

Scrierea PRD-urilor - Documente de cerințe ale produsului

Editarea copiei - Documentație și text de marketing

Cercetare utilizator - Analizarea feedback-ului utilizatorilor

Testare - Scrierea și rularea suitelor de testare

Analiza valorilor - Luarea deciziilor bazate pe date

Capacități de muncă intelectuală

Pe GPT-5.3-Codex (evaluarea OpenAI din 2025 care măsoară performanța în sarcinile de muncă intelectuală în 44 de ocupații), GPT-5.3-Codex se potrivește cu performanța GPT-5.2. Aceasta include sarcini precum:

Crearea de prezentări și slide-uri

Analizarea datelor în foi de calcul

Gestionarea și organizarea documentelor

Cercetare și sinteză

Exemplu de dezvoltare web

Pentru a demonstra capacitățile modelului, OpenAI a cerut să construiască de la zero două jocuri complete:

Un joc de curse (versiunea 2 a jocului de lansare a aplicației Codex)

Un joc de scufundări

Folosind doar o abilitate de "dezvoltare a unui joc web" și solicitări generice de urmărire, cum ar fi "repară bug-ul" sau "îmbunătățește jocul", a iterat autonom peste milioane de token-uri, construind jocuri extrem de funcționale și bine finisate.

Înțelegere mai bună a intenției

Comparativ cu GPT-5.2-Codex, noul model înțelege mai bine intenția utilizatorului atunci când construiește site-uri web. Solicitările simple sau sub-specificate acum sunt implicite pentru site-uri cu:

Mai multă funcționalitate

Valori implicite sensibile

Caracteristici gata de producție

De exemplu, atunci când i s-a cerut să construiască o pagină de destinație pentru prețuri, a afișat automat planul anual ca preț lunar redus (făcând clară reducerea) și a creat un carusel de mărturii în tranziție automată cu trei citate distincte ale utilizatorilor – rezultând un design mai complet și mai bine finisat.

Colaborare interactivă

Una dintre cele mai semnificative îmbunătățiri ale experienței utilizatorului este capacitatea de a direcționa modelul în timp ce lucrează.

Interacțiune în timp real

În loc să aștepte o ieșire finală, utilizatorii pot acum:

Pune întrebări în timpul execuției

Discuta diferite abordări

Direcționa spre soluții specifice

Oferi feedback la mijlocul sarcinii

Settings > General > Follow-up behavior vorbește despre ceea ce face, răspunde la feedback și menține utilizatorii la curent de la început până la sfârșit. Acest lucru poate fi activat în aplicația Codex prin Settings > General > Follow-up behavior.

Aceasta transformă experiența de la a da comenzi unei mașini la a colabora cu un coechipier – o schimbare fundamentală în modul în care oamenii interacționează cu sistemele AI.

Capacități de securitate cibernetică și siguranță

primul model pe care OpenAI îl clasifică drept "Capacitate înaltă" pentru sarcinile legate de securitatea cibernetică este primul model pe care OpenAI îl clasifică drept "Capacitate înaltă" pentru sarcinile legate de securitatea cibernetică în cadrul Preparedness Framework. Este, de asemenea, primul model antrenat direct pentru a identifica vulnerabilitățile software.

Natura cu dublă utilizare

Deoarece securitatea cibernetică este în mod inerent cu dublă utilizare (utilă atât pentru apărare, cât și pentru ofensivă), OpenAI adoptă o abordare precaută:

Nicio dovadă definitivă că poate automatiza atacurile cibernetice end-to-end

Implementarea unei stive complete de siguranță cibernetică

Implementarea instruirii de siguranță și a monitorizării automate

Solicitarea accesului de încredere pentru capabilități avansate

Acces de încredere pentru Cyber

OpenAI lansează Trusted Access for Cyber, un program pilot pentru a:

Accelera cercetarea în domeniul apărării cibernetice

Oferi instrumente apărătorilor mai întâi

Sprijini reziliența ecosistemului

Angajament de 10 milioane de dolari

Construind pe un program de granturi de securitate cibernetică de 1 milion de dolari din 2023, OpenAI se angajează să aloce 10 milioane de dolari în credite API pentru a accelera apărarea cibernetică, în special pentru:

Software open source

Sisteme critice de infrastructură

Cercetare de securitate de bună-credință

Agent de securitate Aardvark

OpenAI extinde versiunea beta privată a Aardvark, agentul său de cercetare în domeniul securității, ca prima ofertă din suita sa de produse și instrumente Codex Security. De asemenea, colaborează cu întreținătorii de open-source pentru a oferi scanarea gratuită a bazei de cod pentru proiecte utilizate pe scară largă, cum ar fi Next.js.

Cum a folosit OpenAI Codex pentru a construi Codex

Dezvoltarea oferă un studiu de caz fascinant în cercetarea accelerată de AI.

Cazuri de utilizare ale echipei de cercetare

Echipa de cercetare a folosit versiuni timpurii ale pentru a:

Monitoriza și depana rularea antrenamentului pentru lansare

Urmări modele pe tot parcursul antrenamentului

Oferi o analiză aprofundată asupra calității interacțiunii

Propune remedieri și construi aplicații bogate pentru cercetătorii umani

Înțelege cu precizie modul în care comportamentul modelului a diferit de modelele anterioare

Cazuri de utilizare ale echipei de inginerie

Echipa de inginerie a folosit Codex pentru a:

Optimiza și adapta cablajul pentru <a2>GPT-5.3-Codex</a2>

Identifica erori de redare a contextului care afectează utilizatorii

Identifica cauza principală a ratelor scăzute de accesare a memoriei cache

Scala dinamic clusterele GPU pentru a se adapta la creșterile de trafic

Menține latența stabilă în timpul lansării

Cazuri de utilizare ale științei datelor

În timpul testării alfa, un data scientist a lucrat cu pentru a:

Construi clasificatori regex pentru a estima frecvența clarificărilor, a răspunsurilor utilizatorilor și a progresului sarcinilor

Rula acești clasificatori scalabil peste toate jurnalele de sesiune

Construi noi conducte de date și vizualiza rezultatele mai bogat decât instrumentele standard de dashboarding

Co-analiza rezultatele, Codex rezumând informații cheie peste mii de puncte de date în mai puțin de trei minute

Creșteri de productivitate

Rezultatul? Oamenii care construiesc cu Codex au fost mai fericiți, deoarece agentul:

A înțeles mai bine intenția lor

A făcut mai multe progrese pe tură

A pus mai puține întrebări de clarificare

Disponibilitate și prețuri

Cum să accesați

disponibil imediat este disponibil imediat pentru utilizatorii plătiți ChatGPT pe toate suprafețele Codex:

Aplicație desktop (macOS și Windows)

Interfață linie de comandă (CLI)

Extensii IDE (VS Code, JetBrains etc.)

Interfață web

Planuri de abonament

Pentru o perioadă limitată, planurile plătite vor primi dublu față de limitele normale de tarif.

Prețuri API

De la lansare, GPT-5.3-Codex pentru GPT-5.3-Codex. Accesul API este descris ca "fiind lansat în curând" și "urmează în următoarele săptămâni."

Pentru referință, prețul API actual pentru modelul anterior () este:

Infrastructură

sisteme NVIDIA GB200 NVL72 a fost co-proiectat, antrenat și servit pe sisteme NVIDIA GB200 NVL72 – o dovadă a colaborării strânse dintre OpenAI și NVIDIA în depășirea limitelor capacității AI.

Comparație cu concurenții

Lansarea Claude Opus 4.6 a venit la doar câteva minute după anunțul Anthropic al Claude Opus 4.6, creând o comparație imediată între cele două modele.

Punctele forte ale GPT-5.3-Codex

Terminal-Bench 2.0: 77.3 vs Opus 4.6's 65.4 (avantaj +18.6%)

Performanță cu 25% mai rapidă

Filozofie de design "Fiabilitate ridicată, varianță scăzută"

Capacitate de auto-construire (a ajutat la crearea sa)

Prima clasificare de securitate cibernetică "Capacitate înaltă"

Punctele forte ale Claude Opus 4.6

Fereastră de context de 1 milion de token-uri (semnificativ mai mare)

Funcționalitate colaborativă Agent Teams

Versatilitate mai largă în scenariile de muncă intelectuală

Temperatură de creativitate mai mare (mai multă personalitate)

Diferențe de filozofie de design

Imaginea de ansamblu

agenți de uz general care pot raționa, construi și executa reprezintă mai mult decât o simplă actualizare incrementală – este un pas înainte către agenți de uz general care pot raționa, construi și executa pe întregul spectru al muncii tehnice din lumea reală.

De la agent de cod la agent computerizat

OpenAI încadrează explicit această evoluție: "Codex trece dincolo de scrierea codului pentru a-l folosi ca instrument de operare a unui computer și de finalizare a lucrărilor cap-coadă."

Aceasta este o schimbare profundă. Ceea ce a început ca un accent pe a fi "cel mai bun agent de codare" a devenit fundația pentru un colaborator mai general pe computer – extinzând atât cine poate construi, cât și ceea ce este posibil cu AI.

Accelerarea dezvoltării AI

Faptul că a ajutat la construirea propriei sale versiuni este o previzualizare a ceea ce urmează să vină. După cum notează cercetătorii OpenAI, "mulți cercetători și ingineri de la OpenAI descriu că locul lor de muncă de astăzi este fundamental diferit de ceea ce era acum doar două luni."

Aceasta sugerează că intrăm într-o perioadă de randamente în accelerare în dezvoltarea AI, unde fiecare generație de modele ajută la construirea următoarei – potențial comprimând termenele de la ani la luni.

Implicații pentru dezvoltatori

Pentru dezvoltatorii de software, implicațiile sunt semnificative:

Cicluri de dezvoltare mai rapide - AI gestionează o parte mai mare a muncii de rutină</a2>

Abstractizare de nivel superior - Dezvoltatorii se pot concentra pe arhitectură și design</a2>

Colaborare interactivă - Mai puțin ca utilizarea unui instrument, mai mult ca lucrul cu un coechipier</a2>

Capabilități noi - Sarcinile care anterior necesitau cunoștințe specializate sunt acum accesibile</a2>

Implicații pentru companii

Pentru companii, reprezintă:

Productivitate crescută - Se realizează mai multă muncă în mai puțin timp</a2>

Bariere mai mici - Sunt necesare mai puține abilități specializate pentru anumite sarcini</a2>

Considerații noi de securitate - Clasificarea de securitate cibernetică "Capacitate înaltă" necesită o guvernare atentă</a2>

Avantaj competitiv - Adoptarea timpurie a AI agentic puternic</a2>

Concluzie

este o realizare remarcabilă în inteligența artificială. Acesta combină:

Performanță de codare de ultimă oră

Capacități agentice avansate

Colaborare interactivă

Auto-îmbunătățire (a ajutat la construirea propriei sale versiuni)</a2>

Utilizarea computerului în lumea reală

Faptul că a contribuit la propria sa creație servește atât ca o realizare tehnică, cât și ca o metaforă pentru direcția în care se îndreaptă AI. Pe măsură ce modelele devin mai capabile, ele nu sunt doar instrumente pe care le folosim – ele devin parteneri în procesul creativ și de dezvoltare în sine.

Lansarea simultană cu Claude Opus 4.6, la doar câteva minute distanță, subliniază intensitatea concurenței în spațiul AI. Dar, mai important, semnalează că am intrat într-o nouă fază a capacității AI – una în care agenții pot gestiona în mod fiabil sarcini complexe, pe termen lung, pe întregul spectru al muncii profesionale pe computer.

După cum spune OpenAI: "Ceea ce a început ca un accent pe a fi cel mai bun agent de codare a devenit fundația pentru un colaborator mai general pe computer."

Întrebarea acum nu este doar ce pot face aceste modele – ci ce vom alege să construim cu ele.

Surse

Introducing GPT-5.3-Codex - OpenAI Official Announcement

GPT-5.3-Codex System Card - OpenAI

GPT 5.3 Codex pricing, benchmarks, and features explained - eesel AI

OpenAI: New coding model GPT-5.3-Codex helped build itself - Mashable

With GPT-5.3-Codex, OpenAI pitches Codex for more than just writing code - Ars Technica

OpenAI launches new agentic coding model only minutes after Anthropic drops its own - TechCrunch

Opus 4.6 vs CODEX 5.3, first real comparison - Reddit

GPT 5.3 Codex vs. Opus 4.6: The Great Convergence - Every

OpenAI Platform Pricing

Codex Pricing

SWE-Bench Official Leaderboard

Declinare a răspunderii: Acest articol se bazează pe informațiile disponibile la 6 februarie 2026. Specificațiile, prețurile și disponibilitatea se pot schimba. Vă rugăm să consultați documentația oficială OpenAI pentru cele mai actuale informații.

GPT-5.3-Codex: Cel mai performant model de codare agentic de la OpenAI