Introducere
Pe 5 februarie 2026, OpenAI a anunțat GPT-5.3-Codex, cel mai avansat model de codare agentic de până acum. Această lansare marchează un moment semnificativ în inteligența artificială – nu doar pentru capacitățile sale tehnice impresionante, ci și pentru că este primul model care a contribuit în mod esențial la crearea propriei sale versiuni.
reprezintă o schimbare fundamentală de la un instrument de scriere a codului la un colaborator AI interactiv, capabil să gestioneze sarcini tehnice pe termen lung, din lumea reală, pe întregul spectru de sarcini de calcul profesional.
Ce face ca să fie diferit?
Un model agentic adevărat
Spre deosebire de asistenții de codare tradiționali, care pur și simplu generează fragmente de cod, este proiectat ca un model "agentic". Asta înseamnă că poate:
- Menține contextul pe parcursul sarcinilor de lungă durată, care se întind pe ore sau chiar zile
- Utilizează instrumente autonom, inclusiv interfețe de linie de comandă, sisteme de fișiere și medii de dezvoltare
- Se adaptează și iterează pe baza feedback-ului în timp real, fără a-și pierde poziția
- Gestionează fluxuri de lucru complexe, cu mai mulți pași care necesită cercetare, planificare și execuție
Realizare de auto-construire
Poate că cel mai remarcabil aspect al este că echipa Codex a folosit versiuni timpurii ale modelului pentru a:
- Depana propriul proces de antrenament
- Gestiona propria implementare
- Diagnostica rezultatele testelor și evaluărilor
- Optimiza infrastructura pentru versiunea finală
Acest ciclu de dezvoltare autoreferențial demonstrează modul în care inteligența artificială începe să-și accelereze propria îmbunătățire – un moment important pe care cercetătorii OpenAI l-au descris ca fiind "uimiți de cât de mult a fost capabil Codex să-și accelereze propria dezvoltare."
Îmbunătățiri de performanță
25% mai rapid este cu 25% mai rapid decât predecesorul său (GPT-5.2-Codex), datorită îmbunătățirilor aduse infrastructurii și stivei de inferență OpenAI. Această îmbunătățire a vitezei permite o colaborare în timp real mai receptivă și cicluri de iterație mai rapide.
Performanța de referință: Datele
atinge performanțe de ultimă oră în mai multe teste de referință cheie care măsoară codarea, capacitățile agentice și utilizarea computerelor în lumea reală.
SWE-Bench Pro
SWE-Bench Pro este o evaluare riguroasă a ingineriei software din lumea reală, care acoperă patru limbaje de programare (Python, JavaScript, TypeScript și Go). Spre deosebire de predecesorul său (SWE-Bench Verified), care a testat doar Python, SWE-Bench Pro este conceput pentru a fi mai rezistent la contaminare și relevant pentru industrie.
Terminal-Bench 2.0
Îmbunătățirea cu GPT-5.3-Codex pe Terminal-Bench 2.0 este deosebit de semnificativă. Acest test de referință măsoară abilitățile de terminal de care are nevoie un agent de codare – navigarea prin sistemele de fișiere, executarea comenzilor și gestionarea fluxurilor de lucru de dezvoltare. În special, GPT-5.3-Codex realizează acest lucru cu mai puține token-uri decât orice model anterior, făcându-l mai eficient.
OSWorld-Verified
Saltul cu GPT-5.3-Codex pe OSWorld-Verified demonstrează capacități de utilizare a computerului îmbunătățite dramatic. OSWorld este un test de referință agentic de utilizare a computerului, în care agenții trebuie să finalizeze sarcini de productivitate într-un mediu desktop vizual. Această îmbunătățire masivă arată că GPT-5.3-Codex este mult mai bun la navigarea interfețelor din lumea reală decât modelele anterioare.
Dincolo de cod: un agent de uz general
În timp ce excelează la programare, capacitățile sale se extind cu mult dincolo de generarea de cod. OpenAI îl poziționează ca pe un agent care poate gestiona "aproape orice pot face dezvoltatorii și profesioniștii pe un computer."
Suport pentru ciclul de viață al software-ului
Modelul este construit pentru a suporta întregul ciclu de viață al dezvoltării software-ului:
- Depanare - Identificarea și remedierea erorilor
- Implementare - Gestionarea lansărilor și a infrastructurii
- Monitorizare - Urmărirea performanței și a valorilor
- Scrierea PRD-urilor - Documente de cerințe ale produsului
- Editarea copiei - Documentație și text de marketing
- Cercetare utilizator - Analizarea feedback-ului utilizatorilor
- Testare - Scrierea și rularea suitelor de testare
- Analiza valorilor - Luarea deciziilor bazate pe date
Capacități de muncă intelectuală
Pe GPT-5.3-Codex (evaluarea OpenAI din 2025 care măsoară performanța în sarcinile de muncă intelectuală în 44 de ocupații), GPT-5.3-Codex se potrivește cu performanța GPT-5.2. Aceasta include sarcini precum:
- Crearea de prezentări și slide-uri
- Analizarea datelor în foi de calcul
- Gestionarea și organizarea documentelor
Exemplu de dezvoltare web
Pentru a demonstra capacitățile modelului, OpenAI a cerut să construiască de la zero două jocuri complete:
- Un joc de curse (versiunea 2 a jocului de lansare a aplicației Codex)
Folosind doar o abilitate de "dezvoltare a unui joc web" și solicitări generice de urmărire, cum ar fi "repară bug-ul" sau "îmbunătățește jocul", a iterat autonom peste milioane de token-uri, construind jocuri extrem de funcționale și bine finisate.
Înțelegere mai bună a intenției
Comparativ cu GPT-5.2-Codex, noul model înțelege mai bine intenția utilizatorului atunci când construiește site-uri web. Solicitările simple sau sub-specificate acum sunt implicite pentru site-uri cu:
- Mai multă funcționalitate
- Valori implicite sensibile
- Caracteristici gata de producție
De exemplu, atunci când i s-a cerut să construiască o pagină de destinație pentru prețuri, a afișat automat planul anual ca preț lunar redus (făcând clară reducerea) și a creat un carusel de mărturii în tranziție automată cu trei citate distincte ale utilizatorilor – rezultând un design mai complet și mai bine finisat.
Colaborare interactivă
Una dintre cele mai semnificative îmbunătățiri ale experienței utilizatorului este capacitatea de a direcționa modelul în timp ce lucrează.
Interacțiune în timp real
În loc să aștepte o ieșire finală, utilizatorii pot acum:
- Pune întrebări în timpul execuției
- Discuta diferite abordări
- Direcționa spre soluții specifice
- Oferi feedback la mijlocul sarcinii
Settings > General > Follow-up behavior vorbește despre ceea ce face, răspunde la feedback și menține utilizatorii la curent de la început până la sfârșit. Acest lucru poate fi activat în aplicația Codex prin Settings > General > Follow-up behavior.
Aceasta transformă experiența de la a da comenzi unei mașini la a colabora cu un coechipier – o schimbare fundamentală în modul în care oamenii interacționează cu sistemele AI.
Capacități de securitate cibernetică și siguranță
primul model pe care OpenAI îl clasifică drept "Capacitate înaltă" pentru sarcinile legate de securitatea cibernetică este primul model pe care OpenAI îl clasifică drept "Capacitate înaltă" pentru sarcinile legate de securitatea cibernetică în cadrul Preparedness Framework. Este, de asemenea, primul model antrenat direct pentru a identifica vulnerabilitățile software.
Natura cu dublă utilizare
Deoarece securitatea cibernetică este în mod inerent cu dublă utilizare (utilă atât pentru apărare, cât și pentru ofensivă), OpenAI adoptă o abordare precaută:
- Nicio dovadă definitivă că poate automatiza atacurile cibernetice end-to-end
- Implementarea unei stive complete de siguranță cibernetică
- Implementarea instruirii de siguranță și a monitorizării automate
- Solicitarea accesului de încredere pentru capabilități avansate
Acces de încredere pentru Cyber
OpenAI lansează Trusted Access for Cyber, un program pilot pentru a:
- Accelera cercetarea în domeniul apărării cibernetice
- Oferi instrumente apărătorilor mai întâi
- Sprijini reziliența ecosistemului
Angajament de 10 milioane de dolari
Construind pe un program de granturi de securitate cibernetică de 1 milion de dolari din 2023, OpenAI se angajează să aloce 10 milioane de dolari în credite API pentru a accelera apărarea cibernetică, în special pentru:
- Sisteme critice de infrastructură
- Cercetare de securitate de bună-credință
Agent de securitate Aardvark
OpenAI extinde versiunea beta privată a Aardvark, agentul său de cercetare în domeniul securității, ca prima ofertă din suita sa de produse și instrumente Codex Security. De asemenea, colaborează cu întreținătorii de open-source pentru a oferi scanarea gratuită a bazei de cod pentru proiecte utilizate pe scară largă, cum ar fi Next.js.
Cum a folosit OpenAI Codex pentru a construi Codex
Dezvoltarea oferă un studiu de caz fascinant în cercetarea accelerată de AI.
Cazuri de utilizare ale echipei de cercetare
Echipa de cercetare a folosit versiuni timpurii ale pentru a:
- Monitoriza și depana rularea antrenamentului pentru lansare
- Urmări modele pe tot parcursul antrenamentului
- Oferi o analiză aprofundată asupra calității interacțiunii
- Propune remedieri și construi aplicații bogate pentru cercetătorii umani
- Înțelege cu precizie modul în care comportamentul modelului a diferit de modelele anterioare
Cazuri de utilizare ale echipei de inginerie
Echipa de inginerie a folosit Codex pentru a:
- Optimiza și adapta cablajul pentru <a2>GPT-5.3-Codex</a2>
- Identifica erori de redare a contextului care afectează utilizatorii
- Identifica cauza principală a ratelor scăzute de accesare a memoriei cache
- Scala dinamic clusterele GPU pentru a se adapta la creșterile de trafic
- Menține latența stabilă în timpul lansării
Cazuri de utilizare ale științei datelor
În timpul testării alfa, un data scientist a lucrat cu pentru a:
- Construi clasificatori regex pentru a estima frecvența clarificărilor, a răspunsurilor utilizatorilor și a progresului sarcinilor
- Rula acești clasificatori scalabil peste toate jurnalele de sesiune
- Construi noi conducte de date și vizualiza rezultatele mai bogat decât instrumentele standard de dashboarding
- Co-analiza rezultatele, Codex rezumând informații cheie peste mii de puncte de date în mai puțin de trei minute
Creșteri de productivitate
Rezultatul? Oamenii care construiesc cu Codex au fost mai fericiți, deoarece agentul:
- A înțeles mai bine intenția lor
- A făcut mai multe progrese pe tură
- A pus mai puține întrebări de clarificare
Disponibilitate și prețuri
Cum să accesați
disponibil imediat este disponibil imediat pentru utilizatorii plătiți ChatGPT pe toate suprafețele Codex:
- Aplicație desktop (macOS și Windows)
- Interfață linie de comandă (CLI)
- Extensii IDE (VS Code, JetBrains etc.)
Planuri de abonament
Pentru o perioadă limitată, planurile plătite vor primi dublu față de limitele normale de tarif.
Prețuri API
De la lansare, GPT-5.3-Codex pentru GPT-5.3-Codex. Accesul API este descris ca "fiind lansat în curând" și "urmează în următoarele săptămâni."
Pentru referință, prețul API actual pentru modelul anterior () este:
Infrastructură
sisteme NVIDIA GB200 NVL72 a fost co-proiectat, antrenat și servit pe sisteme NVIDIA GB200 NVL72 – o dovadă a colaborării strânse dintre OpenAI și NVIDIA în depășirea limitelor capacității AI.
Comparație cu concurenții
Lansarea Claude Opus 4.6 a venit la doar câteva minute după anunțul Anthropic al Claude Opus 4.6, creând o comparație imediată între cele două modele.
Punctele forte ale GPT-5.3-Codex
- Terminal-Bench 2.0: 77.3 vs Opus 4.6's 65.4 (avantaj +18.6%)
- Performanță cu 25% mai rapidă
- Filozofie de design "Fiabilitate ridicată, varianță scăzută"
- Capacitate de auto-construire (a ajutat la crearea sa)
- Prima clasificare de securitate cibernetică "Capacitate înaltă"
Punctele forte ale Claude Opus 4.6
- Fereastră de context de 1 milion de token-uri (semnificativ mai mare)
- Funcționalitate colaborativă Agent Teams
- Versatilitate mai largă în scenariile de muncă intelectuală
- Temperatură de creativitate mai mare (mai multă personalitate)
Diferențe de filozofie de design
Imaginea de ansamblu
agenți de uz general care pot raționa, construi și executa reprezintă mai mult decât o simplă actualizare incrementală – este un pas înainte către agenți de uz general care pot raționa, construi și executa pe întregul spectru al muncii tehnice din lumea reală.
De la agent de cod la agent computerizat
OpenAI încadrează explicit această evoluție: "Codex trece dincolo de scrierea codului pentru a-l folosi ca instrument de operare a unui computer și de finalizare a lucrărilor cap-coadă."
Aceasta este o schimbare profundă. Ceea ce a început ca un accent pe a fi "cel mai bun agent de codare" a devenit fundația pentru un colaborator mai general pe computer – extinzând atât cine poate construi, cât și ceea ce este posibil cu AI.
Accelerarea dezvoltării AI
Faptul că a ajutat la construirea propriei sale versiuni este o previzualizare a ceea ce urmează să vină. După cum notează cercetătorii OpenAI, "mulți cercetători și ingineri de la OpenAI descriu că locul lor de muncă de astăzi este fundamental diferit de ceea ce era acum doar două luni."
Aceasta sugerează că intrăm într-o perioadă de randamente în accelerare în dezvoltarea AI, unde fiecare generație de modele ajută la construirea următoarei – potențial comprimând termenele de la ani la luni.
Implicații pentru dezvoltatori
Pentru dezvoltatorii de software, implicațiile sunt semnificative:
- Cicluri de dezvoltare mai rapide - AI gestionează o parte mai mare a muncii de rutină</a2>
- Abstractizare de nivel superior - Dezvoltatorii se pot concentra pe arhitectură și design</a2>
- Colaborare interactivă - Mai puțin ca utilizarea unui instrument, mai mult ca lucrul cu un coechipier</a2>
- Capabilități noi - Sarcinile care anterior necesitau cunoștințe specializate sunt acum accesibile</a2>
Implicații pentru companii
Pentru companii, reprezintă:
- Productivitate crescută - Se realizează mai multă muncă în mai puțin timp</a2>
- Bariere mai mici - Sunt necesare mai puține abilități specializate pentru anumite sarcini</a2>
- Considerații noi de securitate - Clasificarea de securitate cibernetică "Capacitate înaltă" necesită o guvernare atentă</a2>
- Avantaj competitiv - Adoptarea timpurie a AI agentic puternic</a2>
Concluzie
este o realizare remarcabilă în inteligența artificială. Acesta combină:
- Performanță de codare de ultimă oră
- Capacități agentice avansate
- Auto-îmbunătățire (a ajutat la construirea propriei sale versiuni)</a2>
- Utilizarea computerului în lumea reală
Faptul că a contribuit la propria sa creație servește atât ca o realizare tehnică, cât și ca o metaforă pentru direcția în care se îndreaptă AI. Pe măsură ce modelele devin mai capabile, ele nu sunt doar instrumente pe care le folosim – ele devin parteneri în procesul creativ și de dezvoltare în sine.
Lansarea simultană cu Claude Opus 4.6, la doar câteva minute distanță, subliniază intensitatea concurenței în spațiul AI. Dar, mai important, semnalează că am intrat într-o nouă fază a capacității AI – una în care agenții pot gestiona în mod fiabil sarcini complexe, pe termen lung, pe întregul spectru al muncii profesionale pe computer.
După cum spune OpenAI: "Ceea ce a început ca un accent pe a fi cel mai bun agent de codare a devenit fundația pentru un colaborator mai general pe computer."
Întrebarea acum nu este doar ce pot face aceste modele – ci ce vom alege să construim cu ele.
Surse
Declinare a răspunderii: Acest articol se bazează pe informațiile disponibile la 6 februarie 2026. Specificațiile, prețurile și disponibilitatea se pot schimba. Vă rugăm să consultați documentația oficială OpenAI pentru cele mai actuale informații.