Uvod
OpenAI je 5. veljače 2026. najavio GPT-5.3-Codex, svoj najnapredniji agentski model za kodiranje do danas. Ovo izdanje predstavlja značajnu prekretnicu u umjetnoj inteligenciji—ne samo zbog svojih impresivnih tehničkih mogućnosti, već i zato što je to prvi model koji je bio ključan u vlastitom stvaranju.
predstavlja temeljni pomak od alata za pisanje koda prema interaktivnom AI suradniku koji je sposoban rješavati dugoročne, stvarne tehničke zadatke u cijelom spektru profesionalnih računalnih zadataka.
Po čemu se razlikuje?
Pravi agentski model
Za razliku od tradicionalnih pomoćnika za kodiranje koji jednostavno generiraju isječke koda, je dizajniran kao "agentski" model. To znači da može:
- Održavati kontekst tijekom dugotrajnih zadataka koji traju satima ili čak danima
- Koristiti alate autonomno, uključujući sučelja naredbenog retka, datotečne sustave i razvojna okruženja
- Prilagođavati se i ponavljati na temelju povratnih informacija u stvarnom vremenu, a da pritom ne izgubi svoje mjesto
- Rukovati složenim višestepenim tijekovima rada koji zahtijevaju istraživanje, planiranje i izvršenje
Postignuće samostalnog stvaranja
Možda je najznačajniji aspekt to što je Codex tim koristio rane verzije modela za:
- Otklanjanje pogrešaka u vlastitom procesu obuke
- Upravljanje vlastitom implementacijom
- Dijagnosticiranje rezultata testiranja i evaluacija
- Optimiziranje infrastrukture za konačno izdanje
Ovaj samoreferencijalni razvojni ciklus pokazuje kako AI počinje ubrzavati vlastito poboljšanje—prekretnica za koju su istraživači OpenAI-ja rekli da su "oduševljeni koliko je uspio ubrzati vlastiti razvoj."
Poboljšanja performansi
GPT-5.2-Codex je GPT-5.2-Codex od svog prethodnika (GPT-5.2-Codex), zahvaljujući poboljšanjima u OpenAI-jevoj infrastrukturi i inferencijskom stogu. Ovo poboljšanje brzine omogućuje responzivniju suradnju u stvarnom vremenu i brže cikluse iteracije.
Referentne performanse: Podaci
postiže vrhunske performanse u nekoliko ključnih referentnih testova koji mjere kodiranje, agentske sposobnosti i stvarnu upotrebu računala.
SWE-Bench Pro je rigorozna evaluacija stvarnog softverskog inženjerstva koja obuhvaća četiri programska jezika (Python, JavaScript, TypeScript i Go). Za razliku od svog prethodnika () koji je testirao samo Python, je dizajniran da bude otporniji na kontaminaciju i relevantniji za industriju.
GPT-5.3-Codex na GPT-5.3-Codex je posebno značajno. Ovaj referentni test mjeri vještine rada s terminalom koje su potrebne agentu za kodiranje—navigaciju datotečnim sustavima, izvršavanje naredbi i upravljanje razvojnim tijekovima rada. Značajno je da GPT-5.3-Codex to postiže s manje tokena od bilo kojeg prethodnog modela, što ga čini učinkovitijim.
GPT-5.3-Codex na GPT-5.3-Codex pokazuje dramatično poboljšane mogućnosti korištenja računala. GPT-5.3-Codex je agentski referentni test korištenja računala gdje agenti moraju obavljati zadatke produktivnosti u vizualnom desktop okruženju. Ovo masivno poboljšanje pokazuje da je GPT-5.3-Codex daleko bolji u navigaciji stvarnim sučeljima od prethodnih modela.
Izvan koda: Agent opće namjene
Iako briljira u programiranju, njegove se mogućnosti protežu daleko izvan generiranja koda. OpenAI ga pozicionira kao agenta koji može obavljati "gotovo sve što programeri i profesionalci mogu raditi na računalu."
Podrška životnom ciklusu softvera
Model je izgrađen za podršku cijelom životnom ciklusu razvoja softvera:
- Otklanjanje pogrešaka - Identificiranje i popravljanje pogrešaka
- Implementacija - Upravljanje izdanjima i infrastrukturom
- Praćenje - Praćenje performansi i metrika
- Pisanje PRD-ova - Dokumenti zahtjeva proizvoda
- Uređivanje teksta - Dokumentacija i marketinški tekst
- Istraživanje korisnika - Analiza povratnih informacija korisnika
- Testiranje - Pisanje i pokretanje testnih paketa
- Analiza metrika - Donošenje odluka na temelju podataka
Sposobnosti rada sa znanjem
Na GPT-5.2 (OpenAI-jeva evaluacija iz 2025. koja mjeri performanse na zadacima rada sa znanjem u 44 zanimanja), GPT-5.2 odgovara performansama GPT-5.2. To uključuje zadatke kao što su:
- Stvaranje prezentacija i slajdova
- Analiza podataka u proračunskim tablicama
- Upravljanje i organizacija dokumenata
Primjer razvoja web stranice
Kako bi demonstrirao mogućnosti modela, OpenAI je zatražio od da izgradi dvije kompletne igre od nule:
- Igra utrkivanja (verzija 2 igre za pokretanje aplikacije Codex)
Koristeći samo vještinu "razvij web igru" i generičke naknadne upite poput "popravi bug" ili "poboljšaj igru", je autonomno ponavljao preko milijuna tokena, gradeći visoko funkcionalne, polirane igre.
Bolje razumijevanje namjere
U usporedbi s , novi model bolje razumije namjeru korisnika prilikom izrade web stranica. Jednostavni ili nedovoljno specificirani upiti sada se po defaultu odnose na web stranice s:
- Razumnim zadanim postavkama
- Značajkama spremnim za produkciju
Na primjer, kada je zatraženo da izradi odredišnu stranicu s cijenama, je automatski prikazao godišnji plan kao sniženu mjesečnu cijenu (čineći popust jasnim) i stvorio automatski prelazni karusel svjedočanstava s tri različita citata korisnika—što je rezultiralo potpunijim i uglađenijim dizajnom.
Interaktivna suradnja
Jedno od najznačajnijih poboljšanja korisničkog iskustva je mogućnost upravljanja modelom dok radi.
Interakcija u stvarnom vremenu
Umjesto čekanja konačnog rezultata, korisnici sada mogu:
- Postavljati pitanja tijekom izvršavanja
- Raspravljati o različitim pristupima
- Usmjeravati prema određenim rješenjima
- Davanje povratnih informacija usred zadatka
Settings > General > Follow-up behavior govori o tome što radi, odgovara na povratne informacije i drži korisnike u tijeku od početka do kraja. To se može omogućiti u aplikaciji Settings > General > Follow-up behavior putem Settings > General > Follow-up behavior.
Ovo transformira iskustvo od davanja naredbi stroju do suradnje sa suigračem—temeljna promjena u načinu na koji ljudi komuniciraju s AI sustavima.
Mogućnosti i sigurnost kibernetičke sigurnosti
prvi model koji OpenAI klasificira kao "Visoka sposobnost" za zadatke povezane s kibernetičkom sigurnošću je prvi model koji OpenAI klasificira kao "Visoka sposobnost" za zadatke povezane s kibernetičkom sigurnošću u okviru svog Okvira spremnosti. To je ujedno i prvi model koji je izravno obučen za prepoznavanje softverskih ranjivosti.
Priroda dvostruke namjene
Budući da je kibernetička sigurnost inherentno dvostruke namjene (korisna i za obranu i za napad), OpenAI zauzima pristup predostrožnosti:
- Nema definitivnih dokaza da može automatizirati kibernetičke napade od početka do kraja
- Implementacija sveobuhvatnog sigurnosnog stoga za kibernetičku sigurnost
- Implementacija sigurnosne obuke i automatiziranog praćenja
- Zahtijevanje pouzdanog pristupa za napredne mogućnosti
Pouzdani pristup za Cyber
OpenAI pokreće Trusted Access for Cyber, pilot program za:
- Ubrzavanje istraživanja kibernetičke obrane
- Prvo davanje alata braniteljima
- Podrška otpornosti ekosustava
Obveza od 10 milijuna dolara
Nadovezujući se na Program bespovratnih sredstava za kibernetičku sigurnost od 1 milijun dolara iz 2023., OpenAI ulaže 10 milijuna dolara u API kreditima za ubrzanje kibernetičke obrane, posebno za:
- Sustavi kritične infrastrukture
- Istraživanje sigurnosti u dobroj vjeri
Sigurnosni agent Aardvark
OpenAI proširuje privatnu beta verziju Codex, svog agenta za istraživanje sigurnosti, kao prvu ponudu u svom paketu proizvoda i alata za sigurnost Codex. Također se udružuju s održavateljima otvorenog koda kako bi osigurali besplatno skeniranje baze koda za široko korištene projekte poput Next.js.
Kako je OpenAI koristio za izgradnju
Razvoj pruža fascinantnu studiju slučaja u istraživanju ubrzanom umjetnom inteligencijom.
Slučajevi upotrebe istraživačkog tima
Istraživački tim je koristio rane verzije za:
- Praćenje i otklanjanje pogrešaka tijekom pokretanja obuke za izdanje
- Praćenje obrazaca tijekom obuke
- Pružanje dubinske analize kvalitete interakcije
- Predlaganje popravaka i izgradnju bogatih aplikacija za ljudske istraživače
- Precizno razumijevanje kako se ponašanje modela razlikovalo od prethodnih modela
Slučajevi upotrebe inženjerskog tima
Inženjerski tim je koristio za:
- Optimiziranje i prilagođavanje okvira za <a2>GPT-5.3-Codex</a2>
- Identificiranje bugova u prikazivanju konteksta koji utječu na korisnike
- Pronalaženje uzroka niskih stopa pogodaka predmemorije
- Dinamičko skaliranje GPU klastera za prilagodbu porastu prometa
- Održavanje stabilne latencije tijekom lansiranja
Slučajevi upotrebe znanosti o podacima
Tijekom alfa testiranja, znanstvenik podataka radio je s kako bi:
- Izradio regex klasifikatore za procjenu učestalosti pojašnjenja, odgovora korisnika i napretka zadatka
- Pokrenuo ove klasifikatore skalabilno preko svih dnevnika sesija
- Izradio nove podatkovne cjevovode i vizualizirao rezultate bogatije od standardnih alata za nadzorne ploče
- Zajednički analizirao rezultate, pri čemu je <a2>Codex</a2> sažeo ključne uvide preko tisuća podatkovnih točaka u manje od tri minute
Dobici u produktivnosti
Rezultat? Ljudi koji su gradili s bili su sretniji jer je agent:
- Bolje razumio njihovu namjeru
- Postigao veći napredak po potezu
- Postavljao manje pitanja za pojašnjenje
Dostupnost i cijene
Kako pristupiti
Codexa je Codexa za plaćene korisnike Codexa-a na svim površinama Codexa:
- Desktop aplikacija (macOS i Windows)
- Sučelje naredbenog retka (CLI)
- IDE ekstenzije (VS Code, JetBrains, itd.)
Pretplatnički planovi
Ograničeno vrijeme plaćeni planovi će dobiti dvostruko veće normalne stope ograničenja.
Cijene API-ja
Od lansiranja, GPT-5.3-Codex za GPT-5.3-Codex. Pristup API-ju opisan je kao "uskoro se uvodi" i "dolazi u sljedećim tjednima".
Za referencu, trenutne cijene API-ja za prethodni model () su:
Infrastruktura
NVIDIA GB200 NVL72 sustavima je su-dizajniran za, obučen s i služi na NVIDIA GB200 NVL72 sustavima—što je dokaz bliske suradnje između OpenAI-ja i NVIDIA-e u pomicanju granica AI sposobnosti.
Usporedba s konkurentima
Izdanje Claudea Opusa 4.6 stiglo je samo nekoliko minuta nakon Anthropicove najave Claudea Opusa 4.6, postavljajući trenutnu usporedbu između dva modela.
Prednosti
- Terminal-Bench 2.0: 77,3 u odnosu na Opus 4.6 65,4 (+18,6% prednosti)
- Filozofija dizajna "Visoka pouzdanost, niska varijanca"
- Sposobnost samostalnog stvaranja (pomogao je stvoriti sebe)
- Prva klasifikacija kibernetičke sigurnosti "Visoke sposobnosti"
Prednosti
- Kontekstni prozor od 1 milijun tokena (znatno veći)
- Agent Teams funkcionalnost suradnje
- Šira svestranost u scenarijima rada sa znanjem
- Viša temperatura kreativnosti (više osobnosti)
Razlike u filozofiji dizajna
Šira slika
agentima opće namjene koji mogu rezonirati, graditi i izvršavati predstavlja više od samo inkrementalne nadogradnje—to je promjena koraka prema agentima opće namjene koji mogu rezonirati, graditi i izvršavati u cijelom spektru stvarnog tehničkog rada.
Od agenta za kod do računalnog agenta
OpenAI izričito uokviruje ovu evoluciju: " se kreće izvan pisanja koda prema korištenju koda kao alata za upravljanje računalom i dovršavanje posla od kraja do kraja."
Ovo je duboka promjena. Ono što je započelo kao fokus na to da budemo "najbolji agent za kodiranje" postalo je temelj za općenitijeg suradnika na računalu—proširujući i tko može graditi i što je moguće s umjetnom inteligencijom.
Ubrzavanje razvoja umjetne inteligencije
Činjenica da je pomogao u izgradnji sebe je pregled onoga što dolazi. Kao što primjećuju istraživači OpenAI-ja, "mnogi istraživači i inženjeri u OpenAI-ju opisuju svoj posao danas kao temeljno drugačiji od onoga što je bio prije samo dva mjeseca."
To sugerira da ulazimo u razdoblje ubrzavanja povrata u razvoju umjetne inteligencije, gdje svaka generacija modela pomaže u izgradnji sljedeće—potencijalno komprimirajući vremenske okvire s godina na mjesece.
Implikacije za programere
Za softverske programere implikacije su značajne:
- Brži razvojni ciklusi - AI rješava više rutinskog posla
- Apstrakcija više razine - Programeri se mogu usredotočiti na arhitekturu i dizajn
- Interaktivna suradnja - Manje kao korištenje alata, više kao rad sa suigračem
- Nove mogućnosti - Zadaci koji su prethodno zahtijevali specijalizirano znanje sada su dostupni
Implikacije za tvrtke
Za tvrtke, predstavlja:
- Povećana produktivnost - Više posla se obavi u manje vremena
- Niže barijere - Manje specijaliziranih vještina potrebno za određene zadatke
- Nova sigurnosna razmatranja - Klasifikacija kibernetičke sigurnosti "Visoke sposobnosti" zahtijeva pažljivo upravljanje
- Konkurentska prednost - Rana primjena moćne agentske umjetne inteligencije
Zaključak
je značajno postignuće u umjetnoj inteligenciji. Kombinira:
- Vrhunske performanse kodiranja
- Napredne agentske sposobnosti
- Samopoboljšanje (pomogao je izgraditi sebe)
- Stvarna upotreba računala
Činjenica da je bio ključan u vlastitom stvaranju služi i kao tehničko postignuće i kao metafora za smjer u kojem se kreće umjetna inteligencija. Kako modeli postaju sposobniji, oni nisu samo alati koje koristimo—oni postaju partneri u samom kreativnom i razvojnom procesu.
Istodobno izdanje s , samo nekoliko minuta razlike, naglašava intenzitet konkurencije u području umjetne inteligencije. Ali što je još važnije, signalizira da smo ušli u novu fazu sposobnosti umjetne inteligencije—onu u kojoj agenti mogu pouzdano rješavati složene, dugoročne zadatke u cijelom spektru profesionalnog računalnog rada.
Kao što OpenAI kaže: "Ono što je započelo kao fokus na to da budemo najbolji agent za kodiranje postalo je temelj za općenitijeg suradnika na računalu."
Pitanje sada nije samo što ovi modeli mogu učiniti—već što ćemo odabrati izgraditi s njima.
Izvori
Odricanje od odgovornosti: Ovaj se članak temelji na informacijama dostupnim od 6. veljače 2026. Specifikacije, cijene i dostupnost mogu se promijeniti. Molimo pogledajte službenu dokumentaciju OpenAI-ja za najnovije informacije.