Uvod

OpenAI je 5. veljače 2026. najavio GPT-5.3-Codex, svoj najnapredniji agentski model za kodiranje do danas. Ovo izdanje predstavlja značajnu prekretnicu u umjetnoj inteligenciji—ne samo zbog svojih impresivnih tehničkih mogućnosti, već i zato što je to prvi model koji je bio ključan u vlastitom stvaranju.

predstavlja temeljni pomak od alata za pisanje koda prema interaktivnom AI suradniku koji je sposoban rješavati dugoročne, stvarne tehničke zadatke u cijelom spektru profesionalnih računalnih zadataka.

Po čemu se razlikuje?

Pravi agentski model

Za razliku od tradicionalnih pomoćnika za kodiranje koji jednostavno generiraju isječke koda, je dizajniran kao "agentski" model. To znači da može:

Održavati kontekst tijekom dugotrajnih zadataka koji traju satima ili čak danima

Koristiti alate autonomno, uključujući sučelja naredbenog retka, datotečne sustave i razvojna okruženja

Prilagođavati se i ponavljati na temelju povratnih informacija u stvarnom vremenu, a da pritom ne izgubi svoje mjesto

Rukovati složenim višestepenim tijekovima rada koji zahtijevaju istraživanje, planiranje i izvršenje

Postignuće samostalnog stvaranja

Možda je najznačajniji aspekt to što je Codex tim koristio rane verzije modela za:

Otklanjanje pogrešaka u vlastitom procesu obuke

Upravljanje vlastitom implementacijom

Dijagnosticiranje rezultata testiranja i evaluacija

Optimiziranje infrastrukture za konačno izdanje

Ovaj samoreferencijalni razvojni ciklus pokazuje kako AI počinje ubrzavati vlastito poboljšanje—prekretnica za koju su istraživači OpenAI-ja rekli da su "oduševljeni koliko je uspio ubrzati vlastiti razvoj."

Poboljšanja performansi

GPT-5.2-Codex je GPT-5.2-Codex od svog prethodnika (GPT-5.2-Codex), zahvaljujući poboljšanjima u OpenAI-jevoj infrastrukturi i inferencijskom stogu. Ovo poboljšanje brzine omogućuje responzivniju suradnju u stvarnom vremenu i brže cikluse iteracije.

Referentne performanse: Podaci

postiže vrhunske performanse u nekoliko ključnih referentnih testova koji mjere kodiranje, agentske sposobnosti i stvarnu upotrebu računala.

SWE-Bench Pro je rigorozna evaluacija stvarnog softverskog inženjerstva koja obuhvaća četiri programska jezika (Python, JavaScript, TypeScript i Go). Za razliku od svog prethodnika () koji je testirao samo Python, je dizajniran da bude otporniji na kontaminaciju i relevantniji za industriju.

GPT-5.3-Codex na GPT-5.3-Codex je posebno značajno. Ovaj referentni test mjeri vještine rada s terminalom koje su potrebne agentu za kodiranje—navigaciju datotečnim sustavima, izvršavanje naredbi i upravljanje razvojnim tijekovima rada. Značajno je da GPT-5.3-Codex to postiže s manje tokena od bilo kojeg prethodnog modela, što ga čini učinkovitijim.

GPT-5.3-Codex na GPT-5.3-Codex pokazuje dramatično poboljšane mogućnosti korištenja računala. GPT-5.3-Codex je agentski referentni test korištenja računala gdje agenti moraju obavljati zadatke produktivnosti u vizualnom desktop okruženju. Ovo masivno poboljšanje pokazuje da je GPT-5.3-Codex daleko bolji u navigaciji stvarnim sučeljima od prethodnih modela.

Izvan koda: Agent opće namjene

Iako briljira u programiranju, njegove se mogućnosti protežu daleko izvan generiranja koda. OpenAI ga pozicionira kao agenta koji može obavljati "gotovo sve što programeri i profesionalci mogu raditi na računalu."

Podrška životnom ciklusu softvera

Model je izgrađen za podršku cijelom životnom ciklusu razvoja softvera:

Otklanjanje pogrešaka - Identificiranje i popravljanje pogrešaka

Implementacija - Upravljanje izdanjima i infrastrukturom

Praćenje - Praćenje performansi i metrika

Pisanje PRD-ova - Dokumenti zahtjeva proizvoda

Uređivanje teksta - Dokumentacija i marketinški tekst

Istraživanje korisnika - Analiza povratnih informacija korisnika

Testiranje - Pisanje i pokretanje testnih paketa

Analiza metrika - Donošenje odluka na temelju podataka

Sposobnosti rada sa znanjem

Na GPT-5.2 (OpenAI-jeva evaluacija iz 2025. koja mjeri performanse na zadacima rada sa znanjem u 44 zanimanja), GPT-5.2 odgovara performansama GPT-5.2. To uključuje zadatke kao što su:

Stvaranje prezentacija i slajdova

Analiza podataka u proračunskim tablicama

Upravljanje i organizacija dokumenata

Istraživanje i sinteza

Primjer razvoja web stranice

Kako bi demonstrirao mogućnosti modela, OpenAI je zatražio od da izgradi dvije kompletne igre od nule:

Igra utrkivanja (verzija 2 igre za pokretanje aplikacije Codex)

Igra ronjenja

Koristeći samo vještinu "razvij web igru" i generičke naknadne upite poput "popravi bug" ili "poboljšaj igru", je autonomno ponavljao preko milijuna tokena, gradeći visoko funkcionalne, polirane igre.

Bolje razumijevanje namjere

U usporedbi s , novi model bolje razumije namjeru korisnika prilikom izrade web stranica. Jednostavni ili nedovoljno specificirani upiti sada se po defaultu odnose na web stranice s:

Više funkcionalnosti

Razumnim zadanim postavkama

Značajkama spremnim za produkciju

Na primjer, kada je zatraženo da izradi odredišnu stranicu s cijenama, je automatski prikazao godišnji plan kao sniženu mjesečnu cijenu (čineći popust jasnim) i stvorio automatski prelazni karusel svjedočanstava s tri različita citata korisnika—što je rezultiralo potpunijim i uglađenijim dizajnom.

Interaktivna suradnja

Jedno od najznačajnijih poboljšanja korisničkog iskustva je mogućnost upravljanja modelom dok radi.

Interakcija u stvarnom vremenu

Umjesto čekanja konačnog rezultata, korisnici sada mogu:

Postavljati pitanja tijekom izvršavanja

Raspravljati o različitim pristupima

Usmjeravati prema određenim rješenjima

Davanje povratnih informacija usred zadatka

Settings > General > Follow-up behavior govori o tome što radi, odgovara na povratne informacije i drži korisnike u tijeku od početka do kraja. To se može omogućiti u aplikaciji Settings > General > Follow-up behavior putem Settings > General > Follow-up behavior.

Ovo transformira iskustvo od davanja naredbi stroju do suradnje sa suigračem—temeljna promjena u načinu na koji ljudi komuniciraju s AI sustavima.

Mogućnosti i sigurnost kibernetičke sigurnosti

prvi model koji OpenAI klasificira kao "Visoka sposobnost" za zadatke povezane s kibernetičkom sigurnošću je prvi model koji OpenAI klasificira kao "Visoka sposobnost" za zadatke povezane s kibernetičkom sigurnošću u okviru svog Okvira spremnosti. To je ujedno i prvi model koji je izravno obučen za prepoznavanje softverskih ranjivosti.

Priroda dvostruke namjene

Budući da je kibernetička sigurnost inherentno dvostruke namjene (korisna i za obranu i za napad), OpenAI zauzima pristup predostrožnosti:

Nema definitivnih dokaza da može automatizirati kibernetičke napade od početka do kraja

Implementacija sveobuhvatnog sigurnosnog stoga za kibernetičku sigurnost

Implementacija sigurnosne obuke i automatiziranog praćenja

Zahtijevanje pouzdanog pristupa za napredne mogućnosti

Pouzdani pristup za Cyber

OpenAI pokreće Trusted Access for Cyber, pilot program za:

Ubrzavanje istraživanja kibernetičke obrane

Prvo davanje alata braniteljima

Podrška otpornosti ekosustava

Obveza od 10 milijuna dolara

Nadovezujući se na Program bespovratnih sredstava za kibernetičku sigurnost od 1 milijun dolara iz 2023., OpenAI ulaže 10 milijuna dolara u API kreditima za ubrzanje kibernetičke obrane, posebno za:

Softver otvorenog koda

Sustavi kritične infrastrukture

Istraživanje sigurnosti u dobroj vjeri

Sigurnosni agent Aardvark

OpenAI proširuje privatnu beta verziju Codex, svog agenta za istraživanje sigurnosti, kao prvu ponudu u svom paketu proizvoda i alata za sigurnost Codex. Također se udružuju s održavateljima otvorenog koda kako bi osigurali besplatno skeniranje baze koda za široko korištene projekte poput Next.js.

Kako je OpenAI koristio za izgradnju

Razvoj pruža fascinantnu studiju slučaja u istraživanju ubrzanom umjetnom inteligencijom.

Slučajevi upotrebe istraživačkog tima

Istraživački tim je koristio rane verzije za:

Praćenje i otklanjanje pogrešaka tijekom pokretanja obuke za izdanje

Praćenje obrazaca tijekom obuke

Pružanje dubinske analize kvalitete interakcije

Predlaganje popravaka i izgradnju bogatih aplikacija za ljudske istraživače

Precizno razumijevanje kako se ponašanje modela razlikovalo od prethodnih modela

Slučajevi upotrebe inženjerskog tima

Inženjerski tim je koristio za:

Optimiziranje i prilagođavanje okvira za <a2>GPT-5.3-Codex</a2>

Identificiranje bugova u prikazivanju konteksta koji utječu na korisnike

Pronalaženje uzroka niskih stopa pogodaka predmemorije

Dinamičko skaliranje GPU klastera za prilagodbu porastu prometa

Održavanje stabilne latencije tijekom lansiranja

Slučajevi upotrebe znanosti o podacima

Tijekom alfa testiranja, znanstvenik podataka radio je s kako bi:

Izradio regex klasifikatore za procjenu učestalosti pojašnjenja, odgovora korisnika i napretka zadatka

Pokrenuo ove klasifikatore skalabilno preko svih dnevnika sesija

Izradio nove podatkovne cjevovode i vizualizirao rezultate bogatije od standardnih alata za nadzorne ploče

Zajednički analizirao rezultate, pri čemu je <a2>Codex</a2> sažeo ključne uvide preko tisuća podatkovnih točaka u manje od tri minute

Dobici u produktivnosti

Rezultat? Ljudi koji su gradili s bili su sretniji jer je agent:

Bolje razumio njihovu namjeru

Postigao veći napredak po potezu

Postavljao manje pitanja za pojašnjenje

Dostupnost i cijene

Kako pristupiti

Codexa je Codexa za plaćene korisnike Codexa-a na svim površinama Codexa:

Desktop aplikacija (macOS i Windows)

Sučelje naredbenog retka (CLI)

IDE ekstenzije (VS Code, JetBrains, itd.)

Web sučelje

Pretplatnički planovi

Ograničeno vrijeme plaćeni planovi će dobiti dvostruko veće normalne stope ograničenja.

Cijene API-ja

Od lansiranja, GPT-5.3-Codex za GPT-5.3-Codex. Pristup API-ju opisan je kao "uskoro se uvodi" i "dolazi u sljedećim tjednima".

Za referencu, trenutne cijene API-ja za prethodni model () su:

Infrastruktura

NVIDIA GB200 NVL72 sustavima je su-dizajniran za, obučen s i služi na NVIDIA GB200 NVL72 sustavima—što je dokaz bliske suradnje između OpenAI-ja i NVIDIA-e u pomicanju granica AI sposobnosti.

Usporedba s konkurentima

Izdanje Claudea Opusa 4.6 stiglo je samo nekoliko minuta nakon Anthropicove najave Claudea Opusa 4.6, postavljajući trenutnu usporedbu između dva modela.

Prednosti

Terminal-Bench 2.0: 77,3 u odnosu na Opus 4.6 65,4 (+18,6% prednosti)

25% brže performanse

Filozofija dizajna "Visoka pouzdanost, niska varijanca"

Sposobnost samostalnog stvaranja (pomogao je stvoriti sebe)

Prva klasifikacija kibernetičke sigurnosti "Visoke sposobnosti"

Prednosti

Kontekstni prozor od 1 milijun tokena (znatno veći)

Agent Teams funkcionalnost suradnje

Šira svestranost u scenarijima rada sa znanjem

Viša temperatura kreativnosti (više osobnosti)

Razlike u filozofiji dizajna

Šira slika

agentima opće namjene koji mogu rezonirati, graditi i izvršavati predstavlja više od samo inkrementalne nadogradnje—to je promjena koraka prema agentima opće namjene koji mogu rezonirati, graditi i izvršavati u cijelom spektru stvarnog tehničkog rada.

Od agenta za kod do računalnog agenta

OpenAI izričito uokviruje ovu evoluciju: " se kreće izvan pisanja koda prema korištenju koda kao alata za upravljanje računalom i dovršavanje posla od kraja do kraja."

Ovo je duboka promjena. Ono što je započelo kao fokus na to da budemo "najbolji agent za kodiranje" postalo je temelj za općenitijeg suradnika na računalu—proširujući i tko može graditi i što je moguće s umjetnom inteligencijom.

Ubrzavanje razvoja umjetne inteligencije

Činjenica da je pomogao u izgradnji sebe je pregled onoga što dolazi. Kao što primjećuju istraživači OpenAI-ja, "mnogi istraživači i inženjeri u OpenAI-ju opisuju svoj posao danas kao temeljno drugačiji od onoga što je bio prije samo dva mjeseca."

To sugerira da ulazimo u razdoblje ubrzavanja povrata u razvoju umjetne inteligencije, gdje svaka generacija modela pomaže u izgradnji sljedeće—potencijalno komprimirajući vremenske okvire s godina na mjesece.

Implikacije za programere

Za softverske programere implikacije su značajne:

Brži razvojni ciklusi - AI rješava više rutinskog posla

Apstrakcija više razine - Programeri se mogu usredotočiti na arhitekturu i dizajn

Interaktivna suradnja - Manje kao korištenje alata, više kao rad sa suigračem

Nove mogućnosti - Zadaci koji su prethodno zahtijevali specijalizirano znanje sada su dostupni

Implikacije za tvrtke

Za tvrtke, predstavlja:

Povećana produktivnost - Više posla se obavi u manje vremena

Niže barijere - Manje specijaliziranih vještina potrebno za određene zadatke

Nova sigurnosna razmatranja - Klasifikacija kibernetičke sigurnosti "Visoke sposobnosti" zahtijeva pažljivo upravljanje

Konkurentska prednost - Rana primjena moćne agentske umjetne inteligencije

Zaključak

je značajno postignuće u umjetnoj inteligenciji. Kombinira:

Vrhunske performanse kodiranja

Napredne agentske sposobnosti

Interaktivna suradnja

Samopoboljšanje (pomogao je izgraditi sebe)

Stvarna upotreba računala

Činjenica da je bio ključan u vlastitom stvaranju služi i kao tehničko postignuće i kao metafora za smjer u kojem se kreće umjetna inteligencija. Kako modeli postaju sposobniji, oni nisu samo alati koje koristimo—oni postaju partneri u samom kreativnom i razvojnom procesu.

Istodobno izdanje s , samo nekoliko minuta razlike, naglašava intenzitet konkurencije u području umjetne inteligencije. Ali što je još važnije, signalizira da smo ušli u novu fazu sposobnosti umjetne inteligencije—onu u kojoj agenti mogu pouzdano rješavati složene, dugoročne zadatke u cijelom spektru profesionalnog računalnog rada.

Kao što OpenAI kaže: "Ono što je započelo kao fokus na to da budemo najbolji agent za kodiranje postalo je temelj za općenitijeg suradnika na računalu."

Pitanje sada nije samo što ovi modeli mogu učiniti—već što ćemo odabrati izgraditi s njima.

Izvori

<a3>Predstavljamo <a2>GPT-5.3-Codex - Službena objava OpenAI</a3></a2>

<a3>Kartica sustava <a2>GPT-5.3-Codex - OpenAI</a3></a2>

<a3>Cijene, referentni testovi i značajke <a2>GPT 5.3 Codexa objašnjene - eesel AI</a3></a2>

<a3>OpenAI: Novi model kodiranja <a2>GPT-5.3-Codex pomogao je izgraditi sebe - Mashable</a3></a2>

<a3>S <a2>GPT-5.3-CodexomCodex, OpenAI predstavlja <a3>S <a2>GPT-5.3-CodexomCodex za više od samo pisanja koda - Ars Technica</a3></a2>

OpenAI pokreće novi agentski model kodiranja samo nekoliko minuta nakon što je Anthropic objavio svoj - TechCrunch

Opus 4.6 vs CODEX 5.3, prva prava usporedba - Reddit

<a3><a2>GPT 5.3 CodexOpus 4.6 vs. <a3><a2>GPT 5.3 CodexOpus 4.6: Velika konvergencija - Every</a3></a2>

Cijene platforme OpenAI

<a3>Cijene <a2>Codexa</a3></a2>

<a3>Službena ljestvica <a2>SWE-Bench</a3></a2>

Odricanje od odgovornosti: Ovaj se članak temelji na informacijama dostupnim od 6. veljače 2026. Specifikacije, cijene i dostupnost mogu se promijeniti. Molimo pogledajte službenu dokumentaciju OpenAI-ja za najnovije informacije.

GPT-5.3-Codex: OpenAI-jev najsposobniji agentski model za kodiranje

Uvod

Po čemu se razlikuje?

Pravi agentski model

Postignuće samostalnog stvaranja

Poboljšanja performansi

Referentne performanse: Podaci

Izvan koda: Agent opće namjene

Podrška životnom ciklusu softvera

Sposobnosti rada sa znanjem

Primjer razvoja web stranice

Bolje razumijevanje namjere

Interaktivna suradnja

Interakcija u stvarnom vremenu

Mogućnosti i sigurnost kibernetičke sigurnosti

Priroda dvostruke namjene

Pouzdani pristup za Cyber

Obveza od 10 milijuna dolara

Sigurnosni agent Aardvark

Kako je OpenAI koristio za izgradnju

Slučajevi upotrebe istraživačkog tima

Slučajevi upotrebe inženjerskog tima

Slučajevi upotrebe znanosti o podacima

Dobici u produktivnosti

Dostupnost i cijene

Kako pristupiti

Pretplatnički planovi

Cijene API-ja

Infrastruktura

Usporedba s konkurentima

Prednosti

Prednosti

Razlike u filozofiji dizajna

Šira slika

Od agenta za kod do računalnog agenta

Ubrzavanje razvoja umjetne inteligencije

Implikacije za programere

Implikacije za tvrtke

Zaključak

Izvori