Ievads

2026. gada 5. februārī OpenAI paziņoja par GPT-5.3-Codex — līdz šim progresīvāko agentisko kodēšanas modeli. Šis izlaidums ir nozīmīgs pagrieziena punkts mākslīgajā intelektā — ne tikai tā iespaidīgo tehnisko iespēju dēļ, bet arī tāpēc, ka tas ir pirmais modelis, kas būtiski veicināja pats savu izveidi.

GPT-5.3-Codex pārstāv pamatīgu pāreju no tikai koda rakstīšanas rīka uz interaktīvu AI sadarbības partneri, kas spēj veikt ilgstošus un reāla pasaules tehniskus uzdevumus visā profesionālās datorikas spektrā.

Kas padara GPT-5.3-Codex atšķirīgu?

Īsts agentisks modelis

Atšķirībā no tradicionālajiem kodēšanas palīgiem, kas vienkārši ģenerē koda fragmentus, GPT-5.3-Codex ir veidots kā “agentisks” modelis, kas nozīmē, ka tas var:

Uzturēt kontekstu ilgstošos uzdevumos, kas var ilgt stundas vai pat dienas

Autonomākti izmantot rīkus, tostarp komandrindas saskarnes, failu sistēmas un izstrādes vides

Pielāgoties un atkārtot balstoties uz reāllaika atsauksmēm, nezaudējot darbu kontekstu

Apstrādāt sarežģītus daudzpakāpju darba plūsmas, kas prasa pētīšanu, plānošanu un izpildi

Pašizveides sasniegums

Varbūt visievērojamākais GPT-5.3-Codex aspekts ir tas, ka Codex komanda izmantoja modeļa agrīnās versijas, lai:

Atkļūdotu savu mācību procesu

Pārvaldītu savu izvietošanu

Diagnosticētu testa rezultātus un novērtējumus

Optimizētu infrastruktūru galīgajam laidienam

Šī pašreferenciālā izstrādes cikla demonstrācija norāda, kā AI sāk paātrināt savu uzlabošanos—OpenAI pētnieki teica, ka viņus "pārlieku pārsteidza, cik ļoti Codex spēja paātrināt savu attīstību."

Veiktspējas uzlabojumi

GPT-5.3-Codex ir 25% ātrāks nekā tā priekšgājējs (GPT-5.2-Codex), pateicoties uzlabojumiem OpenAI infrastruktūrā un inferenču kaudzē. Šis ātruma pieaugums ļauj veikt atsaucīgāku reāllaika sadarbību un ātrākas iterāciju ciklus.

Veiktspējas standarti: dati

GPT-5.3-Codex sasniedz augstākā līmeņa rezultātus vairākos būtiskos testos, kas mēra kodēšanu, agentiskās spējas un reāla datora lietojumu.

SWE-Bench Pro

SWE-Bench Pro ir stingra reālas pasaules programmatūras inženierijas novērtēšana četrās programmēšanas valodās (Python, JavaScript, TypeScript un Go). Atšķirībā no priekšgājēja (SWE-Bench Verified), kas testēja tikai Python, SWE-Bench Pro ir radīts, lai būtu mazāk pakļauts piesārņojumam un būt nozarei piemērotāks.

Terminal-Bench 2.0

13,3% uzlabojums Terminal-Bench 2.0 ir īpaši nozīmīgs. Šis standarts mēra termināļa prasmes, kas vajadzīgas kodēšanas aģentam — navigācija failu sistēmās, komandu izpilde un izstrādes darba plūsmu pārvaldība. Īpaši svarīgi, ka GPT-5.3-Codex to sasniedz ar mazākām tokenu izmaksām nekā iepriekšējie modeļi, tādējādi būdams efektīvāks.

OSWorld-Verified

26,5% kāpums OSWorld-Verified liecina par būtiski uzlabotām datora izmantošanas spējām. OSWorld ir agentisks datora lietošanas standarts, kurā aģentiem jāpaveic produktivitātes uzdevumi vizuālā darbvirsmas vidē. Šis liels progresu uzrāda, ka GPT-5.3-Codex ir daudz labāks reālās vides saskarnes pārvietošanā nekā iepriekšējie modeļi.

Vairāk kā tikai kods: visaptverošs aģents

Lai gan GPT-5.3-Codex izceļas programmēšanā, tā spējas tālu pārsniedz koda ģenerēšanu. OpenAI to pozicionē kā aģentu, kas var risināt "praktiski visu, ko izstrādātāji un profesionāļi spēj darīt datorā."

Programmatūras dzīves cikla atbalsts

Modelis ir radīts, lai atbalstītu visu programmatūras izstrādes dzīves ciklu:

Atkļūdošana — kļūdu identifikācija un labošana

Izvietošana — laidienu un infrastruktūras pārvaldība

Uzraudzība — veiktspējas un metriku izsekošana

PRD rakstīšana — produkta prasību dokumenti

Kopijas rediģēšana — dokumentācija un mārketinga teksts

Lietotāju izpēte — lietotāju atsauksmju analīze

Testēšana — testa komplektu rakstīšana un izpilde

Metriku analīze — lēmumu pieņemšana, balstoties uz datiem

Zināšanu darba spējas

Uz GDPval (OpenAI 2025. gada novērtējums, kas mēra zināšanu darba veiktspēju 44 profesijās), GPT-5.3-Codex sasniedz tādu pašu līmeni kā GPT-5.2. Tas ietver šādus uzdevumus:

Slaidu prezentāciju veidošana

Datu analīze izklājlapās

Dokumentu pārvaldība un organizācija

Pētniecība un sintēze

Tīmekļa izstrādes piemērs

Lai demonstrētu modeļa spējas, OpenAI lūdza GPT-5.3-Codex izveidot divas pilnīgas spēles no nulles:

Sacīkšu spēli (Codex lietotnes sākotnējās spēles versija 2)

Niršanas spēli

Izmantojot tikai “izstrādāt tīmekļa spēli” prasmi un vispārējus turpmākus norādījumus kā “novērst kļūdu” vai “uzlabot spēli”, GPT-5.3-Codex autonomi atkārtoti apstrādāja miljonus tokenu, radot ļoti funkcionālas un pulētas spēles.

Labāka nodoma izpratne

Salīdzinot ar GPT-5.2-Codex, jaunais modelis labāk saprot lietotāja nodomu veidojot tīmekļa vietnes. Vienkārši vai nepilnīgi norādījumi tagad noklusējuma režīmā izveido vietnes ar:

Plašākām funkcijām

Pamatotām noklusējuma vērtībām

Ražošanai gatavām iespējām

Piemēram, lūgts izveidot cenu lapu, GPT-5.3-Codex automātiski parādīja gada plānu kā atlaistām mēneša cenām (skaidri norādot atlaidi) un izveidoja automātiski pārvietojošu atsauksmju karuseli ar trim atšķirīgiem lietotāju citātiem — rezultātā radot pilnīgāku un pulētāku dizainu.

Interaktīva sadarbība

Viena no nozīmīgākajām lietotāja pieredzes uzlabojumiem ir spēja vadīt modeli tā darbības laikā.

Reāllaika mijiedarbība

Tā vietā, lai gaidītu galīgo rezultātu, lietotāji tagad var:

Uzdot jautājumus izpildes laikā

Apspriest dažādas pieejas

Virzīt uz konkrētiem risinājumiem

Sniegt atsauksmes uzdevuma vidū

GPT-5.3-Codex paskaidro, ko dara, reaģē uz atsauksmēm un uztur lietotāju informētībā visā procesā. To var ieslēgt Codex lietotnē, dodoties uz Iestatījumi > Vispārīgi > Turpinājuma uzvedība.

Tas pārvērš pieredzi no mašīnas komandēšanas par sadarbību ar komandas biedru — pamatīgas pārmaiņas cilvēku mijiedarbībā ar AI sistēmām.

Kiberdrošības spējas un drošība

GPT-5.3-Codex ir pirmais modelis, kuru OpenAI klasificē kā “augstas spējas” kiberdrošības uzdevumos saskaņā ar savu sagatavotības ietvaru. Tas arī ir pirmais modelis, kas tieši apmācīts identificēt programmatūras ievainojamības.

Dubultās lietošanas daba

Tā kā kiberdrošība ir dubultās lietošanas joma (noder gan aizsardzībai, gan uzbrukumam), OpenAI ievēro piesardzības pieeju:

Nav pārliecinošu pierādījumu, ka tas var pilnībā automatizēt kiberuzbrukumus

Izvietot visaptverošu kiberdrošības drošības komplektu

Ievieš drošības apmācību un automatizētu uzraudzību

Prasa uzticamu piekļuvi uzlabotām spējām

Uzticama pieeja kiberdrošībai

OpenAI uzsāk Uzticamu pieeju kiberdrošībai — pilotprogrammu, lai:

Paātrinātu kiberaizsardzības pētījumus

Pārdotu rīkus aizstāvjiem pirmām kārtām

Atbalstītu ekosistēmas noturību

10 miljonu USD ieguldījums

Balstoties uz 2023. gada 1 miljona dolāru Kiberdrošības granta programmu, OpenAI apņemas piešķirt 10 miljonus dolāru API kredītos, lai paātrinātu kiberaizsardzību, īpaši:

Atvērtā koda programmatūrai

Krūtlic infrastruktūras sistēmām

Labticīgas drošības pētniecības atbalstam

Aardvark drošības aģents

OpenAI paplašina privāto beta versiju Aardvark — sava drošības pētniecības aģenta, kas ir pirmais produkts Codex drošības rīku klāstā. Tāpat sadarbojas ar atvērtā koda uzturētājiem, lai nodrošinātu bezmaksas koda bāzes skenēšanu plaši izmantotiem projektiem, piemēram, Next.js.

Kā OpenAI izmantoja Codex, lai veidotu Codex

GPT-5.3-Codex izstrāde sniedz fascinējošu piemēru AI paātrinātai pētniecībai.

Pētniecības komandas lietošanas gadījumi

Pētniecības komanda izmantoja GPT-5.3-Codex agrīnās versijas, lai:

Uzraudzītu un atkļūdotu mācību procesu laidienam

Izsekotu modeļa uzvedības modeļus mācību gaitā

Nodrošinātu dziļu analīzi par mijiedarbības kvalitāti

Priekšliktu labojumus un veidotu bagātīgas lietotnes cilvēku pētniekiem

Precīzi saprastu, kā modeļa uzvedība atšķiras no iepriekšējiem modeļiem

Inženiertehniskās komandas lietošanas gadījumi

Inženieri izmantoja Codex, lai:

Optimizētu un pielāgotu GPT-5.3-Codex darba ietvaru

Identificētu konteksta renderēšanas kļūdas, kas ietekmē lietotājus

Noteiktu zemu keša trāpījumu cēloņus

Dinamiskā mērogā mērogu GPU kopas trafika uzliesmojumu laikā

Saglabātu latentumu stabilu palaišanas laikā

Datu zinātnes lietošanas gadījumi

Alfa testēšanā datu zinātnieks sadarbojās ar GPT-5.3-Codex, lai:

Izveidotu regex klasifikatorus, kas novērtē skaidrojumu, lietotāju atbilžu un uzdevuma progresu biežumu

Darbinātu klasifikatorus mērogojami visos sesiju žurnālos

Veidotu jaunus datu plūsmas un detalizēti vizualizētu rezultātus vairāk nekā standarta informācijas paneļi

Kopīgi analizētu rezultātus, ar Codex apkopo atslēgas ieskatus tūkstošos datu punktu mazāk nekā trīs minūšu laikā

Produktivitātes pieaugums

Rezultāts? Cilvēki, kas strādāja ar Codex, bija apmierinātāki, jo aģents:

Labāk izprata viņu nodomu

Veica vairāk darba vienā solī

Uzdeva mazāk precizējošu jautājumu

Pieejamība un cenas

Kā piekļūt

GPT-5.3-Codex ir nekavējoties pieejams maksas ChatGPT lietotājiem visās Codex platformās:

Darbvirsmas lietotne (macOS un Windows)

Komandrindas saskarne (CLI)

IDE paplašinājumi (VS Code, JetBrains u. c.)

Tīmekļa saskarne

Abonēšanas plāni

Uz laiku maksas plāniem būs dubultas parastās ātruma ierobežojumi.

API cenas

Palaišanas brīdī OpenAI nav publiskojis oficiālas API cenas GPT-5.3-Codex. API piekļuve tiek aprakstīta kā "drīz tiks palaista" un "nākamajās nedēļās."

Piemēram, iepriekšējā modeļa (GPT-5.2-Codex) API cenas ir:

Infrastruktūra

GPT-5.3-Codex tika izstrādāts, apmācīts un darbināts uz NVIDIA GB200 NVL72 sistēmām — apliecinot ciešo OpenAI un NVIDIA sadarbību AI spēju robežu paplašināšanā.

Salīdzinājums ar konkurentiem

GPT-5.3-Codex izlaide sekoja tikai dažas minūtes pēc Anthropic paziņojuma par Claude Opus 4.6, ļaujot veikt tūlītēju abu modeļu salīdzinājumu.

GPT-5.3-Codex stiprās puses

Terminal-Bench 2.0: 77,3 pret Opus 4.6 65,4 (+18,6% priekšrocība)

25% ātrāka veiktspēja

"Augsta uzticamība, zema variācija" dizaina filozofija

Pašizveides spēja (palīdzēja izveidot sevi)

Pirmā "Augstas spējas" kiberdrošības klasifikācija

Claude Opus 4.6 stiprās puses

1 miljona tokenu konteksta logs (būtiski lielāks)

Aģentu komandas sadarbības funkcionalitāte

Plašāka pielietojamība zināšanu darba scenārijos

Augstākas radošuma temperatūra (vairāk personības)

Dizaina filozofijas atšķirības

Plašāks skats

GPT-5.3-Codex ir vairāk nekā tikai pakāpenisks uzlabojums — tā ir kvantitatīva pāreja uz vispārējiem aģentiem, kas spēj domāt, būvēt un īstenot visos reālās pasaules tehniskajos uzdevumos.

No koda aģenta līdz datora aģentam

OpenAI skaidri formulē šo attīstību: "Codex pāriet no koda rakstīšanas uz tā izmantošanu kā rīku, lai vadītu datoru un pilnībā pabeigtu darba uzdevumus."

Tas ir dziļš pagrieziens. Tas, kas sākās kā „labākā kodēšanas aģenta” meklējums, ir kļuvis par pamatu daudz vispārīgākam sadarbības partnerim datorā — paplašinot gan to, kas var būvēt, gan to, kas ar AI ir iespējams.

AI izstrādes paātrināšana

Fakts, ka GPT-5.3-Codex palīdzēja izveidot sevi, ir priekšstats par nākotni. Kā OpenAI pētnieki atzīmē: "daudzi OpenAI pētnieki un inženieri šodien apraksta savu darbu kā fundamentāli atšķirīgu no tā, kāds tas bija tikai pirms diviem mēnešiem."

Tas liecina, ka mēs ieejam paātrinātu atdevi posmā mākslīgā intelekta attīstībā, kur katra modeļa paaudze palīdz izveidot nākamo — potenciāli saīsinot laika grafikus no gadiem līdz mēnešiem.

Sekas izstrādātājiem

Programmatūras izstrādātājiem nozīme ir nozīmīga:

Ātrāki izstrādes cikli — AI pārvalda vairāk rutīnas darbu

Augstāka līmeņa abstrakcija — izstrādātāji var koncentrēties uz arhitektūru un dizainu

Interaktīva sadarbība — mazāk kā instrumenta izmantošana, vairāk kā darba kopā ar komandas biedru

Jaunas spējas — uzdevumi, kam iepriekš bija vajadzīgas specializētas zināšanas, tagad pieejami plašāk

Sekas uzņēmumiem

Uzņēmumiem GPT-5.3-Codex nozīmē:

Pieaugusi produktivitāte — vairāk darba paveikts īsākā laikā

Zemākas barjeras — mazāk specializētu prasmju nepieciešams noteiktiem uzdevumiem

Jaunas drošības apsvērumi — "augstas spējas" kiberdrošības klasifikācija prasa rūpīgu pārvaldību

Konkurētspējas priekšrocības — agrīna jaudīgas agentiskās AI pieņemšana

Secinājums

GPT-5.3-Codex ir nozīmīgs mākslīgā intelekta sasniegums, kas apvieno:

Augstākā līmeņa kodēšanas veiktspēju

Attīstītas agentiskās spējas

Interaktīvu sadarbību

Pašuzlabošanos (tas palīdzēja izveidot sevi)

Reāla pasaules datora lietošanu

Tas, ka modelis bija būtisks savas izveides procesā, ir gan tehnisks sasniegums, gan metafora tam, kur AI attīstība virzās. Modeļi kļūst ne tikai par rīkiem, ko izmantojam — tie kļūst par partneriem radošajā un izstrādes procesā.

Vienlaicīga izlaiduma kopā ar Claude Opus 4.6 tikai dažas minūtes pēc tam norāda uz intensīvu konkurenci AI jomā. Bet vēl nozīmīgāk — tas signalizē, ka esam iekļuvuši jaunā AI spēju posmā, kur aģenti uzticami spēj pārvaldīt sarežģītus, ilgtermiņa uzdevumus visā profesionālās darbības spektrā.

Kā to raksta OpenAI: "Kas sākās kā vēlme būt labākajam kodēšanas aģentam, ir kļuvusi par pamatu vispārīgākam sadarbības partnerim datorā."

Tagad jautājums vairs nav tikai, ko šie modeļi spēj — bet ko mēs izvēlēsimies ar tiem radīt.

Avoti

Introducing GPT-5.3-Codex — OpenAI oficiālais paziņojums

GPT-5.3-Codex sistēmas karte — OpenAI

GPT 5.3 Codex cenas, testi un funkcijas izskaidrotas — eesel AI

OpenAI: Jaunais kodēšanas modelis GPT-5.3-Codex palīdzēja izveidot pats sevi — Mashable

Ar GPT-5.3-Codex OpenAI piedāvā Codex ne tikai koda rakstīšanai — Ars Technica

OpenAI izlaiž jaunu agentisko kodēšanas modeli tikai dažas minūtes pēc Anthropic — TechCrunch

Opus 4.6 pret CODEX 5.3, pirmais reāls salīdzinājums — Reddit

GPT 5.3 Codex pret Opus 4.6: Lielā konverģence — Every

OpenAI platformas cenas

Codex cenu politika

SWE-Bench oficiālais līderu saraksts

Brīdinājums: Šis raksts balstās uz informāciju, kas bija pieejama līdz 2026. gada 6. februārim. Specifikācijas, cenas un pieejamība var mainīties. Lūdzu, skatiet oficiālos OpenAI dokumentus, lai iegūtu aktuālāko informāciju.

GPT-5.3-Codex: OpenAI jaudīgākais aģentiskais kodēšanas modelis