Ievads
2026. gada 5. februārī OpenAI paziņoja par GPT-5.3-Codex — līdz šim progresīvāko agentisko kodēšanas modeli. Šis izlaidums ir nozīmīgs pagrieziena punkts mākslīgajā intelektā — ne tikai tā iespaidīgo tehnisko iespēju dēļ, bet arī tāpēc, ka tas ir pirmais modelis, kas būtiski veicināja pats savu izveidi.
GPT-5.3-Codex pārstāv pamatīgu pāreju no tikai koda rakstīšanas rīka uz interaktīvu AI sadarbības partneri, kas spēj veikt ilgstošus un reāla pasaules tehniskus uzdevumus visā profesionālās datorikas spektrā.
Kas padara GPT-5.3-Codex atšķirīgu?
Īsts agentisks modelis
Atšķirībā no tradicionālajiem kodēšanas palīgiem, kas vienkārši ģenerē koda fragmentus, GPT-5.3-Codex ir veidots kā “agentisks” modelis, kas nozīmē, ka tas var:
- Uzturēt kontekstu ilgstošos uzdevumos, kas var ilgt stundas vai pat dienas
- Autonomākti izmantot rīkus, tostarp komandrindas saskarnes, failu sistēmas un izstrādes vides
- Pielāgoties un atkārtot balstoties uz reāllaika atsauksmēm, nezaudējot darbu kontekstu
- Apstrādāt sarežģītus daudzpakāpju darba plūsmas, kas prasa pētīšanu, plānošanu un izpildi
Pašizveides sasniegums
Varbūt visievērojamākais GPT-5.3-Codex aspekts ir tas, ka Codex komanda izmantoja modeļa agrīnās versijas, lai:
- Atkļūdotu savu mācību procesu
- Pārvaldītu savu izvietošanu
- Diagnosticētu testa rezultātus un novērtējumus
- Optimizētu infrastruktūru galīgajam laidienam
Šī pašreferenciālā izstrādes cikla demonstrācija norāda, kā AI sāk paātrināt savu uzlabošanos—OpenAI pētnieki teica, ka viņus "pārlieku pārsteidza, cik ļoti Codex spēja paātrināt savu attīstību."
Veiktspējas uzlabojumi
GPT-5.3-Codex ir 25% ātrāks nekā tā priekšgājējs (GPT-5.2-Codex), pateicoties uzlabojumiem OpenAI infrastruktūrā un inferenču kaudzē. Šis ātruma pieaugums ļauj veikt atsaucīgāku reāllaika sadarbību un ātrākas iterāciju ciklus.
Veiktspējas standarti: dati
GPT-5.3-Codex sasniedz augstākā līmeņa rezultātus vairākos būtiskos testos, kas mēra kodēšanu, agentiskās spējas un reāla datora lietojumu.
SWE-Bench Pro
SWE-Bench Pro ir stingra reālas pasaules programmatūras inženierijas novērtēšana četrās programmēšanas valodās (Python, JavaScript, TypeScript un Go). Atšķirībā no priekšgājēja (SWE-Bench Verified), kas testēja tikai Python, SWE-Bench Pro ir radīts, lai būtu mazāk pakļauts piesārņojumam un būt nozarei piemērotāks.
Terminal-Bench 2.0
13,3% uzlabojums Terminal-Bench 2.0 ir īpaši nozīmīgs. Šis standarts mēra termināļa prasmes, kas vajadzīgas kodēšanas aģentam — navigācija failu sistēmās, komandu izpilde un izstrādes darba plūsmu pārvaldība. Īpaši svarīgi, ka GPT-5.3-Codex to sasniedz ar mazākām tokenu izmaksām nekā iepriekšējie modeļi, tādējādi būdams efektīvāks.
OSWorld-Verified
26,5% kāpums OSWorld-Verified liecina par būtiski uzlabotām datora izmantošanas spējām. OSWorld ir agentisks datora lietošanas standarts, kurā aģentiem jāpaveic produktivitātes uzdevumi vizuālā darbvirsmas vidē. Šis liels progresu uzrāda, ka GPT-5.3-Codex ir daudz labāks reālās vides saskarnes pārvietošanā nekā iepriekšējie modeļi.
Vairāk kā tikai kods: visaptverošs aģents
Lai gan GPT-5.3-Codex izceļas programmēšanā, tā spējas tālu pārsniedz koda ģenerēšanu. OpenAI to pozicionē kā aģentu, kas var risināt "praktiski visu, ko izstrādātāji un profesionāļi spēj darīt datorā."
Programmatūras dzīves cikla atbalsts
Modelis ir radīts, lai atbalstītu visu programmatūras izstrādes dzīves ciklu:
- Atkļūdošana — kļūdu identifikācija un labošana
- Izvietošana — laidienu un infrastruktūras pārvaldība
- Uzraudzība — veiktspējas un metriku izsekošana
- PRD rakstīšana — produkta prasību dokumenti
- Kopijas rediģēšana — dokumentācija un mārketinga teksts
- Lietotāju izpēte — lietotāju atsauksmju analīze
- Testēšana — testa komplektu rakstīšana un izpilde
- Metriku analīze — lēmumu pieņemšana, balstoties uz datiem
Zināšanu darba spējas
Uz GDPval (OpenAI 2025. gada novērtējums, kas mēra zināšanu darba veiktspēju 44 profesijās), GPT-5.3-Codex sasniedz tādu pašu līmeni kā GPT-5.2. Tas ietver šādus uzdevumus:
- Slaidu prezentāciju veidošana
- Dokumentu pārvaldība un organizācija
Tīmekļa izstrādes piemērs
Lai demonstrētu modeļa spējas, OpenAI lūdza GPT-5.3-Codex izveidot divas pilnīgas spēles no nulles:
- Sacīkšu spēli (Codex lietotnes sākotnējās spēles versija 2)
Izmantojot tikai “izstrādāt tīmekļa spēli” prasmi un vispārējus turpmākus norādījumus kā “novērst kļūdu” vai “uzlabot spēli”, GPT-5.3-Codex autonomi atkārtoti apstrādāja miljonus tokenu, radot ļoti funkcionālas un pulētas spēles.
Labāka nodoma izpratne
Salīdzinot ar GPT-5.2-Codex, jaunais modelis labāk saprot lietotāja nodomu veidojot tīmekļa vietnes. Vienkārši vai nepilnīgi norādījumi tagad noklusējuma režīmā izveido vietnes ar:
- Pamatotām noklusējuma vērtībām
- Ražošanai gatavām iespējām
Piemēram, lūgts izveidot cenu lapu, GPT-5.3-Codex automātiski parādīja gada plānu kā atlaistām mēneša cenām (skaidri norādot atlaidi) un izveidoja automātiski pārvietojošu atsauksmju karuseli ar trim atšķirīgiem lietotāju citātiem — rezultātā radot pilnīgāku un pulētāku dizainu.
Interaktīva sadarbība
Viena no nozīmīgākajām lietotāja pieredzes uzlabojumiem ir spēja vadīt modeli tā darbības laikā.
Reāllaika mijiedarbība
Tā vietā, lai gaidītu galīgo rezultātu, lietotāji tagad var:
- Uzdot jautājumus izpildes laikā
- Apspriest dažādas pieejas
- Virzīt uz konkrētiem risinājumiem
- Sniegt atsauksmes uzdevuma vidū
GPT-5.3-Codex paskaidro, ko dara, reaģē uz atsauksmēm un uztur lietotāju informētībā visā procesā. To var ieslēgt Codex lietotnē, dodoties uz Iestatījumi > Vispārīgi > Turpinājuma uzvedība.
Tas pārvērš pieredzi no mašīnas komandēšanas par sadarbību ar komandas biedru — pamatīgas pārmaiņas cilvēku mijiedarbībā ar AI sistēmām.
Kiberdrošības spējas un drošība
GPT-5.3-Codex ir pirmais modelis, kuru OpenAI klasificē kā “augstas spējas” kiberdrošības uzdevumos saskaņā ar savu sagatavotības ietvaru. Tas arī ir pirmais modelis, kas tieši apmācīts identificēt programmatūras ievainojamības.
Dubultās lietošanas daba
Tā kā kiberdrošība ir dubultās lietošanas joma (noder gan aizsardzībai, gan uzbrukumam), OpenAI ievēro piesardzības pieeju:
- Nav pārliecinošu pierādījumu, ka tas var pilnībā automatizēt kiberuzbrukumus
- Izvietot visaptverošu kiberdrošības drošības komplektu
- Ievieš drošības apmācību un automatizētu uzraudzību
- Prasa uzticamu piekļuvi uzlabotām spējām
Uzticama pieeja kiberdrošībai
OpenAI uzsāk Uzticamu pieeju kiberdrošībai — pilotprogrammu, lai:
- Paātrinātu kiberaizsardzības pētījumus
- Pārdotu rīkus aizstāvjiem pirmām kārtām
- Atbalstītu ekosistēmas noturību
10 miljonu USD ieguldījums
Balstoties uz 2023. gada 1 miljona dolāru Kiberdrošības granta programmu, OpenAI apņemas piešķirt 10 miljonus dolāru API kredītos, lai paātrinātu kiberaizsardzību, īpaši:
- Atvērtā koda programmatūrai
- Krūtlic infrastruktūras sistēmām
- Labticīgas drošības pētniecības atbalstam
Aardvark drošības aģents
OpenAI paplašina privāto beta versiju Aardvark — sava drošības pētniecības aģenta, kas ir pirmais produkts Codex drošības rīku klāstā. Tāpat sadarbojas ar atvērtā koda uzturētājiem, lai nodrošinātu bezmaksas koda bāzes skenēšanu plaši izmantotiem projektiem, piemēram, Next.js.
Kā OpenAI izmantoja Codex, lai veidotu Codex
GPT-5.3-Codex izstrāde sniedz fascinējošu piemēru AI paātrinātai pētniecībai.
Pētniecības komandas lietošanas gadījumi
Pētniecības komanda izmantoja GPT-5.3-Codex agrīnās versijas, lai:
- Uzraudzītu un atkļūdotu mācību procesu laidienam
- Izsekotu modeļa uzvedības modeļus mācību gaitā
- Nodrošinātu dziļu analīzi par mijiedarbības kvalitāti
- Priekšliktu labojumus un veidotu bagātīgas lietotnes cilvēku pētniekiem
- Precīzi saprastu, kā modeļa uzvedība atšķiras no iepriekšējiem modeļiem
Inženiertehniskās komandas lietošanas gadījumi
Inženieri izmantoja Codex, lai:
- Optimizētu un pielāgotu GPT-5.3-Codex darba ietvaru
- Identificētu konteksta renderēšanas kļūdas, kas ietekmē lietotājus
- Noteiktu zemu keša trāpījumu cēloņus
- Dinamiskā mērogā mērogu GPU kopas trafika uzliesmojumu laikā
- Saglabātu latentumu stabilu palaišanas laikā
Datu zinātnes lietošanas gadījumi
Alfa testēšanā datu zinātnieks sadarbojās ar GPT-5.3-Codex, lai:
- Izveidotu regex klasifikatorus, kas novērtē skaidrojumu, lietotāju atbilžu un uzdevuma progresu biežumu
- Darbinātu klasifikatorus mērogojami visos sesiju žurnālos
- Veidotu jaunus datu plūsmas un detalizēti vizualizētu rezultātus vairāk nekā standarta informācijas paneļi
- Kopīgi analizētu rezultātus, ar Codex apkopo atslēgas ieskatus tūkstošos datu punktu mazāk nekā trīs minūšu laikā
Produktivitātes pieaugums
Rezultāts? Cilvēki, kas strādāja ar Codex, bija apmierinātāki, jo aģents:
- Labāk izprata viņu nodomu
- Veica vairāk darba vienā solī
- Uzdeva mazāk precizējošu jautājumu
Pieejamība un cenas
Kā piekļūt
GPT-5.3-Codex ir nekavējoties pieejams maksas ChatGPT lietotājiem visās Codex platformās:
- Darbvirsmas lietotne (macOS un Windows)
- Komandrindas saskarne (CLI)
- IDE paplašinājumi (VS Code, JetBrains u. c.)
Abonēšanas plāni
Uz laiku maksas plāniem būs dubultas parastās ātruma ierobežojumi.
API cenas
Palaišanas brīdī OpenAI nav publiskojis oficiālas API cenas GPT-5.3-Codex. API piekļuve tiek aprakstīta kā "drīz tiks palaista" un "nākamajās nedēļās."
Piemēram, iepriekšējā modeļa (GPT-5.2-Codex) API cenas ir:
Infrastruktūra
GPT-5.3-Codex tika izstrādāts, apmācīts un darbināts uz NVIDIA GB200 NVL72 sistēmām — apliecinot ciešo OpenAI un NVIDIA sadarbību AI spēju robežu paplašināšanā.
Salīdzinājums ar konkurentiem
GPT-5.3-Codex izlaide sekoja tikai dažas minūtes pēc Anthropic paziņojuma par Claude Opus 4.6, ļaujot veikt tūlītēju abu modeļu salīdzinājumu.
GPT-5.3-Codex stiprās puses
- Terminal-Bench 2.0: 77,3 pret Opus 4.6 65,4 (+18,6% priekšrocība)
- "Augsta uzticamība, zema variācija" dizaina filozofija
- Pašizveides spēja (palīdzēja izveidot sevi)
- Pirmā "Augstas spējas" kiberdrošības klasifikācija
Claude Opus 4.6 stiprās puses
- 1 miljona tokenu konteksta logs (būtiski lielāks)
- Aģentu komandas sadarbības funkcionalitāte
- Plašāka pielietojamība zināšanu darba scenārijos
- Augstākas radošuma temperatūra (vairāk personības)
Dizaina filozofijas atšķirības
Plašāks skats
GPT-5.3-Codex ir vairāk nekā tikai pakāpenisks uzlabojums — tā ir kvantitatīva pāreja uz vispārējiem aģentiem, kas spēj domāt, būvēt un īstenot visos reālās pasaules tehniskajos uzdevumos.
No koda aģenta līdz datora aģentam
OpenAI skaidri formulē šo attīstību: "Codex pāriet no koda rakstīšanas uz tā izmantošanu kā rīku, lai vadītu datoru un pilnībā pabeigtu darba uzdevumus."
Tas ir dziļš pagrieziens. Tas, kas sākās kā „labākā kodēšanas aģenta” meklējums, ir kļuvis par pamatu daudz vispārīgākam sadarbības partnerim datorā — paplašinot gan to, kas var būvēt, gan to, kas ar AI ir iespējams.
AI izstrādes paātrināšana
Fakts, ka GPT-5.3-Codex palīdzēja izveidot sevi, ir priekšstats par nākotni. Kā OpenAI pētnieki atzīmē: "daudzi OpenAI pētnieki un inženieri šodien apraksta savu darbu kā fundamentāli atšķirīgu no tā, kāds tas bija tikai pirms diviem mēnešiem."
Tas liecina, ka mēs ieejam paātrinātu atdevi posmā mākslīgā intelekta attīstībā, kur katra modeļa paaudze palīdz izveidot nākamo — potenciāli saīsinot laika grafikus no gadiem līdz mēnešiem.
Sekas izstrādātājiem
Programmatūras izstrādātājiem nozīme ir nozīmīga:
- Ātrāki izstrādes cikli — AI pārvalda vairāk rutīnas darbu
- Augstāka līmeņa abstrakcija — izstrādātāji var koncentrēties uz arhitektūru un dizainu
- Interaktīva sadarbība — mazāk kā instrumenta izmantošana, vairāk kā darba kopā ar komandas biedru
- Jaunas spējas — uzdevumi, kam iepriekš bija vajadzīgas specializētas zināšanas, tagad pieejami plašāk
Sekas uzņēmumiem
Uzņēmumiem GPT-5.3-Codex nozīmē:
- Pieaugusi produktivitāte — vairāk darba paveikts īsākā laikā
- Zemākas barjeras — mazāk specializētu prasmju nepieciešams noteiktiem uzdevumiem
- Jaunas drošības apsvērumi — "augstas spējas" kiberdrošības klasifikācija prasa rūpīgu pārvaldību
- Konkurētspējas priekšrocības — agrīna jaudīgas agentiskās AI pieņemšana
Secinājums
GPT-5.3-Codex ir nozīmīgs mākslīgā intelekta sasniegums, kas apvieno:
- Augstākā līmeņa kodēšanas veiktspēju
- Attīstītas agentiskās spējas
- Pašuzlabošanos (tas palīdzēja izveidot sevi)
- Reāla pasaules datora lietošanu
Tas, ka modelis bija būtisks savas izveides procesā, ir gan tehnisks sasniegums, gan metafora tam, kur AI attīstība virzās. Modeļi kļūst ne tikai par rīkiem, ko izmantojam — tie kļūst par partneriem radošajā un izstrādes procesā.
Vienlaicīga izlaiduma kopā ar Claude Opus 4.6 tikai dažas minūtes pēc tam norāda uz intensīvu konkurenci AI jomā. Bet vēl nozīmīgāk — tas signalizē, ka esam iekļuvuši jaunā AI spēju posmā, kur aģenti uzticami spēj pārvaldīt sarežģītus, ilgtermiņa uzdevumus visā profesionālās darbības spektrā.
Kā to raksta OpenAI: "Kas sākās kā vēlme būt labākajam kodēšanas aģentam, ir kļuvusi par pamatu vispārīgākam sadarbības partnerim datorā."
Tagad jautājums vairs nav tikai, ko šie modeļi spēj — bet ko mēs izvēlēsimies ar tiem radīt.
Avoti
Brīdinājums: Šis raksts balstās uz informāciju, kas bija pieejama līdz 2026. gada 6. februārim. Specifikācijas, cenas un pieejamība var mainīties. Lūdzu, skatiet oficiālos OpenAI dokumentus, lai iegūtu aktuālāko informāciju.