Įvadas
2026 m. vasario 5 d. OpenAI paskelbė apie GPT-5.3-Codex – pažangiausią iki šiol agentinį programavimo modelį. Šis leidimas yra reikšmingas dirbtinio intelekto progreso etapas – ne tik dėl įspūdingų techninių galimybių, bet ir todėl, kad tai pirmasis modelis, kuris buvo svarbus savo paties kūrimo procese.
GPT-5.3-Codex žymi esminį pokytį nuo kodo rašymo įrankio iki interaktyvaus DI bendradarbio, galinčio valdyti ilgo laikotarpio ir realaus pasaulio techninius darbus visame profesionalios kompiuterijos spektruose.
Kas išskiria GPT-5.3-Codex?
Tikras agentinis modelis
Skirtingai nuo tradicinių programavimo pagalbininkų, kurie tik generuoja kodo fragmentus, GPT-5.3-Codex yra suprojektuotas kaip „agentinis“ modelis. Tai reiškia, kad jis gali:
- Išlaikyti kontekstą atliekant ilgalaikes užduotis, trunkančias valandas ar net dienas
- Autonomiškai naudotis įrankiais, įskaitant komandų eilutes, failų sistemas ir kūrimo aplinkas
- Prisitaikyti ir iteruoti remdamasis realiu laiku gaunamu grįžtamuoju ryšiu, neprarandant darbo eigos vietos
- Valdyti sudėtingus daugiapakopius darbo procesus, reikalaujančius tyrimų, planavimo ir vykdymo
Savo paties kūrimo pasiekimas
Galbūt įspūdingiausias GPT-5.3-Codex aspektas yra tai, kad Codex komanda naudojo ankstyvas modelio versijas, kad:
- Trikčių šalinimą savo mokymo procese
- Diagnozuotų testavimo rezultatus ir vertinimus
- Optimizuotų infrastruktūrą galutiniam leidimui
Šis savireferencinis vystymosi ciklas rodo, kaip DI pradeda spartinti savo patobulinimus – OpenAI tyrėjai apibūdino tai kaip „smerkiant, kiek Codex sugebėjo pagreitinti savo vystymąsi.“
Veiklos patobulinimai
GPT-5.3-Codex yra 25 % greitesnis už savo pirmtaką (GPT-5.2-Codex), dėka patobulinimų OpenAI infrastruktūroje ir inferencijos sluoksnyje. Šis greičio pagerėjimas leidžia paprastesnę realaus laiko sąveiką ir spartesnius iteracijos ciklus.
Rezultatų metrika
GPT-5.3-Codex pasiekia pažangiausią našumą keliuose pagrindiniuose testuose, vertinančiuose programavimą, agentines galimybes ir realaus pasaulio kompiuterio naudojimą.
SWE-Bench Pro
SWE-Bench Pro yra kruopštus realaus pasaulio programinės įrangos inžinerijos vertinimas, apimantis keturias programavimo kalbas (Python, JavaScript, TypeScript ir Go). Skirtingai nuo savo pirmtako (SWE-Bench Verified), kuris testavo tik Python, SWE-Bench Pro yra sukurtas labiau atsparus klaidoms ir aktualus industrijai.
Terminal-Bench 2.0
13,3 % pagerėjimas Terminal-Bench 2.0 teste yra ypač reikšmingas. Šis testas matuoja terminalo įgūdžius, kurių reikia programavimo agentui – failų sistemų naršymą, komandų vykdymą ir kūrimo darbo srautų valdymą. Svarbu, kad GPT-5.3-Codex tai pasiekė naudodamas mažiau žetonų nei bet kuris ankstesnis modelis, todėl yra efektyvesnis.
OSWorld-Verified
26,5 % šuolis OSWorld-Verified parodo žymiai pagerėjusias kompiuterio naudojimo galimybes. OSWorld yra agentinis kompiuterio naudojimo testas, kuriame agentai turi atlikti produktyvumo užduotis vizualioje darbalaukio aplinkoje. Šis didelis pagerėjimas rodo, kad GPT-5.3-Codex yra kur kas geresnis realių sąsajų valdyme nei ankstesni modeliai.
Ne tik kodas: universalus agentas
Nors GPT-5.3-Codex pasižymi programavimu, jo galimybės žymiai viršija vien kodo generavimą. OpenAI jį pozicionuoja kaip agentą, galintį atlikti „beveik bet ką, ką programuotojai ir specialistai gali daryti kompiuteriu.“
Programinės įrangos gyvavimo ciklo palaikymas
Modelis sukurtas palaikyti visą programinės įrangos kūrimo gyvavimo ciklą:
- Trikčių šalinimas - klaidų identifikavimas ir taisymas
- Diegimas - leidimų ir infrastruktūros valdymas
- Stebėjimas - našumo ir metrikų sekimas
- PRD rašymas - produkto reikalavimų dokumentacija
- Kopijos redagavimas - dokumentacijos ir rinkodaros tekstų kūrimas
- Vartotojų tyrimai - analizė ir vartotojų atsiliepimų apdorojimas
- Testavimas - testų rašymas ir vykdymas
- Metrikų analizė - sprendimų priėmimas remiantis duomenimis
Žinių darbo galimybės
2025 m. OpenAI vertinimo teste GDPval, matuojančiame darbo užduočių atlikimą 44 profesijose, GPT-5.3-Codex atitinka GPT-5.2 našumą, atliekant tokius darbus kaip:
- Skaidrių ruošimas ir pristatymai
- Duomenų analizė skaičiuoklėse
- Dokumentų valdymas ir organizavimas
- Tyrimų atlikimas ir sintezė
Interneto svetainių kūrimo pavyzdys
Norėdama parodyti modelio galimybes, OpenAI paprašė GPT-5.3-Codex sukurti du pilnus žaidimus nuo nulio:
- Lenktynių žaidimas (Codex programos paleidimo žaidimo 2 versija)
Naudodamas tik „web game develop“ įgūdį ir bendrus papildomus užklausimus kaip „pataisyk klaidą“ ar „patobulink žaidimą“, GPT-5.3-Codex savarankiškai atliko milijonus iteracijų ir sukūrė aukštos kokybės bei patobulintus žaidimus.
Geresnis vartotojo ketinimų supratimas
Palyginti su GPT-5.2-Codex, naujasis modelis geriau supranta vartotojo ketinimus kuriant svetaines. Paprasti arba neaiškūs užklausimai dabar numato svetaines su:
- Pagrįstais numatytaisiais nustatymais
- Produkcinėms sąlygoms tinkamomis funkcijomis
Pavyzdžiui, prašius sukurti kainų pristatymo puslapį, GPT-5.3-Codex automatiškai parodė metinį planą kaip su nuolaida mokamą mėnesinę kainą (aiškiai parodydamas nuolaidą) ir sukūrė automatiškai pakeičiamą atsakymų karuselę su trim skirtingais naudotojų atsiliepimais – tai lėmė pilnesnį ir profesionaliau atrodantį dizainą.
Interaktyvus bendradarbiavimas
Vienas svarbiausių vartotojo patirties patobulinimų yra galimybė valdyti modelį jo veikimo metu.
Realaus laiko sąveika
Vietoj to, kad lauktų galutinio rezultato, vartotojai dabar gali:
- Uždavinėti klausimus vykdymo metu
- Aptarti įvairius sprendimo būdus
- Nukreipti prie specifinių sprendimų
- Teikti atsiliepimus per užduoties eigą
GPT-5.3-Codex paaiškina savo veiksmus, atsako į grįžtamąjį ryšį ir palaiko nuolatinį vartotojo informavimą nuo pradžios iki pabaigos. Tai galima įjungti Codex programoje pasirinkus Nustatymai > Bendra > Tolimesnis elgesys.
Tai transformuoja patirtį iš paprasto komandų vykdymo su mašina į bendradarbiavimą su komandos nariu – esminis pakeitimas žmogaus ir DI sąveikoje.
Kibernetinio saugumo galimybės ir saugumas
GPT-5.3-Codex yra pirmasis modelis, kurį OpenAI klasifikuoja kaip „aukštos galios“ kibernetinio saugumo užduotims pagal jos parengtumo sistemą. Tai taip pat pirmasis modelis, tiesiogiai apmokytas atpažinti programinės įrangos spragas.
Dvipusio panaudojimo pobūdis
Kadangi kibernetinis saugumas yra dvipusis (naudojamas tiek gynybai, tiek puolimui), OpenAI taiko atsargų požiūrį:
- Nėra aiškių įrodymų, jog modelis gali automatizuoti kibernetinius išpuolius visoje grandinėje
- Įdiegia visapusišką kibernetinio saugumo saugumo sluoksnį
- Įgyvendina saugumo mokymus ir automatizuotą stebėjimą
- Reikalauja patikimo prieigos prie pažangių funkcijų
Patikima prieiga kibernetiniams darbams
OpenAI pradeda Patikimos prieigos kibernetiniams darbams pilotinę programą, kuri skirta:
- Pagreitinti kibernetinio gynybos tyrimus
- Prioritetiškai suteikti įrankius gynybininkams
- Remti ekosistemos atsparumą
10 mln. USD įsipareigojimas
Plėtojant 2023 m. 1 mln. USD kibernetinio saugumo dotacijų programą, OpenAI skiria 10 mln. USD API kreditų sparčiam kibernetinio gynybos vystymui, ypač:
- Atvirojo kodo programinei įrangai
- Kritinėms infrastruktūros sistemoms
- Gero valios saugumo tyrimams
Aardvark saugumo agentas
OpenAI plečia privati beta Aardvark – savo saugumo tyrimų agentą kaip pirmąjį pasiūlymą Codex saugumo produktų ir įrankių rinkinyje. Taip pat bendradarbiauja su atviro kodo projektais, teikdamas nemokamą kodo bazės skenavimą plačiai naudojamiems projektams, tokiems kaip Next.js.
Kaip OpenAI panaudojo Codex kuriant Codex
GPT-5.3-Codex kūrimas yra įdomus dirbtinio intelekto spartinamo tyrimo pavyzdys.
Tyrėjų komandos panaudojimo atvejai
Tyrėjų komanda naudojo ankstyvas GPT-5.3-Codex versijas, kad:
- Stebėtų ir šalintų trikdžius mokymo proceso metu
- Sekų modelius mokymosi metu
- Atliekant gilias sąveikos kokybės analizės
- Siūlytų pataisas ir kurtų išsamius įrankius žmonių tyrėjams
- Tiksliai suprastų, kaip modelio elgsena skiriasi nuo ankstesnių modelių
Inžinerinės komandos panaudojimo atvejai
Inžinerijos komanda naudojo Codex, kad:
- Optimizuotų ir prisitaikytų GPT-5.3-Codex aplinką
- Identifikuotų konteksto rodymo klaidas veikiančias vartotojus
- Nustatytų žemos talpyklos pataikymo priežastis
- Dinaminiu būdu skalautų GPU klasterius prie eismo pikų
- Užtikrintų stabilų delsos lygį paleidimo metu
Duomenų mokslo panaudojimo atvejai
Alfa testavimo metu duomenų mokslininkas dirbo su GPT-5.3-Codex, kad:
- Kurtų regex klasifikatorius, vertinančius reikšminius aiškinimus, vartotojo atsakymus ir užduočių pažangą
- Sklandžiai vykdytų šiuos klasifikatorius per visas sesijų žurnalines bylas
- Kurtų naujus duomenų srautus ir vizualizuotų rezultatus išsamiau nei standartiniai skydeliai
- Bendrai analizuoja rezultatus, Codex apibendrintų pagrindines įžvalgas iš tūkstančių duomenų taškų per mažiau nei tris minutes
Produktyvumo pranašumai
Rezultatas? Su Codex dirbę žmonės jautėsi laimingesni, nes agentas:
- Geriau suprato jų ketinimus
- Padarė daugiau pažangos per žingsnį
- Klausė mažiau aiškinamųjų klausimų
Prieinamumas ir kainodara
Kaip prieiti
GPT-5.3-Codex yra iš karto prieinamas mokantiems ChatGPT naudotojams visose Codex platformose:
- Darbalaukio programa (macOS ir Windows)
- Komandinės eilutės sąsaja (CLI)
- IDE priedai (VS Code, JetBrains ir kt.)
Prenumeratos planai
Ribotą laiką mokamieji planai gaus dvigubai didesnius įprastus greičio apribojimus.
API kainodara
Leidimo metu OpenAI dar nepaskelbė oficialios API kainodaros GPT-5.3-Codex. API prieiga „bus platinama artimiausiomis savaitėmis.“
Palyginimui, dabartinė API kainodara ankstesniam modeliui (GPT-5.2-Codex) yra:
Infrastruktūra
GPT-5.3-Codex buvo kartu kuriamas, mokomas ir diegiamas NVIDIA GB200 NVL72 sistemose – tai liudija glaudų bendradarbiavimą tarp OpenAI ir NVIDIA ruošiant DI galimybių ribas.
Palyginimas su konkurentais
GPT-5.3-Codex pristatymas įvyko vos per kelias minutes po Anthropic pranešimo apie Claude Opus 4.6, sukuriant tiesioginį modelių palyginimą.
GPT-5.3-Codex stipriosios pusės
- Terminal-Bench 2.0: 77.3 prieš Opus 4.6 65.4 (+18,6 % pranašumas)
- „Aukštas patikimumas, mažas svyravimas“ dizaino filosofija
- Savaitės galimybė savarankiškai tobulėti (padėjo sukurti save)
- Pirmoji „aukštos galios“ kibernetinio saugumo klasifikacija
Claude Opus 4.6 stipriosios pusės
- Milijono žetonų konteksto langas (žymiai didesnis)
- Agentų komandos bendradarbiavimo funkcionalumas
- Didesnis universalumas žinių darbe
- Aukštesnė kūrybiškumo temperatūra (daugiau asmenybės)
Dizaino filosofijos skirtumai
Bendresnis vaizdas
GPT-5.3-Codex yra ne tik palaipsniškas patobulinimas – tai esminis žingsnis link universalios paskirties agentų, galinčių samprotauti, kurti ir vykdyti visą realaus pasaulio techninį darbų spektrą.
Nuo kodo agento iki kompiuterio agento
OpenAI aiškiai apibrėžia šią evoliuciją: „Codex žengia toliau už kodo rašymą ir naudoja jį kaip įrankį kompiuteriui valdyti ir užduotims atlikti nuo pradžios iki pabaigos.“
Tai gilus pokytis. Tai, kas pradžioje buvo skirta būti „geriausiu programavimo agentu“, tapo pagrindu universalios paskirties bendradarbiui kompiuteryje – plečiant galimybes tiek kūrėjams, tiek DI galimybėms.
DI vystymo spartinimas
Faktas, kad GPT-5.3-Codex padėjo sukurti save, yra pranašas ateičiai. Kaip pastebi OpenAI tyrėjai, „daugelis jų darbuotojų šiandien apibūdina savo darbą kaip esminiai skirtingą nei prieš du mėnesius.“
Tai reiškia, kad įžengiame į greitėjančios grąžos poveikio etapą DI vystyme, kai kiekviena modelių karta padeda sukurti kitą – potencialiai sumažinant kūrimo laiką nuo metų iki mėnesių.
Pasekmės kūrėjams
Programinės įrangos kūrėjams šios pasekmės yra reikšmingos:
- Greitesni vystymo ciklai - DI atlieka daugiau rutininio darbo
- Aukštesnio lygio abstrakcija - kūrėjai gali koncentruotis į architektūrą ir dizainą
- Interaktyvus bendradarbiavimas - mažiau panašu į įrankio naudojimą, labiau – darbą su komandos nariu
- Naujos galimybės - užduotys, kurioms anksčiau reikėjo specializuotų žinių, dabar prieinamos visiems
Pasekmės verslams
Verslams GPT-5.3-Codex reiškia:
- Padidintą produktyvumą - daugiau užduočių atliekama trumpesniu laiku
- Mažesnius barjerus - mažiau specializuotų įgūdžių reikalinga tam tikroms užduotims
- Naujas saugumo svarstymus - „aukštos galios“ kibernetinio saugumo klasifikacija reikalauja atsakingo valdymo
- Konkurencinį pranašumą - ankstyvas galingo agentinio DI priėmimas
Išvada
GPT-5.3-Codex yra svarbus dirbtinio intelekto pasiekimas. Jis apjungia:
- Pažangiausią programavimo našumą
- Išplėstines agentines galimybes
- Interaktyvų bendradarbiavimą
- Savarankišką tobulėjimą (padėjo sukurti save)
- Realų kompiuterio naudojimą
Tai, kad modelis padėjo sukurti pats save, yra tiek techninis pasiekimas, tiek metafora DI ateičiai. Spartėjant modeliams, jie tampa ne tik įrankiais, bet ir partneriais kūrybos bei vystymo procesuose.
Simultaniškas išleidimas kartu su Claude Opus 4.6, vos per kelias minutes, parodo intensyvų konkurencijos lygį DI srityje. Dar svarbiau, tai žymi naują DI galimybių etapą – kai agentai gali patikimai valdyti sudėtingas, ilgo laikotarpio užduotis visame profesionalaus kompiuterio darbo spektre.
Kaip sako OpenAI: „Tai, kas prasidėjo kaip siekis būti geriausiu programavimo agentu, tapo pagrindu universaliam bendradarbiui kompiuteryje.“
Dabar klausimas ne tik ką šie modeliai gali daryti – bet ką mes pasirinksime su jais sukurti.
Šaltiniai
Atsakomybės apribojimas: Šis straipsnis remiasi informacija, galiojusia 2026 m. vasario 6 d. Specifikacijos, kainos ir prieinamumas gali keistis. Prašome pasitikrinti oficialią OpenAI dokumentaciją dėl naujausios informacijos.