Įvadas

2026 m. vasario 5 d. OpenAI paskelbė apie GPT-5.3-Codex – pažangiausią iki šiol agentinį programavimo modelį. Šis leidimas yra reikšmingas dirbtinio intelekto progreso etapas – ne tik dėl įspūdingų techninių galimybių, bet ir todėl, kad tai pirmasis modelis, kuris buvo svarbus savo paties kūrimo procese.

GPT-5.3-Codex žymi esminį pokytį nuo kodo rašymo įrankio iki interaktyvaus DI bendradarbio, galinčio valdyti ilgo laikotarpio ir realaus pasaulio techninius darbus visame profesionalios kompiuterijos spektruose.

Kas išskiria GPT-5.3-Codex?

Tikras agentinis modelis

Skirtingai nuo tradicinių programavimo pagalbininkų, kurie tik generuoja kodo fragmentus, GPT-5.3-Codex yra suprojektuotas kaip „agentinis“ modelis. Tai reiškia, kad jis gali:

Išlaikyti kontekstą atliekant ilgalaikes užduotis, trunkančias valandas ar net dienas

Autonomiškai naudotis įrankiais, įskaitant komandų eilutes, failų sistemas ir kūrimo aplinkas

Prisitaikyti ir iteruoti remdamasis realiu laiku gaunamu grįžtamuoju ryšiu, neprarandant darbo eigos vietos

Valdyti sudėtingus daugiapakopius darbo procesus, reikalaujančius tyrimų, planavimo ir vykdymo

Savo paties kūrimo pasiekimas

Galbūt įspūdingiausias GPT-5.3-Codex aspektas yra tai, kad Codex komanda naudojo ankstyvas modelio versijas, kad:

Trikčių šalinimą savo mokymo procese

Valdytų savo diegimą

Diagnozuotų testavimo rezultatus ir vertinimus

Optimizuotų infrastruktūrą galutiniam leidimui

Šis savireferencinis vystymosi ciklas rodo, kaip DI pradeda spartinti savo patobulinimus – OpenAI tyrėjai apibūdino tai kaip „smerkiant, kiek Codex sugebėjo pagreitinti savo vystymąsi.“

Veiklos patobulinimai

GPT-5.3-Codex yra 25 % greitesnis už savo pirmtaką (GPT-5.2-Codex), dėka patobulinimų OpenAI infrastruktūroje ir inferencijos sluoksnyje. Šis greičio pagerėjimas leidžia paprastesnę realaus laiko sąveiką ir spartesnius iteracijos ciklus.

Rezultatų metrika

GPT-5.3-Codex pasiekia pažangiausią našumą keliuose pagrindiniuose testuose, vertinančiuose programavimą, agentines galimybes ir realaus pasaulio kompiuterio naudojimą.

SWE-Bench Pro

SWE-Bench Pro yra kruopštus realaus pasaulio programinės įrangos inžinerijos vertinimas, apimantis keturias programavimo kalbas (Python, JavaScript, TypeScript ir Go). Skirtingai nuo savo pirmtako (SWE-Bench Verified), kuris testavo tik Python, SWE-Bench Pro yra sukurtas labiau atsparus klaidoms ir aktualus industrijai.

Terminal-Bench 2.0

13,3 % pagerėjimas Terminal-Bench 2.0 teste yra ypač reikšmingas. Šis testas matuoja terminalo įgūdžius, kurių reikia programavimo agentui – failų sistemų naršymą, komandų vykdymą ir kūrimo darbo srautų valdymą. Svarbu, kad GPT-5.3-Codex tai pasiekė naudodamas mažiau žetonų nei bet kuris ankstesnis modelis, todėl yra efektyvesnis.

OSWorld-Verified

26,5 % šuolis OSWorld-Verified parodo žymiai pagerėjusias kompiuterio naudojimo galimybes. OSWorld yra agentinis kompiuterio naudojimo testas, kuriame agentai turi atlikti produktyvumo užduotis vizualioje darbalaukio aplinkoje. Šis didelis pagerėjimas rodo, kad GPT-5.3-Codex yra kur kas geresnis realių sąsajų valdyme nei ankstesni modeliai.

Ne tik kodas: universalus agentas

Nors GPT-5.3-Codex pasižymi programavimu, jo galimybės žymiai viršija vien kodo generavimą. OpenAI jį pozicionuoja kaip agentą, galintį atlikti „beveik bet ką, ką programuotojai ir specialistai gali daryti kompiuteriu.“

Programinės įrangos gyvavimo ciklo palaikymas

Modelis sukurtas palaikyti visą programinės įrangos kūrimo gyvavimo ciklą:

Trikčių šalinimas - klaidų identifikavimas ir taisymas

Diegimas - leidimų ir infrastruktūros valdymas

Stebėjimas - našumo ir metrikų sekimas

PRD rašymas - produkto reikalavimų dokumentacija

Kopijos redagavimas - dokumentacijos ir rinkodaros tekstų kūrimas

Vartotojų tyrimai - analizė ir vartotojų atsiliepimų apdorojimas

Testavimas - testų rašymas ir vykdymas

Metrikų analizė - sprendimų priėmimas remiantis duomenimis

Žinių darbo galimybės

2025 m. OpenAI vertinimo teste GDPval, matuojančiame darbo užduočių atlikimą 44 profesijose, GPT-5.3-Codex atitinka GPT-5.2 našumą, atliekant tokius darbus kaip:

Skaidrių ruošimas ir pristatymai

Duomenų analizė skaičiuoklėse

Dokumentų valdymas ir organizavimas

Tyrimų atlikimas ir sintezė

Interneto svetainių kūrimo pavyzdys

Norėdama parodyti modelio galimybes, OpenAI paprašė GPT-5.3-Codex sukurti du pilnus žaidimus nuo nulio:

Lenktynių žaidimas (Codex programos paleidimo žaidimo 2 versija)

Nardymo žaidimas

Naudodamas tik „web game develop“ įgūdį ir bendrus papildomus užklausimus kaip „pataisyk klaidą“ ar „patobulink žaidimą“, GPT-5.3-Codex savarankiškai atliko milijonus iteracijų ir sukūrė aukštos kokybės bei patobulintus žaidimus.

Geresnis vartotojo ketinimų supratimas

Palyginti su GPT-5.2-Codex, naujasis modelis geriau supranta vartotojo ketinimus kuriant svetaines. Paprasti arba neaiškūs užklausimai dabar numato svetaines su:

Daugiau funkcionalumo

Pagrįstais numatytaisiais nustatymais

Produkcinėms sąlygoms tinkamomis funkcijomis

Pavyzdžiui, prašius sukurti kainų pristatymo puslapį, GPT-5.3-Codex automatiškai parodė metinį planą kaip su nuolaida mokamą mėnesinę kainą (aiškiai parodydamas nuolaidą) ir sukūrė automatiškai pakeičiamą atsakymų karuselę su trim skirtingais naudotojų atsiliepimais – tai lėmė pilnesnį ir profesionaliau atrodantį dizainą.

Interaktyvus bendradarbiavimas

Vienas svarbiausių vartotojo patirties patobulinimų yra galimybė valdyti modelį jo veikimo metu.

Realaus laiko sąveika

Vietoj to, kad lauktų galutinio rezultato, vartotojai dabar gali:

Uždavinėti klausimus vykdymo metu

Aptarti įvairius sprendimo būdus

Nukreipti prie specifinių sprendimų

Teikti atsiliepimus per užduoties eigą

GPT-5.3-Codex paaiškina savo veiksmus, atsako į grįžtamąjį ryšį ir palaiko nuolatinį vartotojo informavimą nuo pradžios iki pabaigos. Tai galima įjungti Codex programoje pasirinkus Nustatymai > Bendra > Tolimesnis elgesys.

Tai transformuoja patirtį iš paprasto komandų vykdymo su mašina į bendradarbiavimą su komandos nariu – esminis pakeitimas žmogaus ir DI sąveikoje.

Kibernetinio saugumo galimybės ir saugumas

GPT-5.3-Codex yra pirmasis modelis, kurį OpenAI klasifikuoja kaip „aukštos galios“ kibernetinio saugumo užduotims pagal jos parengtumo sistemą. Tai taip pat pirmasis modelis, tiesiogiai apmokytas atpažinti programinės įrangos spragas.

Dvipusio panaudojimo pobūdis

Kadangi kibernetinis saugumas yra dvipusis (naudojamas tiek gynybai, tiek puolimui), OpenAI taiko atsargų požiūrį:

Nėra aiškių įrodymų, jog modelis gali automatizuoti kibernetinius išpuolius visoje grandinėje

Įdiegia visapusišką kibernetinio saugumo saugumo sluoksnį

Įgyvendina saugumo mokymus ir automatizuotą stebėjimą

Reikalauja patikimo prieigos prie pažangių funkcijų

Patikima prieiga kibernetiniams darbams

OpenAI pradeda Patikimos prieigos kibernetiniams darbams pilotinę programą, kuri skirta:

Pagreitinti kibernetinio gynybos tyrimus

Prioritetiškai suteikti įrankius gynybininkams

Remti ekosistemos atsparumą

10 mln. USD įsipareigojimas

Plėtojant 2023 m. 1 mln. USD kibernetinio saugumo dotacijų programą, OpenAI skiria 10 mln. USD API kreditų sparčiam kibernetinio gynybos vystymui, ypač:

Atvirojo kodo programinei įrangai

Kritinėms infrastruktūros sistemoms

Gero valios saugumo tyrimams

Aardvark saugumo agentas

OpenAI plečia privati beta Aardvark – savo saugumo tyrimų agentą kaip pirmąjį pasiūlymą Codex saugumo produktų ir įrankių rinkinyje. Taip pat bendradarbiauja su atviro kodo projektais, teikdamas nemokamą kodo bazės skenavimą plačiai naudojamiems projektams, tokiems kaip Next.js.

Kaip OpenAI panaudojo Codex kuriant Codex

GPT-5.3-Codex kūrimas yra įdomus dirbtinio intelekto spartinamo tyrimo pavyzdys.

Tyrėjų komandos panaudojimo atvejai

Tyrėjų komanda naudojo ankstyvas GPT-5.3-Codex versijas, kad:

Stebėtų ir šalintų trikdžius mokymo proceso metu

Sekų modelius mokymosi metu

Atliekant gilias sąveikos kokybės analizės

Siūlytų pataisas ir kurtų išsamius įrankius žmonių tyrėjams

Tiksliai suprastų, kaip modelio elgsena skiriasi nuo ankstesnių modelių

Inžinerinės komandos panaudojimo atvejai

Inžinerijos komanda naudojo Codex, kad:

Optimizuotų ir prisitaikytų GPT-5.3-Codex aplinką

Identifikuotų konteksto rodymo klaidas veikiančias vartotojus

Nustatytų žemos talpyklos pataikymo priežastis

Dinaminiu būdu skalautų GPU klasterius prie eismo pikų

Užtikrintų stabilų delsos lygį paleidimo metu

Duomenų mokslo panaudojimo atvejai

Alfa testavimo metu duomenų mokslininkas dirbo su GPT-5.3-Codex, kad:

Kurtų regex klasifikatorius, vertinančius reikšminius aiškinimus, vartotojo atsakymus ir užduočių pažangą

Sklandžiai vykdytų šiuos klasifikatorius per visas sesijų žurnalines bylas

Kurtų naujus duomenų srautus ir vizualizuotų rezultatus išsamiau nei standartiniai skydeliai

Bendrai analizuoja rezultatus, Codex apibendrintų pagrindines įžvalgas iš tūkstančių duomenų taškų per mažiau nei tris minutes

Produktyvumo pranašumai

Rezultatas? Su Codex dirbę žmonės jautėsi laimingesni, nes agentas:

Geriau suprato jų ketinimus

Padarė daugiau pažangos per žingsnį

Klausė mažiau aiškinamųjų klausimų

Prieinamumas ir kainodara

Kaip prieiti

GPT-5.3-Codex yra iš karto prieinamas mokantiems ChatGPT naudotojams visose Codex platformose:

Darbalaukio programa (macOS ir Windows)

Komandinės eilutės sąsaja (CLI)

IDE priedai (VS Code, JetBrains ir kt.)

Tinklo sąsaja

Prenumeratos planai

Ribotą laiką mokamieji planai gaus dvigubai didesnius įprastus greičio apribojimus.

API kainodara

Leidimo metu OpenAI dar nepaskelbė oficialios API kainodaros GPT-5.3-Codex. API prieiga „bus platinama artimiausiomis savaitėmis.“

Palyginimui, dabartinė API kainodara ankstesniam modeliui (GPT-5.2-Codex) yra:

Infrastruktūra

GPT-5.3-Codex buvo kartu kuriamas, mokomas ir diegiamas NVIDIA GB200 NVL72 sistemose – tai liudija glaudų bendradarbiavimą tarp OpenAI ir NVIDIA ruošiant DI galimybių ribas.

Palyginimas su konkurentais

GPT-5.3-Codex pristatymas įvyko vos per kelias minutes po Anthropic pranešimo apie Claude Opus 4.6, sukuriant tiesioginį modelių palyginimą.

GPT-5.3-Codex stipriosios pusės

Terminal-Bench 2.0: 77.3 prieš Opus 4.6 65.4 (+18,6 % pranašumas)

25 % greitesnis veikimas

„Aukštas patikimumas, mažas svyravimas“ dizaino filosofija

Savaitės galimybė savarankiškai tobulėti (padėjo sukurti save)

Pirmoji „aukštos galios“ kibernetinio saugumo klasifikacija

Claude Opus 4.6 stipriosios pusės

Milijono žetonų konteksto langas (žymiai didesnis)

Agentų komandos bendradarbiavimo funkcionalumas

Didesnis universalumas žinių darbe

Aukštesnė kūrybiškumo temperatūra (daugiau asmenybės)

Dizaino filosofijos skirtumai

Bendresnis vaizdas

GPT-5.3-Codex yra ne tik palaipsniškas patobulinimas – tai esminis žingsnis link universalios paskirties agentų, galinčių samprotauti, kurti ir vykdyti visą realaus pasaulio techninį darbų spektrą.

Nuo kodo agento iki kompiuterio agento

OpenAI aiškiai apibrėžia šią evoliuciją: „Codex žengia toliau už kodo rašymą ir naudoja jį kaip įrankį kompiuteriui valdyti ir užduotims atlikti nuo pradžios iki pabaigos.“

Tai gilus pokytis. Tai, kas pradžioje buvo skirta būti „geriausiu programavimo agentu“, tapo pagrindu universalios paskirties bendradarbiui kompiuteryje – plečiant galimybes tiek kūrėjams, tiek DI galimybėms.

DI vystymo spartinimas

Faktas, kad GPT-5.3-Codex padėjo sukurti save, yra pranašas ateičiai. Kaip pastebi OpenAI tyrėjai, „daugelis jų darbuotojų šiandien apibūdina savo darbą kaip esminiai skirtingą nei prieš du mėnesius.“

Tai reiškia, kad įžengiame į greitėjančios grąžos poveikio etapą DI vystyme, kai kiekviena modelių karta padeda sukurti kitą – potencialiai sumažinant kūrimo laiką nuo metų iki mėnesių.

Pasekmės kūrėjams

Programinės įrangos kūrėjams šios pasekmės yra reikšmingos:

Greitesni vystymo ciklai - DI atlieka daugiau rutininio darbo

Aukštesnio lygio abstrakcija - kūrėjai gali koncentruotis į architektūrą ir dizainą

Interaktyvus bendradarbiavimas - mažiau panašu į įrankio naudojimą, labiau – darbą su komandos nariu

Naujos galimybės - užduotys, kurioms anksčiau reikėjo specializuotų žinių, dabar prieinamos visiems

Pasekmės verslams

Verslams GPT-5.3-Codex reiškia:

Padidintą produktyvumą - daugiau užduočių atliekama trumpesniu laiku

Mažesnius barjerus - mažiau specializuotų įgūdžių reikalinga tam tikroms užduotims

Naujas saugumo svarstymus - „aukštos galios“ kibernetinio saugumo klasifikacija reikalauja atsakingo valdymo

Konkurencinį pranašumą - ankstyvas galingo agentinio DI priėmimas

Išvada

GPT-5.3-Codex yra svarbus dirbtinio intelekto pasiekimas. Jis apjungia:

Pažangiausią programavimo našumą

Išplėstines agentines galimybes

Interaktyvų bendradarbiavimą

Savarankišką tobulėjimą (padėjo sukurti save)

Realų kompiuterio naudojimą

Tai, kad modelis padėjo sukurti pats save, yra tiek techninis pasiekimas, tiek metafora DI ateičiai. Spartėjant modeliams, jie tampa ne tik įrankiais, bet ir partneriais kūrybos bei vystymo procesuose.

Simultaniškas išleidimas kartu su Claude Opus 4.6, vos per kelias minutes, parodo intensyvų konkurencijos lygį DI srityje. Dar svarbiau, tai žymi naują DI galimybių etapą – kai agentai gali patikimai valdyti sudėtingas, ilgo laikotarpio užduotis visame profesionalaus kompiuterio darbo spektre.

Kaip sako OpenAI: „Tai, kas prasidėjo kaip siekis būti geriausiu programavimo agentu, tapo pagrindu universaliam bendradarbiui kompiuteryje.“

Dabar klausimas ne tik ką šie modeliai gali daryti – bet ką mes pasirinksime su jais sukurti.

Šaltiniai

GPT-5.3-Codex pristatymas – oficialus OpenAI pranešimas

GPT-5.3-Codex sistemos kortelė – OpenAI

GPT 5.3 Codex kainodara, testai ir funkcijos – eesel AI

OpenAI: naujas programavimo modelis GPT-5.3-Codex sukūrė pats save – Mashable

Su GPT-5.3-Codex OpenAI pozicionuoja Codex ne tik kaip kodo rašymo įrankį – Ars Technica

OpenAI paleidžia naują agentinį programavimo modelį vos po kelių minučių, kai Anthropic pristato savo – TechCrunch

Opus 4.6 prieš CODEX 5.3 – pirmasis realus palyginimas – Reddit

GPT 5.3 Codex prieš Opus 4.6: didelis susiliejimas – Every

OpenAI platformos kainodara

Codex kainodara

SWE-Bench oficiali lyderių lentelė

Atsakomybės apribojimas: Šis straipsnis remiasi informacija, galiojusia 2026 m. vasario 6 d. Specifikacijos, kainos ir prieinamumas gali keistis. Prašome pasitikrinti oficialią OpenAI dokumentaciją dėl naujausios informacijos.

GPT-5.3-Codex: galingiausias OpenAI agentinis kodavimo modelis