Sider.ai
  • Pokalbis
  • Wisebase
  • Įrankiai
  • Pratęsimas
  • Klientai
  • Kainodara
Parsisiųsti dabar
Prisijungti

Mokykitės greičiau, mąstykite giliau ir augkite protingiau su Sider.

Produktai
Programėlės
  • Plėtiniai
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Įrankiai
  • Interneto kūrėjasNew
  • AI skaidrėsNew
  • AI esė rašytojas
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI vaizdų generatorius
  • Italų smegenų puvimo generatorius
  • Fono šalinimas
  • Fono keitiklis
  • Nuotraukų trintukas
  • Teksto šalinimas
  • Inpaint
  • Vaizdo didinimas
  • Sukurti
  • AI vertėjas
  • Vaizdo vertėjas
  • PDF vertėjas
Sider
  • Susisiekite su mumis
  • Pagalbos centras
  • Atsisiųsti
  • Kainodara
  • Švietimo planas
  • Kas naujo
  • Tinklaraštis
  • Bendruomenė
  • Partneriai
  • Partnerystė
  • Pakviesti
©2026 Visos teisės saugomos
Naudojimo sąlygos
Privatumo politika
  • Pagrindinis puslapis
  • Dienoraštis
  • AI Naujienos
  • GPT-5.3-Codex: galingiausias OpenAI agentinis kodavimo modelis

GPT-5.3-Codex: galingiausias OpenAI agentinis kodavimo modelis

Atnaujinta 2026 m. vasario 6 d.

1 min


Įvadas

2026 m. vasario 5 d. OpenAI paskelbė apie GPT-5.3-Codex – pažangiausią iki šiol agentinį programavimo modelį. Šis leidimas yra reikšmingas dirbtinio intelekto progreso etapas – ne tik dėl įspūdingų techninių galimybių, bet ir todėl, kad tai pirmasis modelis, kuris buvo svarbus savo paties kūrimo procese.
GPT-5.3-Codex žymi esminį pokytį nuo kodo rašymo įrankio iki interaktyvaus DI bendradarbio, galinčio valdyti ilgo laikotarpio ir realaus pasaulio techninius darbus visame profesionalios kompiuterijos spektruose.

Kas išskiria GPT-5.3-Codex?

Tikras agentinis modelis

Skirtingai nuo tradicinių programavimo pagalbininkų, kurie tik generuoja kodo fragmentus, GPT-5.3-Codex yra suprojektuotas kaip „agentinis“ modelis. Tai reiškia, kad jis gali:
  • Išlaikyti kontekstą atliekant ilgalaikes užduotis, trunkančias valandas ar net dienas
  • Autonomiškai naudotis įrankiais, įskaitant komandų eilutes, failų sistemas ir kūrimo aplinkas
  • Prisitaikyti ir iteruoti remdamasis realiu laiku gaunamu grįžtamuoju ryšiu, neprarandant darbo eigos vietos
  • Valdyti sudėtingus daugiapakopius darbo procesus, reikalaujančius tyrimų, planavimo ir vykdymo

Savo paties kūrimo pasiekimas

Galbūt įspūdingiausias GPT-5.3-Codex aspektas yra tai, kad Codex komanda naudojo ankstyvas modelio versijas, kad:
  • Trikčių šalinimą savo mokymo procese
  • Valdytų savo diegimą
  • Diagnozuotų testavimo rezultatus ir vertinimus
  • Optimizuotų infrastruktūrą galutiniam leidimui
Šis savireferencinis vystymosi ciklas rodo, kaip DI pradeda spartinti savo patobulinimus – OpenAI tyrėjai apibūdino tai kaip „smerkiant, kiek Codex sugebėjo pagreitinti savo vystymąsi.“

Veiklos patobulinimai

GPT-5.3-Codex yra 25 % greitesnis už savo pirmtaką (GPT-5.2-Codex), dėka patobulinimų OpenAI infrastruktūroje ir inferencijos sluoksnyje. Šis greičio pagerėjimas leidžia paprastesnę realaus laiko sąveiką ir spartesnius iteracijos ciklus.

Rezultatų metrika

GPT-5.3-Codex pasiekia pažangiausią našumą keliuose pagrindiniuose testuose, vertinančiuose programavimą, agentines galimybes ir realaus pasaulio kompiuterio naudojimą.

SWE-Bench Pro

SWE-Bench Pro yra kruopštus realaus pasaulio programinės įrangos inžinerijos vertinimas, apimantis keturias programavimo kalbas (Python, JavaScript, TypeScript ir Go). Skirtingai nuo savo pirmtako (SWE-Bench Verified), kuris testavo tik Python, SWE-Bench Pro yra sukurtas labiau atsparus klaidoms ir aktualus industrijai.

Terminal-Bench 2.0

13,3 % pagerėjimas Terminal-Bench 2.0 teste yra ypač reikšmingas. Šis testas matuoja terminalo įgūdžius, kurių reikia programavimo agentui – failų sistemų naršymą, komandų vykdymą ir kūrimo darbo srautų valdymą. Svarbu, kad GPT-5.3-Codex tai pasiekė naudodamas mažiau žetonų nei bet kuris ankstesnis modelis, todėl yra efektyvesnis.

OSWorld-Verified

26,5 % šuolis OSWorld-Verified parodo žymiai pagerėjusias kompiuterio naudojimo galimybes. OSWorld yra agentinis kompiuterio naudojimo testas, kuriame agentai turi atlikti produktyvumo užduotis vizualioje darbalaukio aplinkoje. Šis didelis pagerėjimas rodo, kad GPT-5.3-Codex yra kur kas geresnis realių sąsajų valdyme nei ankstesni modeliai.

Ne tik kodas: universalus agentas

Nors GPT-5.3-Codex pasižymi programavimu, jo galimybės žymiai viršija vien kodo generavimą. OpenAI jį pozicionuoja kaip agentą, galintį atlikti „beveik bet ką, ką programuotojai ir specialistai gali daryti kompiuteriu.“

Programinės įrangos gyvavimo ciklo palaikymas

Modelis sukurtas palaikyti visą programinės įrangos kūrimo gyvavimo ciklą:
  • Trikčių šalinimas - klaidų identifikavimas ir taisymas
  • Diegimas - leidimų ir infrastruktūros valdymas
  • Stebėjimas - našumo ir metrikų sekimas
  • PRD rašymas - produkto reikalavimų dokumentacija
  • Kopijos redagavimas - dokumentacijos ir rinkodaros tekstų kūrimas
  • Vartotojų tyrimai - analizė ir vartotojų atsiliepimų apdorojimas
  • Testavimas - testų rašymas ir vykdymas
  • Metrikų analizė - sprendimų priėmimas remiantis duomenimis

Žinių darbo galimybės

2025 m. OpenAI vertinimo teste GDPval, matuojančiame darbo užduočių atlikimą 44 profesijose, GPT-5.3-Codex atitinka GPT-5.2 našumą, atliekant tokius darbus kaip:
  • Skaidrių ruošimas ir pristatymai
  • Duomenų analizė skaičiuoklėse
  • Dokumentų valdymas ir organizavimas
  • Tyrimų atlikimas ir sintezė

Interneto svetainių kūrimo pavyzdys

Norėdama parodyti modelio galimybes, OpenAI paprašė GPT-5.3-Codex sukurti du pilnus žaidimus nuo nulio:
  • Lenktynių žaidimas (Codex programos paleidimo žaidimo 2 versija)
  • Nardymo žaidimas
Naudodamas tik „web game develop“ įgūdį ir bendrus papildomus užklausimus kaip „pataisyk klaidą“ ar „patobulink žaidimą“, GPT-5.3-Codex savarankiškai atliko milijonus iteracijų ir sukūrė aukštos kokybės bei patobulintus žaidimus.

Geresnis vartotojo ketinimų supratimas

Palyginti su GPT-5.2-Codex, naujasis modelis geriau supranta vartotojo ketinimus kuriant svetaines. Paprasti arba neaiškūs užklausimai dabar numato svetaines su:
  • Daugiau funkcionalumo
  • Pagrįstais numatytaisiais nustatymais
  • Produkcinėms sąlygoms tinkamomis funkcijomis
Pavyzdžiui, prašius sukurti kainų pristatymo puslapį, GPT-5.3-Codex automatiškai parodė metinį planą kaip su nuolaida mokamą mėnesinę kainą (aiškiai parodydamas nuolaidą) ir sukūrė automatiškai pakeičiamą atsakymų karuselę su trim skirtingais naudotojų atsiliepimais – tai lėmė pilnesnį ir profesionaliau atrodantį dizainą.

Interaktyvus bendradarbiavimas

Vienas svarbiausių vartotojo patirties patobulinimų yra galimybė valdyti modelį jo veikimo metu.

Realaus laiko sąveika

Vietoj to, kad lauktų galutinio rezultato, vartotojai dabar gali:
  • Uždavinėti klausimus vykdymo metu
  • Aptarti įvairius sprendimo būdus
  • Nukreipti prie specifinių sprendimų
  • Teikti atsiliepimus per užduoties eigą
GPT-5.3-Codex paaiškina savo veiksmus, atsako į grįžtamąjį ryšį ir palaiko nuolatinį vartotojo informavimą nuo pradžios iki pabaigos. Tai galima įjungti Codex programoje pasirinkus Nustatymai > Bendra > Tolimesnis elgesys.
Tai transformuoja patirtį iš paprasto komandų vykdymo su mašina į bendradarbiavimą su komandos nariu – esminis pakeitimas žmogaus ir DI sąveikoje.

Kibernetinio saugumo galimybės ir saugumas

GPT-5.3-Codex yra pirmasis modelis, kurį OpenAI klasifikuoja kaip „aukštos galios“ kibernetinio saugumo užduotims pagal jos parengtumo sistemą. Tai taip pat pirmasis modelis, tiesiogiai apmokytas atpažinti programinės įrangos spragas.

Dvipusio panaudojimo pobūdis

Kadangi kibernetinis saugumas yra dvipusis (naudojamas tiek gynybai, tiek puolimui), OpenAI taiko atsargų požiūrį:
  • Nėra aiškių įrodymų, jog modelis gali automatizuoti kibernetinius išpuolius visoje grandinėje
  • Įdiegia visapusišką kibernetinio saugumo saugumo sluoksnį
  • Įgyvendina saugumo mokymus ir automatizuotą stebėjimą
  • Reikalauja patikimo prieigos prie pažangių funkcijų

Patikima prieiga kibernetiniams darbams

OpenAI pradeda Patikimos prieigos kibernetiniams darbams pilotinę programą, kuri skirta:
  • Pagreitinti kibernetinio gynybos tyrimus
  • Prioritetiškai suteikti įrankius gynybininkams
  • Remti ekosistemos atsparumą

10 mln. USD įsipareigojimas

Plėtojant 2023 m. 1 mln. USD kibernetinio saugumo dotacijų programą, OpenAI skiria 10 mln. USD API kreditų sparčiam kibernetinio gynybos vystymui, ypač:
  • Atvirojo kodo programinei įrangai
  • Kritinėms infrastruktūros sistemoms
  • Gero valios saugumo tyrimams

Aardvark saugumo agentas

OpenAI plečia privati beta Aardvark – savo saugumo tyrimų agentą kaip pirmąjį pasiūlymą Codex saugumo produktų ir įrankių rinkinyje. Taip pat bendradarbiauja su atviro kodo projektais, teikdamas nemokamą kodo bazės skenavimą plačiai naudojamiems projektams, tokiems kaip Next.js.

Kaip OpenAI panaudojo Codex kuriant Codex

GPT-5.3-Codex kūrimas yra įdomus dirbtinio intelekto spartinamo tyrimo pavyzdys.

Tyrėjų komandos panaudojimo atvejai

Tyrėjų komanda naudojo ankstyvas GPT-5.3-Codex versijas, kad:
  • Stebėtų ir šalintų trikdžius mokymo proceso metu
  • Sekų modelius mokymosi metu
  • Atliekant gilias sąveikos kokybės analizės
  • Siūlytų pataisas ir kurtų išsamius įrankius žmonių tyrėjams
  • Tiksliai suprastų, kaip modelio elgsena skiriasi nuo ankstesnių modelių

Inžinerinės komandos panaudojimo atvejai

Inžinerijos komanda naudojo Codex, kad:
  • Optimizuotų ir prisitaikytų GPT-5.3-Codex aplinką
  • Identifikuotų konteksto rodymo klaidas veikiančias vartotojus
  • Nustatytų žemos talpyklos pataikymo priežastis
  • Dinaminiu būdu skalautų GPU klasterius prie eismo pikų
  • Užtikrintų stabilų delsos lygį paleidimo metu

Duomenų mokslo panaudojimo atvejai

Alfa testavimo metu duomenų mokslininkas dirbo su GPT-5.3-Codex, kad:
  • Kurtų regex klasifikatorius, vertinančius reikšminius aiškinimus, vartotojo atsakymus ir užduočių pažangą
  • Sklandžiai vykdytų šiuos klasifikatorius per visas sesijų žurnalines bylas
  • Kurtų naujus duomenų srautus ir vizualizuotų rezultatus išsamiau nei standartiniai skydeliai
  • Bendrai analizuoja rezultatus, Codex apibendrintų pagrindines įžvalgas iš tūkstančių duomenų taškų per mažiau nei tris minutes

Produktyvumo pranašumai

Rezultatas? Su Codex dirbę žmonės jautėsi laimingesni, nes agentas:
  • Geriau suprato jų ketinimus
  • Padarė daugiau pažangos per žingsnį
  • Klausė mažiau aiškinamųjų klausimų

Prieinamumas ir kainodara

Kaip prieiti

GPT-5.3-Codex yra iš karto prieinamas mokantiems ChatGPT naudotojams visose Codex platformose:
  • Darbalaukio programa (macOS ir Windows)
  • Komandinės eilutės sąsaja (CLI)
  • IDE priedai (VS Code, JetBrains ir kt.)
  • Tinklo sąsaja

Prenumeratos planai

Ribotą laiką mokamieji planai gaus dvigubai didesnius įprastus greičio apribojimus.

API kainodara

Leidimo metu OpenAI dar nepaskelbė oficialios API kainodaros GPT-5.3-Codex. API prieiga „bus platinama artimiausiomis savaitėmis.“
Palyginimui, dabartinė API kainodara ankstesniam modeliui (GPT-5.2-Codex) yra:

Infrastruktūra

GPT-5.3-Codex buvo kartu kuriamas, mokomas ir diegiamas NVIDIA GB200 NVL72 sistemose – tai liudija glaudų bendradarbiavimą tarp OpenAI ir NVIDIA ruošiant DI galimybių ribas.

Palyginimas su konkurentais

GPT-5.3-Codex pristatymas įvyko vos per kelias minutes po Anthropic pranešimo apie Claude Opus 4.6, sukuriant tiesioginį modelių palyginimą.

GPT-5.3-Codex stipriosios pusės

  • Terminal-Bench 2.0: 77.3 prieš Opus 4.6 65.4 (+18,6 % pranašumas)
  • 25 % greitesnis veikimas
  • „Aukštas patikimumas, mažas svyravimas“ dizaino filosofija
  • Savaitės galimybė savarankiškai tobulėti (padėjo sukurti save)
  • Pirmoji „aukštos galios“ kibernetinio saugumo klasifikacija

Claude Opus 4.6 stipriosios pusės

  • Milijono žetonų konteksto langas (žymiai didesnis)
  • Agentų komandos bendradarbiavimo funkcionalumas
  • Didesnis universalumas žinių darbe
  • Aukštesnė kūrybiškumo temperatūra (daugiau asmenybės)

Dizaino filosofijos skirtumai

Bendresnis vaizdas

GPT-5.3-Codex yra ne tik palaipsniškas patobulinimas – tai esminis žingsnis link universalios paskirties agentų, galinčių samprotauti, kurti ir vykdyti visą realaus pasaulio techninį darbų spektrą.

Nuo kodo agento iki kompiuterio agento

OpenAI aiškiai apibrėžia šią evoliuciją: „Codex žengia toliau už kodo rašymą ir naudoja jį kaip įrankį kompiuteriui valdyti ir užduotims atlikti nuo pradžios iki pabaigos.“
Tai gilus pokytis. Tai, kas pradžioje buvo skirta būti „geriausiu programavimo agentu“, tapo pagrindu universalios paskirties bendradarbiui kompiuteryje – plečiant galimybes tiek kūrėjams, tiek DI galimybėms.

DI vystymo spartinimas

Faktas, kad GPT-5.3-Codex padėjo sukurti save, yra pranašas ateičiai. Kaip pastebi OpenAI tyrėjai, „daugelis jų darbuotojų šiandien apibūdina savo darbą kaip esminiai skirtingą nei prieš du mėnesius.“
Tai reiškia, kad įžengiame į greitėjančios grąžos poveikio etapą DI vystyme, kai kiekviena modelių karta padeda sukurti kitą – potencialiai sumažinant kūrimo laiką nuo metų iki mėnesių.

Pasekmės kūrėjams

Programinės įrangos kūrėjams šios pasekmės yra reikšmingos:
  • Greitesni vystymo ciklai - DI atlieka daugiau rutininio darbo
  • Aukštesnio lygio abstrakcija - kūrėjai gali koncentruotis į architektūrą ir dizainą
  • Interaktyvus bendradarbiavimas - mažiau panašu į įrankio naudojimą, labiau – darbą su komandos nariu
  • Naujos galimybės - užduotys, kurioms anksčiau reikėjo specializuotų žinių, dabar prieinamos visiems

Pasekmės verslams

Verslams GPT-5.3-Codex reiškia:
  • Padidintą produktyvumą - daugiau užduočių atliekama trumpesniu laiku
  • Mažesnius barjerus - mažiau specializuotų įgūdžių reikalinga tam tikroms užduotims
  • Naujas saugumo svarstymus - „aukštos galios“ kibernetinio saugumo klasifikacija reikalauja atsakingo valdymo
  • Konkurencinį pranašumą - ankstyvas galingo agentinio DI priėmimas

Išvada

GPT-5.3-Codex yra svarbus dirbtinio intelekto pasiekimas. Jis apjungia:
  • Pažangiausią programavimo našumą
  • Išplėstines agentines galimybes
  • Interaktyvų bendradarbiavimą
  • Savarankišką tobulėjimą (padėjo sukurti save)
  • Realų kompiuterio naudojimą
Tai, kad modelis padėjo sukurti pats save, yra tiek techninis pasiekimas, tiek metafora DI ateičiai. Spartėjant modeliams, jie tampa ne tik įrankiais, bet ir partneriais kūrybos bei vystymo procesuose.
Simultaniškas išleidimas kartu su Claude Opus 4.6, vos per kelias minutes, parodo intensyvų konkurencijos lygį DI srityje. Dar svarbiau, tai žymi naują DI galimybių etapą – kai agentai gali patikimai valdyti sudėtingas, ilgo laikotarpio užduotis visame profesionalaus kompiuterio darbo spektre.
Kaip sako OpenAI: „Tai, kas prasidėjo kaip siekis būti geriausiu programavimo agentu, tapo pagrindu universaliam bendradarbiui kompiuteryje.“
Dabar klausimas ne tik ką šie modeliai gali daryti – bet ką mes pasirinksime su jais sukurti.

Šaltiniai

GPT-5.3-Codex pristatymas – oficialus OpenAI pranešimas
GPT-5.3-Codex sistemos kortelė – OpenAI
GPT 5.3 Codex kainodara, testai ir funkcijos – eesel AI
OpenAI: naujas programavimo modelis GPT-5.3-Codex sukūrė pats save – Mashable
Su GPT-5.3-Codex OpenAI pozicionuoja Codex ne tik kaip kodo rašymo įrankį – Ars Technica
OpenAI paleidžia naują agentinį programavimo modelį vos po kelių minučių, kai Anthropic pristato savo – TechCrunch
Opus 4.6 prieš CODEX 5.3 – pirmasis realus palyginimas – Reddit
GPT 5.3 Codex prieš Opus 4.6: didelis susiliejimas – Every
OpenAI platformos kainodara
Codex kainodara
SWE-Bench oficiali lyderių lentelė

Atsakomybės apribojimas: Šis straipsnis remiasi informacija, galiojusia 2026 m. vasario 6 d. Specifikacijos, kainos ir prieinamumas gali keistis. Prašome pasitikrinti oficialią OpenAI dokumentaciją dėl naujausios informacijos.

Naujausi straipsniai
Išsamus OpenAI evoliucijos ir svarbių įvykių laiko juosta

Išsamus OpenAI evoliucijos ir svarbių įvykių laiko juosta

Compose AI plėtinys Chrome | Apžvalga ir alternatyva

Compose AI plėtinys Chrome | Apžvalga ir alternatyva