Johdanto

OpenAI julkisti 5. helmikuuta 2026 GPT-5.3-Codexin, tähänastisen edistyneimmän agenttipohjaisen koodausmallinsa. Tämä julkaisu on merkittävä virstanpylväs tekoälyn alalla – ei ainoastaan sen vaikuttavien teknisten ominaisuuksien vuoksi, vaan myös siksi, että se on ensimmäinen malli, joka oli keskeisessä asemassa itsensä luomisessa.

GPT-5.3-Codex edustaa perustavanlaatuista muutosta koodin kirjoittamisen työkalusta interaktiiviseksi tekoälypohjaiseksi yhteistyökumppaniksi, joka pystyy käsittelemään pitkäjänteistä, todellista teknistä työtä ammattimaisten tietojenkäsittelytehtävien koko kirjossa.

Mikä tekee GPT-5.3-Codexista erilaisen?

Todellinen agenttimalli

Toisin kuin perinteiset koodausapuvälineet, jotka yksinkertaisesti generoivat koodinpätkiä, GPT-5.3-Codex on suunniteltu "agenttimalliksi". Tämä tarkoittaa, että se voi:

Säilyttää kontekstin pitkäkestoisissa tehtävissä, jotka kestävät tunteja tai jopa päiviä

Käyttää työkaluja itsenäisesti, mukaan lukien komentoriviliittymät, tiedostojärjestelmät ja kehitysympäristöt

Mukautua ja iteroida reaaliaikaisen palautteen perusteella menettämättä paikkaansa

Käsitellä monimutkaisia monivaiheisia työnkulkuja, jotka vaativat tutkimusta, suunnittelua ja toteutusta

Itsensä rakentamisen saavutus

Ehkä merkittävin asia GPT-5.3-Codexissa on se, että Codex-tiimi käytti mallin varhaisia versioita:

Oman koulutusprosessinsa virheiden korjaamiseen

Oman käyttöönottonsa hallintaan

Testitulosten ja arviointien diagnosointiin

Infrastruktuurin optimointiin lopullista julkaisua varten

Tämä itseensä viittaava kehityssykli osoittaa, kuinka tekoäly alkaa nopeuttaa omaa kehitystään – virstanpylväs, jonka OpenAI:n tutkijat kuvasivat jättäneen heidät "hämmästyneiksi siitä, kuinka paljon Codex pystyi nopeuttamaan omaa kehitystään".

Suorituskyvyn parannukset

GPT-5.3-Codex on 25 % nopeampi kuin edeltäjänsä (GPT-5.2-Codex) OpenAI:n infrastruktuurin ja päättelyketjun parannusten ansiosta. Tämä nopeuden paraneminen mahdollistaa reagoivamman reaaliaikaisen yhteistyön ja nopeammat iteraatiosyklit.

Vertailuarvosuorituskyky: Data

GPT-5.3-Codex saavuttaa huipputuloksia useissa keskeisissä vertailuarvoissa, jotka mittaavat koodausta, agenttiominaisuuksia ja tietokoneen käyttöä todellisessa maailmassa.

SWE-Bench Pro

SWE-Bench Pro on tiukka arvio todellisesta ohjelmistotuotannosta, joka kattaa neljä ohjelmointikieltä (Python, JavaScript, TypeScript ja Go). Toisin kuin edeltäjänsä (SWE-Bench Verified), joka testasi vain Pythonia, SWE-Bench Pro on suunniteltu kestämään paremmin kontaminaatiota ja olemaan teollisuuden kannalta merkityksellisempi.

Terminal-Bench 2.0

13,3 %:n parannus Terminal-Bench 2.0:ssa on erityisen merkittävä. Tämä vertailuarvo mittaa terminaalitaitoja, joita koodausagentti tarvitsee – tiedostojärjestelmissä navigointia, komentojen suorittamista ja kehitystyönkulujen hallintaa. Erityisesti GPT-5.3-Codex saavuttaa tämän pienemmällä määrällä tokeneita kuin mikään aiempi malli, mikä tekee siitä tehokkaamman.

OSWorld-Verified

26,5 %:n hyppy OSWorld-Verifiedissä osoittaa huomattavasti parantuneita tietokoneen käyttöominaisuuksia. OSWorld on agenttipohjainen tietokoneen käyttöä mittaava vertailuarvo, jossa agenttien on suoritettava tuottavuustehtäviä visuaalisessa työpöytäympäristössä. Tämä valtava parannus osoittaa, että GPT-5.3-Codex on huomattavasti parempi navigoimaan todellisissa käyttöliittymissä kuin aiemmat mallit.

Koodin ulkopuolella: Yleiskäyttöinen agentti

Vaikka GPT-5.3-Codex on erinomainen ohjelmoinnissa, sen ominaisuudet ulottuvat paljon koodin generointia pidemmälle. OpenAI позиционирует sitä agenttina, joka voi käsitellä "lähes mitä tahansa, mitä kehittäjät ja ammattilaiset voivat tehdä tietokoneella".

Ohjelmiston elinkaaren tuki

Malli on rakennettu tukemaan koko ohjelmistokehityksen elinkaarta:

Virheiden korjaus - Virheiden tunnistaminen ja korjaaminen

Käyttöönotto - Julkaisujen ja infrastruktuurin hallinta

Valvonta - Suorituskyvyn ja mittareiden seuranta

PRD:iden kirjoittaminen - Tuotevaatimusdokumentit

Tekstin muokkaaminen - Dokumentaatio ja markkinointiteksti

Käyttäjätutkimus - Käyttäjäpalautteen analysointi

Testaus - Testisarjojen kirjoittaminen ja suorittaminen

Mittareiden analyysi - Tietopohjainen päätöksenteko

Tietotyöominaisuudet

GDPvalissa (OpenAI:n vuoden 2025 arvio, joka mittaa suorituskykyä tietotyötehtävissä 44 ammatissa) GPT-5.3-Codex vastaa GPT-5.2:n suorituskykyä. Tähän sisältyy tehtäviä, kuten:

Diaesitysten ja esitysten luominen

Datan analysointi laskentataulukoissa

Dokumenttien hallinta ja organisointi

Tutkimus ja synteesi

Verkkokehitysesimerkki

Osoittaakseen mallin ominaisuuksia OpenAI pyysi GPT-5.3-Codexia rakentamaan kaksi kokonaista peliä alusta alkaen:

Ajopeli (Codex-sovelluksen käynnistyspelin versio 2)

Sukelluspeli

Käyttämällä vain "kehittää verkkopeli" -taitoa ja yleisiä seurantakehotteita, kuten "korjaa virhe" tai "paranna peliä", GPT-5.3-Codex iterioi itsenäisesti miljoonien tokenien yli rakentaen erittäin toimivia ja hiottuja pelejä.

Parempi tarkoituksen ymmärtäminen

Verrattuna GPT-5.2-Codexiin, uusi malli ymmärtää paremmin käyttäjän tarkoituksen verkkosivustoja rakennettaessa. Yksinkertaiset tai alimääritellyt kehotteet johtavat nyt oletusarvoisesti sivustoihin, joissa on:

Enemmän toiminnallisuutta

Järkeviä oletusarvoja

Tuotantovalmiita ominaisuuksia

Esimerkiksi, kun GPT-5.3-Codexia pyydettiin rakentamaan hinnoittelun laskeutumissivu, se näytti automaattisesti vuosisuunnitelman alennettuna kuukausihintana (tehden alennuksen selväksi) ja loi automaattisesti siirtyvän suosittelukarusellin kolmella erillisellä käyttäjälainauksella – mikä johti täydellisempään ja hiotumpaan suunnitteluun.

Interaktiivinen yhteistyö

Yksi merkittävimmistä käyttökokemuksen parannuksista on kyky ohjata mallia sen työskennellessä.

Reaaliaikainen vuorovaikutus

Sen sijaan, että käyttäjät odottaisivat lopullista tulosta, he voivat nyt:

Esittää kysymyksiä suorituksen aikana

Keskustella eri lähestymistavoista

Ohjata kohti tiettyjä ratkaisuja

Antaa palautetta tehtävän puolivälissä

GPT-5.3-Codex kertoo, mitä se tekee, vastaa palautteeseen ja pitää käyttäjät ajan tasalla alusta loppuun. Tämä voidaan ottaa käyttöön Codex-sovelluksessa kohdassa Asetukset > Yleiset > Seurantakäyttäytyminen.

Tämä muuttaa kokemuksen komentojen antamisesta koneelle yhteistyöksi tiimin jäsenen kanssa – perustavanlaatuinen muutos siinä, miten ihmiset ovat vuorovaikutuksessa tekoälyjärjestelmien kanssa.

Kyberturvallisuusominaisuudet ja turvallisuus

GPT-5.3-Codex on ensimmäinen malli, jonka OpenAI luokittelee "korkean suorituskyvyn" malliksi kyberturvallisuuteen liittyvissä tehtävissä Preparedness Framework -viitekehyksensä mukaisesti. Se on myös ensimmäinen malli, joka on suoraan koulutettu tunnistamaan ohjelmistojen haavoittuvuuksia.

Kaksoiskäyttöluonne

Koska kyberturvallisuus on luonteeltaan kaksoiskäyttöistä (hyödyllinen sekä puolustukseen että hyökkäykseen), OpenAI omaksuu varovaisen lähestymistavan:

Ei lopullisia todisteita siitä, että se voi automatisoida kyberhyökkäyksiä päästä päähän

Laajan kyberturvallisuuden turvallisuuspinon käyttöönotto

Turvallisuuskoulutuksen ja automatisoidun valvonnan toteuttaminen

Luotetun pääsyn vaatiminen edistyneisiin ominaisuuksiin

Luotettu pääsy kyberiin

OpenAI lanseeraa Trusted Access for Cyber -pilottiohjelman, jonka tarkoituksena on:

Nopeuttaa kyberpuolustuksen tutkimusta

Tarjota työkaluja ensin puolustajille

Tukea ekosysteemin kestävyyttä

$10 miljoonan sitoumus

Vuoden 2023 miljoonan dollarin kyberturvallisuuden apurahaohjelman pohjalta OpenAI sitoutuu 10 miljoonaan dollariin API-krediittejä kyberpuolustuksen nopeuttamiseksi, erityisesti seuraaville:

Avoimen lähdekoodin ohjelmistot

Kriittiset infrastruktuurijärjestelmät

Hyvässä uskossa tapahtuva turvallisuustutkimus

Aardvark Security Agent

OpenAI laajentaa Aardvarkin, tietoturvatutkimusagenttinsa, yksityistä beta-ohjelmaa ensimmäisenä tarjouksena Codex Security -tuotteidensa ja -työkalujensa sarjassa. He tekevät myös yhteistyötä avoimen lähdekoodin ylläpitäjien kanssa tarjotakseen ilmaisen koodipohjan skannauksen laajalti käytetyille projekteille, kuten Next.js.

Miten OpenAI käytti Codexia Codexin rakentamiseen

GPT-5.3-Codexin kehittäminen tarjoaa kiehtovan tapaustutkimuksen tekoälyllä nopeutetusta tutkimuksesta.

Tutkimusryhmän käyttötapaukset

Tutkimusryhmä käytti GPT-5.3-Codexin varhaisia versioita:

Valvomaan ja korjaamaan julkaisun koulutusajoa

Seuraamaan malleja koko koulutuksen ajan

Tarjoamaan syvällistä analyysiä vuorovaikutuksen laadusta

Ehdottaa korjauksia ja rakentaa rikkaita sovelluksia ihmistutkijoille

Ymmärtämään tarkasti, miten mallin käyttäytyminen erosi aiemmista malleista

Insinööriryhmän käyttötapaukset

Insinööriryhmä käytti Codexia:

Optimoi ja mukauttaa GPT-5.3-Codexin valjaat

Tunnistaa kontekstin renderöintivirheitä, jotka vaikuttavat käyttäjiin

Etsiä alhaisten välimuistiosumien perimmäinen syy

Skaalata dynaamisesti GPU-klustereita liikennepiikkien mukaan

Pitää latenssi vakaana julkaisun aikana

Datatieteen käyttötapaukset

Alfa-testauksen aikana datatieteilijä työskenteli GPT-5.3-Codexin kanssa:

Rakentaa regex-luokittelijoita arvioidakseen selvennysten, käyttäjävastausten ja tehtävän edistymisen tiheyttä

Suorittaa näitä luokittelijoita skaalautuvasti kaikissa istuntolokeissa

Rakentaa uusia datalinjoja ja visualisoi tuloksia rikkaammin kuin tavalliset kojelaudan työkalut

Analysoi tuloksia yhdessä Codexin kanssa, joka tiivistää keskeiset oivallukset tuhansista datapisteistä alle kolmessa minuutissa

Tuottavuuden kasvu

Lopputulos? Codexin kanssa rakentavat ihmiset olivat onnellisempia, kun agentti:

Ymmärsi paremmin heidän tarkoituksensa

Edistyi enemmän per kierros

Esitti vähemmän selventäviä kysymyksiä

Saatavuus ja hinnoittelu

Miten pääsee käyttämään

GPT-5.3-Codex on heti saatavilla maksaville ChatGPT-käyttäjille kaikilla Codex-pinnoilla:

Työpöytäsovellus (macOS ja Windows)

Komentoriviliittymä (CLI)

IDE-laajennukset (VS Code, JetBrains jne.)

Verkkokäyttöliittymä

Tilaussuunnitelmat

Rajoitetun ajan maksulliset suunnitelmat saavat kaksinkertaiset normaalit rajoitukset.

API-hinnoittelu

Julkaisuhetkellä OpenAI ei ole julkaissut virallista API-hinnoittelua GPT-5.3-Codexille. API-pääsyä kuvaillaan "otettavan käyttöön pian" ja "tulevina viikkoina".

Vertailun vuoksi edellisen mallin (GPT-5.2-Codex) nykyinen API-hinnoittelu on:

Infrastruktuuri

GPT-5.3-Codex on suunniteltu, koulutettu ja tarjoiltu yhdessä NVIDIA GB200 NVL72 -järjestelmien kanssa – osoitus OpenAI:n ja NVIDIA:n tiiviistä yhteistyöstä tekoälyn suorituskyvyn rajojen työntämisessä.

Vertailu kilpailijoihin

GPT-5.3-Codexin julkaisu tuli vain muutama minuutti Anthropicin Claude Opus 4.6:n julkistuksen jälkeen, mikä loi välittömän vertailun näiden kahden mallin välille.

GPT-5.3-Codexin vahvuudet

Terminal-Bench 2.0: 77,3 vs. Opus 4.6:n 65,4 (+18,6 % etu)

25 % nopeampi suorituskyky

"Korkea luotettavuus, alhainen varianssi" suunnittelufilosofia

Itsensä rakentamisen kyky (auttoi luomaan itsensä)

Ensimmäinen "korkean suorituskyvyn" kyberturvallisuusluokitus

Claude Opus 4.6:n vahvuudet

1 miljoonan tokenin konteksti-ikkuna (huomattavasti suurempi)

Agenttitiimit yhteistyötoiminto

Laajempi monipuolisuus tietotyöskenaarioissa

Korkeampi luovuuslämpötila (enemmän persoonallisuutta)

Suunnittelufilosofian erot

Laajempi kuva

GPT-5.3-Codex edustaa enemmän kuin vain asteittaista päivitystä – se on harppaus kohti yleiskäyttöisiä agentteja, jotka voivat järkeillä, rakentaa ja toteuttaa todellisen teknisen työn koko kirjossa.

Koodiagentista tietokoneagentiksi

OpenAI kehystää tämän kehityksen nimenomaisesti: "Codex on siirtymässä koodin kirjoittamisen ulkopuolelle käyttämään sitä työkaluna tietokoneen käyttämiseen ja työn suorittamiseen päästä päähän".

Tämä on syvällinen muutos. Se, mikä alkoi keskittymisestä "parhaaksi koodausagentiksi" olemiseen, on tullut perusta yleisemmälle yhteistyökumppanille tietokoneella – laajentaen sekä sitä, kuka voi rakentaa, että sitä, mikä on mahdollista tekoälyn avulla.

Tekoälyn kehityksen nopeuttaminen

Se, että GPT-5.3-Codex auttoi rakentamaan itsensä, on esimakua tulevasta. Kuten OpenAI:n tutkijat toteavat, "monet OpenAI:n tutkijat ja insinöörit kuvaavat työtään nykyään pohjimmiltaan erilaiseksi kuin se oli vain kaksi kuukautta sitten".

Tämä viittaa siihen, että olemme siirtymässä nopeutuvien tuottojen aikaan tekoälyn kehityksessä, jossa jokainen mallisukupolvi auttaa rakentamaan seuraavan – mahdollisesti puristaen aikajanoja vuosista kuukausiin.

Vaikutukset kehittäjille

Ohjelmistokehittäjille vaikutukset ovat merkittäviä:

Nopeammat kehityssyklit - Tekoäly hoitaa enemmän rutiinityötä

Korkeamman tason abstraktio - Kehittäjät voivat keskittyä arkkitehtuuriin ja suunnitteluun

Interaktiivinen yhteistyö - Vähemmän työkalun käyttöä, enemmän työskentelyä tiimin jäsenen kanssa

Uusia ominaisuuksia - Tehtävät, jotka aiemmin vaativat erikoisosaamista, ovat nyt saatavilla

Vaikutukset yrityksille

Yrityksille GPT-5.3-Codex edustaa:

Lisääntynyttä tuottavuutta - Enemmän työtä saadaan tehtyä vähemmässä ajassa

Alhaisempia esteitä - Vähemmän erikoistaitoja tarvitaan tiettyihin tehtäviin

Uusia turvallisuusnäkökohdista - "Korkean suorituskyvyn" kyberturvallisuusluokitus edellyttää huolellista hallintaa

Kilpailuetua - Tehokkaan agenttipohjaisen tekoälyn varhainen käyttöönotto

Johtopäätös

GPT-5.3-Codex on merkittävä saavutus tekoälyn alalla. Se yhdistää:

Huippuluokan koodaussuorituskyvyn

Edistyneet agenttiominaisuudet

Interaktiivisen yhteistyön

Itsensä kehittämisen (se auttoi rakentamaan itsensä)

Tietokoneen käytön todellisessa maailmassa

Se, että se oli keskeisessä asemassa omassa luomisessaan, toimii sekä teknisenä saavutuksena että metaforana siitä, mihin tekoäly on menossa. Mallien kehittyessä kyvykkäämmiksi, ne eivät ole vain työkaluja, joita käytämme – niistä on tulossa kumppaneita itse luovaan ja kehitysprosessiin.

Samanaikainen julkaisu Claude Opus 4.6:n kanssa, vain muutaman minuutin välein, korostaa kilpailun kovuutta tekoälyalalla. Mutta mikä tärkeintä, se osoittaa, että olemme siirtyneet tekoälyn suorituskyvyn uuteen vaiheeseen – vaiheeseen, jossa agentit voivat luotettavasti käsitellä monimutkaisia, pitkäjänteisiä tehtäviä ammattimaisen tietokonetyön koko kirjossa.

Kuten OpenAI toteaa: "Se, mikä alkoi keskittymisestä parhaaksi koodausagentiksi olemiseen, on tullut perusta yleisemmälle yhteistyökumppanille tietokoneella".

Kysymys ei nyt ole vain se, mitä nämä mallit voivat tehdä – vaan se, mitä päätämme rakentaa niillä.

Lähteet

Introducing GPT-5.3-Codex - OpenAI Official Announcement

GPT-5.3-Codex System Card - OpenAI

GPT 5.3 Codex pricing, benchmarks, and features explained - eesel AI

OpenAI: New coding model GPT-5.3-Codex helped build itself - Mashable

With GPT-5.3-Codex, OpenAI pitches Codex for more than just writing code - Ars Technica

OpenAI launches new agentic coding model only minutes after Anthropic drops its own - TechCrunch

Opus 4.6 vs CODEX 5.3, first real comparison - Reddit

GPT 5.3 Codex vs. Opus 4.6: The Great Convergence - Every

OpenAI Platform Pricing

Codex Pricing

SWE-Bench Official Leaderboard

Vastuuvapauslauseke: Tämä artikkeli perustuu tietoihin, jotka olivat saatavilla 6. helmikuuta 2026. Tekniset tiedot, hinnoittelu ja saatavuus voivat muuttua. Katso uusimmat tiedot virallisesta OpenAI-dokumentaatiosta.

GPT-5.3-Codex: OpenAI:n tehokkain agenttipohjainen koodausmalli