Johdanto
OpenAI julkisti 5. helmikuuta 2026 GPT-5.3-Codexin, tähänastisen edistyneimmän agenttipohjaisen koodausmallinsa. Tämä julkaisu on merkittävä virstanpylväs tekoälyn alalla – ei ainoastaan sen vaikuttavien teknisten ominaisuuksien vuoksi, vaan myös siksi, että se on ensimmäinen malli, joka oli keskeisessä asemassa itsensä luomisessa.
GPT-5.3-Codex edustaa perustavanlaatuista muutosta koodin kirjoittamisen työkalusta interaktiiviseksi tekoälypohjaiseksi yhteistyökumppaniksi, joka pystyy käsittelemään pitkäjänteistä, todellista teknistä työtä ammattimaisten tietojenkäsittelytehtävien koko kirjossa.
Mikä tekee GPT-5.3-Codexista erilaisen?
Todellinen agenttimalli
Toisin kuin perinteiset koodausapuvälineet, jotka yksinkertaisesti generoivat koodinpätkiä, GPT-5.3-Codex on suunniteltu "agenttimalliksi". Tämä tarkoittaa, että se voi:
- Säilyttää kontekstin pitkäkestoisissa tehtävissä, jotka kestävät tunteja tai jopa päiviä
- Käyttää työkaluja itsenäisesti, mukaan lukien komentoriviliittymät, tiedostojärjestelmät ja kehitysympäristöt
- Mukautua ja iteroida reaaliaikaisen palautteen perusteella menettämättä paikkaansa
- Käsitellä monimutkaisia monivaiheisia työnkulkuja, jotka vaativat tutkimusta, suunnittelua ja toteutusta
Itsensä rakentamisen saavutus
Ehkä merkittävin asia GPT-5.3-Codexissa on se, että Codex-tiimi käytti mallin varhaisia versioita:
- Oman koulutusprosessinsa virheiden korjaamiseen
- Oman käyttöönottonsa hallintaan
- Testitulosten ja arviointien diagnosointiin
- Infrastruktuurin optimointiin lopullista julkaisua varten
Tämä itseensä viittaava kehityssykli osoittaa, kuinka tekoäly alkaa nopeuttaa omaa kehitystään – virstanpylväs, jonka OpenAI:n tutkijat kuvasivat jättäneen heidät "hämmästyneiksi siitä, kuinka paljon Codex pystyi nopeuttamaan omaa kehitystään".
Suorituskyvyn parannukset
GPT-5.3-Codex on 25 % nopeampi kuin edeltäjänsä (GPT-5.2-Codex) OpenAI:n infrastruktuurin ja päättelyketjun parannusten ansiosta. Tämä nopeuden paraneminen mahdollistaa reagoivamman reaaliaikaisen yhteistyön ja nopeammat iteraatiosyklit.
Vertailuarvosuorituskyky: Data
GPT-5.3-Codex saavuttaa huipputuloksia useissa keskeisissä vertailuarvoissa, jotka mittaavat koodausta, agenttiominaisuuksia ja tietokoneen käyttöä todellisessa maailmassa.
SWE-Bench Pro
SWE-Bench Pro on tiukka arvio todellisesta ohjelmistotuotannosta, joka kattaa neljä ohjelmointikieltä (Python, JavaScript, TypeScript ja Go). Toisin kuin edeltäjänsä (SWE-Bench Verified), joka testasi vain Pythonia, SWE-Bench Pro on suunniteltu kestämään paremmin kontaminaatiota ja olemaan teollisuuden kannalta merkityksellisempi.
Terminal-Bench 2.0
13,3 %:n parannus Terminal-Bench 2.0:ssa on erityisen merkittävä. Tämä vertailuarvo mittaa terminaalitaitoja, joita koodausagentti tarvitsee – tiedostojärjestelmissä navigointia, komentojen suorittamista ja kehitystyönkulujen hallintaa. Erityisesti GPT-5.3-Codex saavuttaa tämän pienemmällä määrällä tokeneita kuin mikään aiempi malli, mikä tekee siitä tehokkaamman.
OSWorld-Verified
26,5 %:n hyppy OSWorld-Verifiedissä osoittaa huomattavasti parantuneita tietokoneen käyttöominaisuuksia. OSWorld on agenttipohjainen tietokoneen käyttöä mittaava vertailuarvo, jossa agenttien on suoritettava tuottavuustehtäviä visuaalisessa työpöytäympäristössä. Tämä valtava parannus osoittaa, että GPT-5.3-Codex on huomattavasti parempi navigoimaan todellisissa käyttöliittymissä kuin aiemmat mallit.
Koodin ulkopuolella: Yleiskäyttöinen agentti
Vaikka GPT-5.3-Codex on erinomainen ohjelmoinnissa, sen ominaisuudet ulottuvat paljon koodin generointia pidemmälle. OpenAI позиционирует sitä agenttina, joka voi käsitellä "lähes mitä tahansa, mitä kehittäjät ja ammattilaiset voivat tehdä tietokoneella".
Ohjelmiston elinkaaren tuki
Malli on rakennettu tukemaan koko ohjelmistokehityksen elinkaarta:
- Virheiden korjaus - Virheiden tunnistaminen ja korjaaminen
- Käyttöönotto - Julkaisujen ja infrastruktuurin hallinta
- Valvonta - Suorituskyvyn ja mittareiden seuranta
- PRD:iden kirjoittaminen - Tuotevaatimusdokumentit
- Tekstin muokkaaminen - Dokumentaatio ja markkinointiteksti
- Käyttäjätutkimus - Käyttäjäpalautteen analysointi
- Testaus - Testisarjojen kirjoittaminen ja suorittaminen
- Mittareiden analyysi - Tietopohjainen päätöksenteko
Tietotyöominaisuudet
GDPvalissa (OpenAI:n vuoden 2025 arvio, joka mittaa suorituskykyä tietotyötehtävissä 44 ammatissa) GPT-5.3-Codex vastaa GPT-5.2:n suorituskykyä. Tähän sisältyy tehtäviä, kuten:
- Diaesitysten ja esitysten luominen
- Datan analysointi laskentataulukoissa
- Dokumenttien hallinta ja organisointi
Verkkokehitysesimerkki
Osoittaakseen mallin ominaisuuksia OpenAI pyysi GPT-5.3-Codexia rakentamaan kaksi kokonaista peliä alusta alkaen:
- Ajopeli (Codex-sovelluksen käynnistyspelin versio 2)
Käyttämällä vain "kehittää verkkopeli" -taitoa ja yleisiä seurantakehotteita, kuten "korjaa virhe" tai "paranna peliä", GPT-5.3-Codex iterioi itsenäisesti miljoonien tokenien yli rakentaen erittäin toimivia ja hiottuja pelejä.
Parempi tarkoituksen ymmärtäminen
Verrattuna GPT-5.2-Codexiin, uusi malli ymmärtää paremmin käyttäjän tarkoituksen verkkosivustoja rakennettaessa. Yksinkertaiset tai alimääritellyt kehotteet johtavat nyt oletusarvoisesti sivustoihin, joissa on:
- Enemmän toiminnallisuutta
- Tuotantovalmiita ominaisuuksia
Esimerkiksi, kun GPT-5.3-Codexia pyydettiin rakentamaan hinnoittelun laskeutumissivu, se näytti automaattisesti vuosisuunnitelman alennettuna kuukausihintana (tehden alennuksen selväksi) ja loi automaattisesti siirtyvän suosittelukarusellin kolmella erillisellä käyttäjälainauksella – mikä johti täydellisempään ja hiotumpaan suunnitteluun.
Interaktiivinen yhteistyö
Yksi merkittävimmistä käyttökokemuksen parannuksista on kyky ohjata mallia sen työskennellessä.
Reaaliaikainen vuorovaikutus
Sen sijaan, että käyttäjät odottaisivat lopullista tulosta, he voivat nyt:
- Esittää kysymyksiä suorituksen aikana
- Keskustella eri lähestymistavoista
- Ohjata kohti tiettyjä ratkaisuja
- Antaa palautetta tehtävän puolivälissä
GPT-5.3-Codex kertoo, mitä se tekee, vastaa palautteeseen ja pitää käyttäjät ajan tasalla alusta loppuun. Tämä voidaan ottaa käyttöön Codex-sovelluksessa kohdassa Asetukset > Yleiset > Seurantakäyttäytyminen.
Tämä muuttaa kokemuksen komentojen antamisesta koneelle yhteistyöksi tiimin jäsenen kanssa – perustavanlaatuinen muutos siinä, miten ihmiset ovat vuorovaikutuksessa tekoälyjärjestelmien kanssa.
Kyberturvallisuusominaisuudet ja turvallisuus
GPT-5.3-Codex on ensimmäinen malli, jonka OpenAI luokittelee "korkean suorituskyvyn" malliksi kyberturvallisuuteen liittyvissä tehtävissä Preparedness Framework -viitekehyksensä mukaisesti. Se on myös ensimmäinen malli, joka on suoraan koulutettu tunnistamaan ohjelmistojen haavoittuvuuksia.
Kaksoiskäyttöluonne
Koska kyberturvallisuus on luonteeltaan kaksoiskäyttöistä (hyödyllinen sekä puolustukseen että hyökkäykseen), OpenAI omaksuu varovaisen lähestymistavan:
- Ei lopullisia todisteita siitä, että se voi automatisoida kyberhyökkäyksiä päästä päähän
- Laajan kyberturvallisuuden turvallisuuspinon käyttöönotto
- Turvallisuuskoulutuksen ja automatisoidun valvonnan toteuttaminen
- Luotetun pääsyn vaatiminen edistyneisiin ominaisuuksiin
Luotettu pääsy kyberiin
OpenAI lanseeraa Trusted Access for Cyber -pilottiohjelman, jonka tarkoituksena on:
- Nopeuttaa kyberpuolustuksen tutkimusta
- Tarjota työkaluja ensin puolustajille
- Tukea ekosysteemin kestävyyttä
$10 miljoonan sitoumus
Vuoden 2023 miljoonan dollarin kyberturvallisuuden apurahaohjelman pohjalta OpenAI sitoutuu 10 miljoonaan dollariin API-krediittejä kyberpuolustuksen nopeuttamiseksi, erityisesti seuraaville:
- Avoimen lähdekoodin ohjelmistot
- Kriittiset infrastruktuurijärjestelmät
- Hyvässä uskossa tapahtuva turvallisuustutkimus
Aardvark Security Agent
OpenAI laajentaa Aardvarkin, tietoturvatutkimusagenttinsa, yksityistä beta-ohjelmaa ensimmäisenä tarjouksena Codex Security -tuotteidensa ja -työkalujensa sarjassa. He tekevät myös yhteistyötä avoimen lähdekoodin ylläpitäjien kanssa tarjotakseen ilmaisen koodipohjan skannauksen laajalti käytetyille projekteille, kuten Next.js.
Miten OpenAI käytti Codexia Codexin rakentamiseen
GPT-5.3-Codexin kehittäminen tarjoaa kiehtovan tapaustutkimuksen tekoälyllä nopeutetusta tutkimuksesta.
Tutkimusryhmän käyttötapaukset
Tutkimusryhmä käytti GPT-5.3-Codexin varhaisia versioita:
- Valvomaan ja korjaamaan julkaisun koulutusajoa
- Seuraamaan malleja koko koulutuksen ajan
- Tarjoamaan syvällistä analyysiä vuorovaikutuksen laadusta
- Ehdottaa korjauksia ja rakentaa rikkaita sovelluksia ihmistutkijoille
- Ymmärtämään tarkasti, miten mallin käyttäytyminen erosi aiemmista malleista
Insinööriryhmän käyttötapaukset
Insinööriryhmä käytti Codexia:
- Optimoi ja mukauttaa GPT-5.3-Codexin valjaat
- Tunnistaa kontekstin renderöintivirheitä, jotka vaikuttavat käyttäjiin
- Etsiä alhaisten välimuistiosumien perimmäinen syy
- Skaalata dynaamisesti GPU-klustereita liikennepiikkien mukaan
- Pitää latenssi vakaana julkaisun aikana
Datatieteen käyttötapaukset
Alfa-testauksen aikana datatieteilijä työskenteli GPT-5.3-Codexin kanssa:
- Rakentaa regex-luokittelijoita arvioidakseen selvennysten, käyttäjävastausten ja tehtävän edistymisen tiheyttä
- Suorittaa näitä luokittelijoita skaalautuvasti kaikissa istuntolokeissa
- Rakentaa uusia datalinjoja ja visualisoi tuloksia rikkaammin kuin tavalliset kojelaudan työkalut
- Analysoi tuloksia yhdessä Codexin kanssa, joka tiivistää keskeiset oivallukset tuhansista datapisteistä alle kolmessa minuutissa
Tuottavuuden kasvu
Lopputulos? Codexin kanssa rakentavat ihmiset olivat onnellisempia, kun agentti:
- Ymmärsi paremmin heidän tarkoituksensa
- Edistyi enemmän per kierros
- Esitti vähemmän selventäviä kysymyksiä
Saatavuus ja hinnoittelu
Miten pääsee käyttämään
GPT-5.3-Codex on heti saatavilla maksaville ChatGPT-käyttäjille kaikilla Codex-pinnoilla:
- Työpöytäsovellus (macOS ja Windows)
- Komentoriviliittymä (CLI)
- IDE-laajennukset (VS Code, JetBrains jne.)
Tilaussuunnitelmat
Rajoitetun ajan maksulliset suunnitelmat saavat kaksinkertaiset normaalit rajoitukset.
API-hinnoittelu
Julkaisuhetkellä OpenAI ei ole julkaissut virallista API-hinnoittelua GPT-5.3-Codexille. API-pääsyä kuvaillaan "otettavan käyttöön pian" ja "tulevina viikkoina".
Vertailun vuoksi edellisen mallin (GPT-5.2-Codex) nykyinen API-hinnoittelu on:
Infrastruktuuri
GPT-5.3-Codex on suunniteltu, koulutettu ja tarjoiltu yhdessä NVIDIA GB200 NVL72 -järjestelmien kanssa – osoitus OpenAI:n ja NVIDIA:n tiiviistä yhteistyöstä tekoälyn suorituskyvyn rajojen työntämisessä.
Vertailu kilpailijoihin
GPT-5.3-Codexin julkaisu tuli vain muutama minuutti Anthropicin Claude Opus 4.6:n julkistuksen jälkeen, mikä loi välittömän vertailun näiden kahden mallin välille.
GPT-5.3-Codexin vahvuudet
- Terminal-Bench 2.0: 77,3 vs. Opus 4.6:n 65,4 (+18,6 % etu)
- 25 % nopeampi suorituskyky
- "Korkea luotettavuus, alhainen varianssi" suunnittelufilosofia
- Itsensä rakentamisen kyky (auttoi luomaan itsensä)
- Ensimmäinen "korkean suorituskyvyn" kyberturvallisuusluokitus
Claude Opus 4.6:n vahvuudet
- 1 miljoonan tokenin konteksti-ikkuna (huomattavasti suurempi)
- Agenttitiimit yhteistyötoiminto
- Laajempi monipuolisuus tietotyöskenaarioissa
- Korkeampi luovuuslämpötila (enemmän persoonallisuutta)
Suunnittelufilosofian erot
Laajempi kuva
GPT-5.3-Codex edustaa enemmän kuin vain asteittaista päivitystä – se on harppaus kohti yleiskäyttöisiä agentteja, jotka voivat järkeillä, rakentaa ja toteuttaa todellisen teknisen työn koko kirjossa.
Koodiagentista tietokoneagentiksi
OpenAI kehystää tämän kehityksen nimenomaisesti: "Codex on siirtymässä koodin kirjoittamisen ulkopuolelle käyttämään sitä työkaluna tietokoneen käyttämiseen ja työn suorittamiseen päästä päähän".
Tämä on syvällinen muutos. Se, mikä alkoi keskittymisestä "parhaaksi koodausagentiksi" olemiseen, on tullut perusta yleisemmälle yhteistyökumppanille tietokoneella – laajentaen sekä sitä, kuka voi rakentaa, että sitä, mikä on mahdollista tekoälyn avulla.
Tekoälyn kehityksen nopeuttaminen
Se, että GPT-5.3-Codex auttoi rakentamaan itsensä, on esimakua tulevasta. Kuten OpenAI:n tutkijat toteavat, "monet OpenAI:n tutkijat ja insinöörit kuvaavat työtään nykyään pohjimmiltaan erilaiseksi kuin se oli vain kaksi kuukautta sitten".
Tämä viittaa siihen, että olemme siirtymässä nopeutuvien tuottojen aikaan tekoälyn kehityksessä, jossa jokainen mallisukupolvi auttaa rakentamaan seuraavan – mahdollisesti puristaen aikajanoja vuosista kuukausiin.
Vaikutukset kehittäjille
Ohjelmistokehittäjille vaikutukset ovat merkittäviä:
- Nopeammat kehityssyklit - Tekoäly hoitaa enemmän rutiinityötä
- Korkeamman tason abstraktio - Kehittäjät voivat keskittyä arkkitehtuuriin ja suunnitteluun
- Interaktiivinen yhteistyö - Vähemmän työkalun käyttöä, enemmän työskentelyä tiimin jäsenen kanssa
- Uusia ominaisuuksia - Tehtävät, jotka aiemmin vaativat erikoisosaamista, ovat nyt saatavilla
Vaikutukset yrityksille
Yrityksille GPT-5.3-Codex edustaa:
- Lisääntynyttä tuottavuutta - Enemmän työtä saadaan tehtyä vähemmässä ajassa
- Alhaisempia esteitä - Vähemmän erikoistaitoja tarvitaan tiettyihin tehtäviin
- Uusia turvallisuusnäkökohdista - "Korkean suorituskyvyn" kyberturvallisuusluokitus edellyttää huolellista hallintaa
- Kilpailuetua - Tehokkaan agenttipohjaisen tekoälyn varhainen käyttöönotto
Johtopäätös
GPT-5.3-Codex on merkittävä saavutus tekoälyn alalla. Se yhdistää:
- Huippuluokan koodaussuorituskyvyn
- Edistyneet agenttiominaisuudet
- Interaktiivisen yhteistyön
- Itsensä kehittämisen (se auttoi rakentamaan itsensä)
- Tietokoneen käytön todellisessa maailmassa
Se, että se oli keskeisessä asemassa omassa luomisessaan, toimii sekä teknisenä saavutuksena että metaforana siitä, mihin tekoäly on menossa. Mallien kehittyessä kyvykkäämmiksi, ne eivät ole vain työkaluja, joita käytämme – niistä on tulossa kumppaneita itse luovaan ja kehitysprosessiin.
Samanaikainen julkaisu Claude Opus 4.6:n kanssa, vain muutaman minuutin välein, korostaa kilpailun kovuutta tekoälyalalla. Mutta mikä tärkeintä, se osoittaa, että olemme siirtyneet tekoälyn suorituskyvyn uuteen vaiheeseen – vaiheeseen, jossa agentit voivat luotettavasti käsitellä monimutkaisia, pitkäjänteisiä tehtäviä ammattimaisen tietokonetyön koko kirjossa.
Kuten OpenAI toteaa: "Se, mikä alkoi keskittymisestä parhaaksi koodausagentiksi olemiseen, on tullut perusta yleisemmälle yhteistyökumppanille tietokoneella".
Kysymys ei nyt ole vain se, mitä nämä mallit voivat tehdä – vaan se, mitä päätämme rakentaa niillä.
Lähteet
Vastuuvapauslauseke: Tämä artikkeli perustuu tietoihin, jotka olivat saatavilla 6. helmikuuta 2026. Tekniset tiedot, hinnoittelu ja saatavuus voivat muuttua. Katso uusimmat tiedot virallisesta OpenAI-dokumentaatiosta.