Introduksjon
Den 5. februar 2026 kunngjorde OpenAI GPT-5.3-Codex, deres mest avanserte agentbaserte kodemodell til dags dato. Denne lanseringen markerer en viktig milepæl innen kunstig intelligens – ikke bare for sine imponerende tekniske egenskaper, men også fordi det er den første modellen som var medvirkende til å skape seg selv.
GPT-5.3-Codex representerer et fundamentalt skifte fra et kodeprogrammeringsverktøy til en interaktiv AI-samarbeidspartner som er i stand til å håndtere langsiktig, virkelig teknisk arbeid over hele spekteret av profesjonelle databehandlingsoppgaver.
Hva gjør GPT-5.3-Codex annerledes?
En ekte agentbasert modell
I motsetning til tradisjonelle kodeassistenter som bare genererer kodebiter, er GPT-5.3-Codex designet som en «agentbasert» modell. Dette betyr at den kan:
- Opprettholde kontekst over langvarige oppgaver som strekker seg over timer eller til og med dager
- Bruke verktøy autonomt, inkludert kommandolinjegrensesnitt, filsystemer og utviklingsmiljøer
- Tilpasse og iterere basert på tilbakemeldinger i sanntid uten å miste oversikten
- Håndtere komplekse flertrinnsworkflows som krever research, planlegging og utførelse
Selvbyggende prestasjon
Det kanskje mest bemerkelsesverdige aspektet ved GPT-5.3-Codex er at Codex-teamet brukte tidlige versjoner av modellen til å:
- Feilsøke sin egen treningsprosess
- Administrere sin egen distribusjon
- Diagnostisere testresultater og evalueringer
- Optimalisere infrastruktur for den endelige utgivelsen
Denne selvrefererende utviklingssyklusen demonstrerer hvordan AI begynner å akselerere sin egen forbedring – en milepæl som OpenAI-forskere beskrev som at de ble «overveldet over hvor mye Codex var i stand til å akselerere sin egen utvikling.»
Ytelsesforbedringer
GPT-5.3-Codex er 25 % raskere enn sin forgjenger (GPT-5.2-Codex), takket være forbedringer i OpenAIs infrastruktur og inferensstack. Denne hastighetsforbedringen muliggjør mer responsivt samarbeid i sanntid og raskere iterasjonssykluser.
Benchmark-ytelse: Dataene
GPT-5.3-Codex oppnår state-of-the-art ytelse på tvers av flere viktige benchmarks som måler koding, agentbaserte evner og bruk av datamaskiner i den virkelige verden.
SWE-Bench Pro
SWE-Bench Pro er en streng evaluering av programvareutvikling i den virkelige verden som spenner over fire programmeringsspråk (Python, JavaScript, TypeScript og Go). I motsetning til forgjengeren (SWE-Bench Verified) som bare testet Python, er SWE-Bench Pro designet for å være mer motstandsdyktig mot kontaminering og mer bransjerelevant.
Terminal-Bench 2.0
Forbedringen på 13,3 % på Terminal-Bench 2.0 er spesielt betydelig. Denne benchmarken måler terminalferdighetene som en kodeagent trenger – navigere i filsystemer, utføre kommandoer og administrere utviklingsarbeidsflyter. Spesielt oppnår GPT-5.3-Codex dette med færre tokens enn noen tidligere modell, noe som gjør den mer effektiv.
OSWorld-Verified
Hoppet på 26,5 % på OSWorld-Verified demonstrerer dramatisk forbedrede datamaskinbruksegenskaper. OSWorld er en agentbasert datamaskinbruksbenchmark der agenter må fullføre produktivitetsoppgaver i et visuelt skrivebordsmiljø. Denne massive forbedringen viser at GPT-5.3-Codex er langt bedre til å navigere i virkelige grensesnitt enn tidligere modeller.
Utover kode: En agent for generelle formål
Mens GPT-5.3-Codex utmerker seg i programmering, strekker dens evner seg langt utover kodegenerering. OpenAI posisjonerer den som en agent som kan håndtere «nesten alt utviklere og fagfolk kan gjøre på en datamaskin.»
Støtte for programvarelivssyklus
Modellen er bygget for å støtte hele programvareutviklingslivssyklusen:
- Feilsøking – Identifisere og fikse feil
- Distribusjon – Administrere utgivelser og infrastruktur
- Overvåking – Sporing av ytelse og målinger
- Skriving av PRD-er – Produktskravdokumenter
- Redigering av tekst – Dokumentasjon og markedsføringstekst
- Brukerundersøkelser – Analysere tilbakemeldinger fra brukere
- Testing – Skrive og kjøre testsuiter
- Metrikkanalyse – Datadrevet beslutningstaking
Kunnskapsarbeidsevner
På GDPval (OpenAIs evaluering fra 2025 som måler ytelse på kunnskapsarbeidsoppgaver på tvers av 44 yrker), matcher GPT-5.3-Codex GPT-5.2s ytelse. Dette inkluderer oppgaver som:
- Opprette lysbildevisninger og presentasjoner
- Analysere data i regneark
- Dokumenthåndtering og organisering
Eksempel på webutvikling
For å demonstrere modellens evner, ba OpenAI GPT-5.3-Codex om å bygge to komplette spill fra bunnen av:
- Et bilspill (versjon 2 av Codex-appens lanseringsspill)
Ved å bare bruke en «utvikle webspill»-ferdighet og generiske oppfølgingsmeldinger som «fikse feilen» eller «forbedre spillet», itererte GPT-5.3-Codex autonomt over millioner av tokens og bygde svært funksjonelle, polerte spill.
Bedre intensjonsforståelse
Sammenlignet med GPT-5.2-Codex, forstår den nye modellen bedre brukerintensjonen når den bygger nettsteder. Enkle eller underspesifiserte meldinger standardiseres nå til nettsteder med:
- Fornuftige standardinnstillinger
- Produksjonsklare funksjoner
For eksempel, når den ble bedt om å bygge en landingsside for priser, viste GPT-5.3-Codex automatisk årsplanen som en rabattert månedspris (som gjorde rabatten tydelig) og opprettet en automatisk overgangskarusell for attester med tre distinkte brukeranbefalinger – noe som resulterte i en mer komplett og polert design.
Interaktivt samarbeid
En av de viktigste forbedringene i brukeropplevelsen er muligheten til å styre modellen mens den jobber.
Sanntidsinteraksjon
I stedet for å vente på et endelig resultat, kan brukerne nå:
- Stille spørsmål under utførelsen
- Diskutere forskjellige tilnærminger
- Styre mot spesifikke løsninger
- Gi tilbakemelding midtveis i oppgaven
GPT-5.3-Codex snakker om hva den gjør, svarer på tilbakemeldinger og holder brukerne orientert fra start til slutt. Dette kan aktiveres i Codex-appen via Innstillinger > Generelt > Oppfølgingsatferd.
Dette transformerer opplevelsen fra å gi kommandoer til en maskin til å samarbeide med en lagkamerat – et fundamentalt skifte i hvordan mennesker samhandler med AI-systemer.
Cybersikkerhetsevner og sikkerhet
GPT-5.3-Codex er den første modellen OpenAI klassifiserer som «Høy kapasitet» for cybersikkerhetsrelaterte oppgaver under sitt Preparedness Framework. Det er også den første modellen som er direkte trent til å identifisere programvaresårbarheter.
Dobbel natur
Fordi cybersikkerhet i sin natur er todelt (nyttig for både forsvar og angrep), tar OpenAI en føre var-tilnærming:
- Ingen definitive bevis for at den kan automatisere cyberangrep ende-til-ende
- Distribusjon av omfattende cybersikkerhetsstack
- Implementering av sikkerhetstrening og automatisert overvåking
- Krever pålitelig tilgang for avanserte funksjoner
Pålitelig tilgang for Cyber
OpenAI lanserer Trusted Access for Cyber, et pilotprogram for å:
- Akselerere cybersikkerhetsforskning
- Skaffe verktøy til forsvarere først
- Støtte økosystemets robusthet
$10 millioner i forpliktelse
Bygger videre på et Cybersecurity Grant Program på 1 million dollar fra 2023, og OpenAI forplikter seg til 10 millioner dollar i API-kreditter for å akselerere cyberforsvar, spesielt for:
- Programvare med åpen kildekode
- Kritiske infrastruktursystemer
- Sikkerhetsforskning i god tro
Aardvark Security Agent
OpenAI utvider den private betaen av Aardvark, sin sikkerhetsforskningsagent, som det første tilbudet i sin suite av Codex Security-produkter og -verktøy. De samarbeider også med vedlikeholdere av åpen kildekode for å tilby gratis kodebaseskanning for mye brukte prosjekter som Next.js.
Hvordan OpenAI brukte Codex til å bygge Codex
Utviklingen av GPT-5.3-Codex gir en fascinerende casestudie i AI-akselerert forskning.
Brukstilfeller for forskningsteamet
Forskerteamet brukte tidlige versjoner av GPT-5.3-Codex til å:
- Overvåke og feilsøke treningskjøringen for utgivelsen
- Spore mønstre gjennom hele treningsforløpet
- Gi dyp analyse av interaksjonskvalitet
- Foreslå rettelser og bygge rike applikasjoner for menneskelige forskere
- Forstå nøyaktig hvordan modellens atferd skilte seg fra tidligere modeller
Brukstilfeller for ingeniørteamet
Ingeniørteamet brukte Codex til å:
- Optimalisere og tilpasse rammeverket for GPT-5.3-Codex
- Identifisere feil i kontekstgjengivelse som påvirker brukere
- Finne årsaken til lave cache-treffrater
- Dynamisk skalere GPU-klynger for å tilpasse seg trafikkoppgang
- Holde ventetiden stabil under lanseringen
Brukstilfeller for dataforskning
Under alfa-testing jobbet en dataforsker med GPT-5.3-Codex for å:
- Bygge regex-klassifiserere for å estimere frekvensen av presiseringer, brukersvar og fremdrift i oppgaven
- Kjøre disse klassifisererne skalerbart over alle øktlogger
- Bygge nye datapipeliner og visualisere resultater rikere enn standard dashbordverktøy
- Sam-analysere resultater, med Codex som oppsummerer viktige innsikter over tusenvis av datapunkter på under tre minutter
Produktivitetsgevinster
Resultatet? Folk som bygger med Codex var lykkeligere ettersom agenten:
- Forsto intensjonen deres bedre
- Gjorde mer fremgang per vending
- Stilte færre avklarende spørsmål
Tilgjengelighet og priser
Slik får du tilgang
GPT-5.3-Codex er tilgjengelig umiddelbart for betalende ChatGPT-brukere på tvers av alle Codex-overflater:
- Skrivebordsapp (macOS og Windows)
- Kommandolinjegrensesnitt (CLI)
- IDE-utvidelser (VS Code, JetBrains, osv.)
Abonnementsplaner
I en begrenset periode vil betalte planer motta dobbelt så mange normale ratebegrensninger.
API-priser
Ved lansering har OpenAI ikke frigitt offisielle API-priser for GPT-5.3-Codex. API-tilgang beskrives som «rulles ut snart» og «kommer i de følgende ukene.»
Som referanse er gjeldende API-priser for den forrige modellen (GPT-5.2-Codex):
Infrastruktur
GPT-5.3-Codex ble samdesignet for, trent med og servert på NVIDIA GB200 NVL72-systemer – et bevis på det tette samarbeidet mellom OpenAI og NVIDIA for å flytte grensene for AI-kapasitet.
Sammenligning med konkurrenter
Utgivelsen av GPT-5.3-Codex kom bare minutter etter Anthropic's kunngjøring av Claude Opus 4.6, og la opp til en umiddelbar sammenligning mellom de to modellene.
GPT-5.3-Codex styrker
- Terminal-Bench 2.0: 77,3 vs Opus 4.6's 65,4 (+18,6 % fordel)
- «Høy pålitelighet, lav varians» designfilosofi
- Selvbyggende evne (hjalp til med å skape seg selv)
- Første «Høy kapasitet» cybersikkerhetsklassifisering
Claude Opus 4.6 styrker
- 1 million token kontekstvindu (betydelig større)
- Agent Teams samarbeidsfunksjonalitet
- Bredere allsidighet på tvers av kunnskapsarbeidsscenarioer
- Høyere kreativitetstemperatur (mer personlighet)
Designfilosofiforskjeller
Det større bildet
GPT-5.3-Codex representerer mer enn bare en trinnvis oppgradering – det er et stort skritt mot agenter for generelle formål som kan resonnere, bygge og utføre over hele spekteret av teknisk arbeid i den virkelige verden.
Fra kodeagent til datamaskinagent
OpenAI rammer eksplisitt inn denne utviklingen: «Codex beveger seg utover å skrive kode til å bruke den som et verktøy for å betjene en datamaskin og fullføre arbeid fra start til slutt.»
Dette er et dyptgående skifte. Det som startet som et fokus på å være «den beste kodeagenten» har blitt grunnlaget for en mer generell samarbeidspartner på datamaskinen – og utvider både hvem som kan bygge og hva som er mulig med AI.
Akselererende AI-utvikling
Det faktum at GPT-5.3-Codex hjalp til med å bygge seg selv, er en forhåndsvisning av hva som kommer. Som OpenAI-forskere bemerker, «mange forskere og ingeniører hos OpenAI beskriver jobben sin i dag som fundamentalt forskjellig fra hva den var for bare to måneder siden.»
Dette antyder at vi går inn i en periode med akselerert avkastning i AI-utviklingen, hvor hver generasjon av modeller hjelper til med å bygge den neste – potensielt komprimerer tidslinjer fra år til måneder.
Implikasjoner for utviklere
For programvareutviklere er implikasjonene betydelige:
- Raskere utviklingssykluser – AI håndterer mer av rutinearbeidet
- Abstraksjon på høyere nivå – Utviklere kan fokusere på arkitektur og design
- Interaktivt samarbeid – Mindre som å bruke et verktøy, mer som å jobbe med en lagkamerat
- Nye evner – Oppgaver som tidligere krevde spesialisert kunnskap er nå tilgjengelige
Implikasjoner for bedrifter
For bedrifter representerer GPT-5.3-Codex:
- Økt produktivitet – Mer arbeid blir gjort på kortere tid
- Lavere barrierer – Færre spesialiserte ferdigheter nødvendig for visse oppgaver
- Nye sikkerhetshensyn – «Høy kapasitet» cybersikkerhetsklassifisering krever nøye styring
- Konkurransefortrinn – Tidlig bruk av kraftig agentbasert AI
Konklusjon
GPT-5.3-Codex er en landemerkeprestasjon innen kunstig intelligens. Den kombinerer:
- State-of-the-art kodeytelse
- Avanserte agentbaserte evner
- Selvforbedring (den hjalp til med å bygge seg selv)
- Datamaskinbruk i den virkelige verden
Det faktum at den var medvirkende til sin egen skapelse, tjener både som en teknisk prestasjon og en metafor for hvor AI er på vei. Etter hvert som modeller blir mer kapable, er de ikke bare verktøy vi bruker – de blir partnere i den kreative og utviklingsmessige prosessen selv.
Den samtidige utgivelsen med Claude Opus 4.6, bare minutter fra hverandre, understreker intensiteten i konkurransen i AI-området. Men enda viktigere signaliserer det at vi har gått inn i en ny fase av AI-kapasitet – en der agenter pålitelig kan håndtere komplekse, langsiktige oppgaver over hele spekteret av profesjonelt datamaskin arbeid.
Som OpenAI sier det: «Det som startet som et fokus på å være den beste kodeagenten, har blitt grunnlaget for en mer generell samarbeidspartner på datamaskinen.»
Spørsmålet nå er ikke bare hva disse modellene kan gjøre – det er hva vi vil velge å bygge med dem.
Kilder
Ansvarsfraskrivelse: Denne artikkelen er basert på informasjon som er tilgjengelig per 6. februar 2026. Spesifikasjoner, priser og tilgjengelighet kan endres. Se offisiell OpenAI-dokumentasjon for den mest oppdaterte informasjonen.