Introduksjon

Den 5. februar 2026 kunngjorde OpenAI GPT-5.3-Codex, deres mest avanserte agentbaserte kodemodell til dags dato. Denne lanseringen markerer en viktig milepæl innen kunstig intelligens – ikke bare for sine imponerende tekniske egenskaper, men også fordi det er den første modellen som var medvirkende til å skape seg selv.

GPT-5.3-Codex representerer et fundamentalt skifte fra et kodeprogrammeringsverktøy til en interaktiv AI-samarbeidspartner som er i stand til å håndtere langsiktig, virkelig teknisk arbeid over hele spekteret av profesjonelle databehandlingsoppgaver.

Hva gjør GPT-5.3-Codex annerledes?

En ekte agentbasert modell

I motsetning til tradisjonelle kodeassistenter som bare genererer kodebiter, er GPT-5.3-Codex designet som en «agentbasert» modell. Dette betyr at den kan:

Opprettholde kontekst over langvarige oppgaver som strekker seg over timer eller til og med dager

Bruke verktøy autonomt, inkludert kommandolinjegrensesnitt, filsystemer og utviklingsmiljøer

Tilpasse og iterere basert på tilbakemeldinger i sanntid uten å miste oversikten

Håndtere komplekse flertrinnsworkflows som krever research, planlegging og utførelse

Selvbyggende prestasjon

Det kanskje mest bemerkelsesverdige aspektet ved GPT-5.3-Codex er at Codex-teamet brukte tidlige versjoner av modellen til å:

Feilsøke sin egen treningsprosess

Administrere sin egen distribusjon

Diagnostisere testresultater og evalueringer

Optimalisere infrastruktur for den endelige utgivelsen

Denne selvrefererende utviklingssyklusen demonstrerer hvordan AI begynner å akselerere sin egen forbedring – en milepæl som OpenAI-forskere beskrev som at de ble «overveldet over hvor mye Codex var i stand til å akselerere sin egen utvikling.»

Ytelsesforbedringer

GPT-5.3-Codex er 25 % raskere enn sin forgjenger (GPT-5.2-Codex), takket være forbedringer i OpenAIs infrastruktur og inferensstack. Denne hastighetsforbedringen muliggjør mer responsivt samarbeid i sanntid og raskere iterasjonssykluser.

Benchmark-ytelse: Dataene

GPT-5.3-Codex oppnår state-of-the-art ytelse på tvers av flere viktige benchmarks som måler koding, agentbaserte evner og bruk av datamaskiner i den virkelige verden.

SWE-Bench Pro

SWE-Bench Pro er en streng evaluering av programvareutvikling i den virkelige verden som spenner over fire programmeringsspråk (Python, JavaScript, TypeScript og Go). I motsetning til forgjengeren (SWE-Bench Verified) som bare testet Python, er SWE-Bench Pro designet for å være mer motstandsdyktig mot kontaminering og mer bransjerelevant.

Terminal-Bench 2.0

Forbedringen på 13,3 % på Terminal-Bench 2.0 er spesielt betydelig. Denne benchmarken måler terminalferdighetene som en kodeagent trenger – navigere i filsystemer, utføre kommandoer og administrere utviklingsarbeidsflyter. Spesielt oppnår GPT-5.3-Codex dette med færre tokens enn noen tidligere modell, noe som gjør den mer effektiv.

OSWorld-Verified

Hoppet på 26,5 % på OSWorld-Verified demonstrerer dramatisk forbedrede datamaskinbruksegenskaper. OSWorld er en agentbasert datamaskinbruksbenchmark der agenter må fullføre produktivitetsoppgaver i et visuelt skrivebordsmiljø. Denne massive forbedringen viser at GPT-5.3-Codex er langt bedre til å navigere i virkelige grensesnitt enn tidligere modeller.

Utover kode: En agent for generelle formål

Mens GPT-5.3-Codex utmerker seg i programmering, strekker dens evner seg langt utover kodegenerering. OpenAI posisjonerer den som en agent som kan håndtere «nesten alt utviklere og fagfolk kan gjøre på en datamaskin.»

Støtte for programvarelivssyklus

Modellen er bygget for å støtte hele programvareutviklingslivssyklusen:

Feilsøking – Identifisere og fikse feil

Distribusjon – Administrere utgivelser og infrastruktur

Overvåking – Sporing av ytelse og målinger

Skriving av PRD-er – Produktskravdokumenter

Redigering av tekst – Dokumentasjon og markedsføringstekst

Brukerundersøkelser – Analysere tilbakemeldinger fra brukere

Testing – Skrive og kjøre testsuiter

Metrikkanalyse – Datadrevet beslutningstaking

Kunnskapsarbeidsevner

På GDPval (OpenAIs evaluering fra 2025 som måler ytelse på kunnskapsarbeidsoppgaver på tvers av 44 yrker), matcher GPT-5.3-Codex GPT-5.2s ytelse. Dette inkluderer oppgaver som:

Opprette lysbildevisninger og presentasjoner

Analysere data i regneark

Dokumenthåndtering og organisering

Research og syntese

Eksempel på webutvikling

For å demonstrere modellens evner, ba OpenAI GPT-5.3-Codex om å bygge to komplette spill fra bunnen av:

Et bilspill (versjon 2 av Codex-appens lanseringsspill)

Et dykkerspill

Ved å bare bruke en «utvikle webspill»-ferdighet og generiske oppfølgingsmeldinger som «fikse feilen» eller «forbedre spillet», itererte GPT-5.3-Codex autonomt over millioner av tokens og bygde svært funksjonelle, polerte spill.

Bedre intensjonsforståelse

Sammenlignet med GPT-5.2-Codex, forstår den nye modellen bedre brukerintensjonen når den bygger nettsteder. Enkle eller underspesifiserte meldinger standardiseres nå til nettsteder med:

Mer funksjonalitet

Fornuftige standardinnstillinger

Produksjonsklare funksjoner

For eksempel, når den ble bedt om å bygge en landingsside for priser, viste GPT-5.3-Codex automatisk årsplanen som en rabattert månedspris (som gjorde rabatten tydelig) og opprettet en automatisk overgangskarusell for attester med tre distinkte brukeranbefalinger – noe som resulterte i en mer komplett og polert design.

Interaktivt samarbeid

En av de viktigste forbedringene i brukeropplevelsen er muligheten til å styre modellen mens den jobber.

Sanntidsinteraksjon

I stedet for å vente på et endelig resultat, kan brukerne nå:

Stille spørsmål under utførelsen

Diskutere forskjellige tilnærminger

Styre mot spesifikke løsninger

Gi tilbakemelding midtveis i oppgaven

GPT-5.3-Codex snakker om hva den gjør, svarer på tilbakemeldinger og holder brukerne orientert fra start til slutt. Dette kan aktiveres i Codex-appen via Innstillinger > Generelt > Oppfølgingsatferd.

Dette transformerer opplevelsen fra å gi kommandoer til en maskin til å samarbeide med en lagkamerat – et fundamentalt skifte i hvordan mennesker samhandler med AI-systemer.

Cybersikkerhetsevner og sikkerhet

GPT-5.3-Codex er den første modellen OpenAI klassifiserer som «Høy kapasitet» for cybersikkerhetsrelaterte oppgaver under sitt Preparedness Framework. Det er også den første modellen som er direkte trent til å identifisere programvaresårbarheter.

Dobbel natur

Fordi cybersikkerhet i sin natur er todelt (nyttig for både forsvar og angrep), tar OpenAI en føre var-tilnærming:

Ingen definitive bevis for at den kan automatisere cyberangrep ende-til-ende

Distribusjon av omfattende cybersikkerhetsstack

Implementering av sikkerhetstrening og automatisert overvåking

Krever pålitelig tilgang for avanserte funksjoner

Pålitelig tilgang for Cyber

OpenAI lanserer Trusted Access for Cyber, et pilotprogram for å:

Akselerere cybersikkerhetsforskning

Skaffe verktøy til forsvarere først

Støtte økosystemets robusthet

$10 millioner i forpliktelse

Bygger videre på et Cybersecurity Grant Program på 1 million dollar fra 2023, og OpenAI forplikter seg til 10 millioner dollar i API-kreditter for å akselerere cyberforsvar, spesielt for:

Programvare med åpen kildekode

Kritiske infrastruktursystemer

Sikkerhetsforskning i god tro

Aardvark Security Agent

OpenAI utvider den private betaen av Aardvark, sin sikkerhetsforskningsagent, som det første tilbudet i sin suite av Codex Security-produkter og -verktøy. De samarbeider også med vedlikeholdere av åpen kildekode for å tilby gratis kodebaseskanning for mye brukte prosjekter som Next.js.

Hvordan OpenAI brukte Codex til å bygge Codex

Utviklingen av GPT-5.3-Codex gir en fascinerende casestudie i AI-akselerert forskning.

Brukstilfeller for forskningsteamet

Forskerteamet brukte tidlige versjoner av GPT-5.3-Codex til å:

Overvåke og feilsøke treningskjøringen for utgivelsen

Spore mønstre gjennom hele treningsforløpet

Gi dyp analyse av interaksjonskvalitet

Foreslå rettelser og bygge rike applikasjoner for menneskelige forskere

Forstå nøyaktig hvordan modellens atferd skilte seg fra tidligere modeller

Brukstilfeller for ingeniørteamet

Ingeniørteamet brukte Codex til å:

Optimalisere og tilpasse rammeverket for GPT-5.3-Codex

Identifisere feil i kontekstgjengivelse som påvirker brukere

Finne årsaken til lave cache-treffrater

Dynamisk skalere GPU-klynger for å tilpasse seg trafikkoppgang

Holde ventetiden stabil under lanseringen

Brukstilfeller for dataforskning

Under alfa-testing jobbet en dataforsker med GPT-5.3-Codex for å:

Bygge regex-klassifiserere for å estimere frekvensen av presiseringer, brukersvar og fremdrift i oppgaven

Kjøre disse klassifisererne skalerbart over alle øktlogger

Bygge nye datapipeliner og visualisere resultater rikere enn standard dashbordverktøy

Sam-analysere resultater, med Codex som oppsummerer viktige innsikter over tusenvis av datapunkter på under tre minutter

Produktivitetsgevinster

Resultatet? Folk som bygger med Codex var lykkeligere ettersom agenten:

Forsto intensjonen deres bedre

Gjorde mer fremgang per vending

Stilte færre avklarende spørsmål

Tilgjengelighet og priser

Slik får du tilgang

GPT-5.3-Codex er tilgjengelig umiddelbart for betalende ChatGPT-brukere på tvers av alle Codex-overflater:

Skrivebordsapp (macOS og Windows)

Kommandolinjegrensesnitt (CLI)

IDE-utvidelser (VS Code, JetBrains, osv.)

Webgrensesnitt

Abonnementsplaner

I en begrenset periode vil betalte planer motta dobbelt så mange normale ratebegrensninger.

API-priser

Ved lansering har OpenAI ikke frigitt offisielle API-priser for GPT-5.3-Codex. API-tilgang beskrives som «rulles ut snart» og «kommer i de følgende ukene.»

Som referanse er gjeldende API-priser for den forrige modellen (GPT-5.2-Codex):

Infrastruktur

GPT-5.3-Codex ble samdesignet for, trent med og servert på NVIDIA GB200 NVL72-systemer – et bevis på det tette samarbeidet mellom OpenAI og NVIDIA for å flytte grensene for AI-kapasitet.

Sammenligning med konkurrenter

Utgivelsen av GPT-5.3-Codex kom bare minutter etter Anthropic's kunngjøring av Claude Opus 4.6, og la opp til en umiddelbar sammenligning mellom de to modellene.

GPT-5.3-Codex styrker

Terminal-Bench 2.0: 77,3 vs Opus 4.6's 65,4 (+18,6 % fordel)

25 % raskere ytelse

«Høy pålitelighet, lav varians» designfilosofi

Selvbyggende evne (hjalp til med å skape seg selv)

Første «Høy kapasitet» cybersikkerhetsklassifisering

Claude Opus 4.6 styrker

1 million token kontekstvindu (betydelig større)

Agent Teams samarbeidsfunksjonalitet

Bredere allsidighet på tvers av kunnskapsarbeidsscenarioer

Høyere kreativitetstemperatur (mer personlighet)

Designfilosofiforskjeller

Det større bildet

GPT-5.3-Codex representerer mer enn bare en trinnvis oppgradering – det er et stort skritt mot agenter for generelle formål som kan resonnere, bygge og utføre over hele spekteret av teknisk arbeid i den virkelige verden.

Fra kodeagent til datamaskinagent

OpenAI rammer eksplisitt inn denne utviklingen: «Codex beveger seg utover å skrive kode til å bruke den som et verktøy for å betjene en datamaskin og fullføre arbeid fra start til slutt.»

Dette er et dyptgående skifte. Det som startet som et fokus på å være «den beste kodeagenten» har blitt grunnlaget for en mer generell samarbeidspartner på datamaskinen – og utvider både hvem som kan bygge og hva som er mulig med AI.

Akselererende AI-utvikling

Det faktum at GPT-5.3-Codex hjalp til med å bygge seg selv, er en forhåndsvisning av hva som kommer. Som OpenAI-forskere bemerker, «mange forskere og ingeniører hos OpenAI beskriver jobben sin i dag som fundamentalt forskjellig fra hva den var for bare to måneder siden.»

Dette antyder at vi går inn i en periode med akselerert avkastning i AI-utviklingen, hvor hver generasjon av modeller hjelper til med å bygge den neste – potensielt komprimerer tidslinjer fra år til måneder.

Implikasjoner for utviklere

For programvareutviklere er implikasjonene betydelige:

Raskere utviklingssykluser – AI håndterer mer av rutinearbeidet

Abstraksjon på høyere nivå – Utviklere kan fokusere på arkitektur og design

Interaktivt samarbeid – Mindre som å bruke et verktøy, mer som å jobbe med en lagkamerat

Nye evner – Oppgaver som tidligere krevde spesialisert kunnskap er nå tilgjengelige

Implikasjoner for bedrifter

For bedrifter representerer GPT-5.3-Codex:

Økt produktivitet – Mer arbeid blir gjort på kortere tid

Lavere barrierer – Færre spesialiserte ferdigheter nødvendig for visse oppgaver

Nye sikkerhetshensyn – «Høy kapasitet» cybersikkerhetsklassifisering krever nøye styring

Konkurransefortrinn – Tidlig bruk av kraftig agentbasert AI

Konklusjon

GPT-5.3-Codex er en landemerkeprestasjon innen kunstig intelligens. Den kombinerer:

State-of-the-art kodeytelse

Avanserte agentbaserte evner

Interaktivt samarbeid

Selvforbedring (den hjalp til med å bygge seg selv)

Datamaskinbruk i den virkelige verden

Det faktum at den var medvirkende til sin egen skapelse, tjener både som en teknisk prestasjon og en metafor for hvor AI er på vei. Etter hvert som modeller blir mer kapable, er de ikke bare verktøy vi bruker – de blir partnere i den kreative og utviklingsmessige prosessen selv.

Den samtidige utgivelsen med Claude Opus 4.6, bare minutter fra hverandre, understreker intensiteten i konkurransen i AI-området. Men enda viktigere signaliserer det at vi har gått inn i en ny fase av AI-kapasitet – en der agenter pålitelig kan håndtere komplekse, langsiktige oppgaver over hele spekteret av profesjonelt datamaskin arbeid.

Som OpenAI sier det: «Det som startet som et fokus på å være den beste kodeagenten, har blitt grunnlaget for en mer generell samarbeidspartner på datamaskinen.»

Spørsmålet nå er ikke bare hva disse modellene kan gjøre – det er hva vi vil velge å bygge med dem.

Kilder

Vi presenterer GPT-5.3-Codex – Offisiell kunngjøring fra OpenAI

GPT-5.3-Codex System Card – OpenAI

GPT 5.3 Codex priser, benchmarks og funksjoner forklart – eesel AI

OpenAI: Ny kodemodell GPT-5.3-Codex hjalp til med å bygge seg selv – Mashable

Med GPT-5.3-Codex presenterer OpenAI Codex for mer enn bare å skrive kode – Ars Technica

OpenAI lanserer ny agentbasert kodemodell bare minutter etter at Anthropic slipper sin egen – TechCrunch

Opus 4.6 vs CODEX 5.3, første reelle sammenligning – Reddit

GPT 5.3 Codex vs. Opus 4.6: The Great Convergence – Every

OpenAI Platform-priser

Codex-priser

SWE-Bench Offisiell Leaderboard

Ansvarsfraskrivelse: Denne artikkelen er basert på informasjon som er tilgjengelig per 6. februar 2026. Spesifikasjoner, priser og tilgjengelighet kan endres. Se offisiell OpenAI-dokumentasjon for den mest oppdaterte informasjonen.

GPT-5.3-Codex: OpenAI sin mest kapable agentiske kodingsmodell