Introduktion
Den 5. februar 2026 annoncerede OpenAI GPT-5.3-Codex, deres mest avancerede agentbaserede kodningsmodel til dato. Denne udgivelse markerer en betydelig milepæl i kunstig intelligens – ikke kun for dens imponerende tekniske egenskaber, men også fordi det er den første model, der var medvirkende til at skabe sig selv.
GPT-5.3-Codex repræsenterer et fundamentalt skift fra et kode-skrivningsværktøj til en interaktiv AI-samarbejdspartner, der er i stand til at håndtere langsigtede, virkelige tekniske opgaver på tværs af hele spektret af professionelle computeropgaver.
Hvad gør GPT-5.3-Codex anderledes?
En ægte agentbaseret model
I modsætning til traditionelle kodeassistenter, der blot genererer kodestykker, er GPT-5.3-Codex designet som en "agentbaseret" model. Det betyder, at den kan:
- Beholde kontekst over langvarige opgaver, der strækker sig over timer eller endda dage
- Bruge værktøjer autonomt, herunder kommandolinjegrænseflader, filsystemer og udviklingsmiljøer
- Tilpasse og iterere baseret på feedback i realtid uden at miste overblikket
- Håndtere komplekse, flertrins workflows, der kræver research, planlægning og udførelse
Selvskabende præstation
Det måske mest bemærkelsesværdige aspekt ved GPT-5.3-Codex er, at Codex-teamet brugte tidlige versioner af modellen til at:
- Fejlfinde sin egen træningsproces
- Administrere sin egen implementering
- Diagnosticere testresultater og evalueringer
- Optimere infrastrukturen til den endelige udgivelse
Denne selvhenvisende udviklingscyklus demonstrerer, hvordan AI er begyndt at accelerere sin egen forbedring – en milepæl, som OpenAI-forskere beskrev som at have efterladt dem "overvældede over, hvor meget Codex var i stand til at fremskynde sin egen udvikling."
Performanceforbedringer
GPT-5.3-Codex er 25 % hurtigere end sin forgænger (GPT-5.2-Codex) takket være forbedringer i OpenAIs infrastruktur og inferensstack. Denne hastighedsforbedring muliggør mere responsivt samarbejde i realtid og hurtigere iterationscyklusser.
Benchmark-performance: Dataene
GPT-5.3-Codex opnår state-of-the-art performance på tværs af flere centrale benchmarks, der måler kodning, agentbaserede egenskaber og reel computerbrug.
SWE-Bench Pro
SWE-Bench Pro er en streng evaluering af reel softwareudvikling, der spænder over fire programmeringssprog (Python, JavaScript, TypeScript og Go). I modsætning til sin forgænger (SWE-Bench Verified), som kun testede Python, er SWE-Bench Pro designet til at være mere resistent over for kontaminering og mere industrirelevant.
Terminal-Bench 2.0
Den 13,3 % forbedring på Terminal-Bench 2.0 er særligt signifikant. Denne benchmark måler de terminalfærdigheder, som en kodningsagent har brug for – navigering i filsystemer, udførelse af kommandoer og administration af udviklingsworkflows. Især opnår GPT-5.3-Codex dette med færre tokens end nogen tidligere model, hvilket gør den mere effektiv.
OSWorld-Verified
Det 26,5 % spring på OSWorld-Verified demonstrerer dramatisk forbedrede computerbrugsegenskaber. OSWorld er en agentbaseret computerbrugsbenchmark, hvor agenter skal udføre produktivitetsopgaver i et visuelt skrivebordsmiljø. Denne massive forbedring viser, at GPT-5.3-Codex er langt bedre til at navigere i virkelige grænseflader end tidligere modeller.
Ud over kode: En generel agent
Mens GPT-5.3-Codex udmærker sig inden for programmering, strækker dens egenskaber sig langt ud over kodegenerering. OpenAI positionerer den som en agent, der kan håndtere "næsten alt, hvad udviklere og fagfolk kan gøre på en computer."
Support til softwarelivscyklus
Modellen er bygget til at understøtte hele softwareudviklingslivscyklussen:
- Fejlfinding - Identificering og rettelse af fejl
- Implementering - Administration af udgivelser og infrastruktur
- Overvågning - Sporing af performance og metrics
- Skrivning af PRD'er - Produktspecifikationsdokumenter
- Redigering af tekst - Dokumentation og marketingtekst
- Brugerundersøgelse - Analyse af brugerfeedback
- Test - Skrivning og kørsel af testsuiter
- Metrics-analyse - Datadrevet beslutningstagning
Videnarbejdsegenskaber
På GDPval (OpenAIs evaluering fra 2025, der måler performance på videnarbejdsopgaver på tværs af 44 erhverv) matcher GPT-5.3-Codex GPT-5.2's performance. Dette inkluderer opgaver som:
- Oprettelse af slidedæk og præsentationer
- Analyse af data i regneark
- Dokumentstyring og -organisation
Eksempel på webudvikling
For at demonstrere modellens egenskaber bad OpenAI GPT-5.3-Codex om at bygge to komplette spil fra bunden:
- Et racerspil (version 2 af Codex-appens lanceringsspil)
Ved kun at bruge en "udvikl webspil"-færdighed og generiske opfølgningsprompter som "ret fejlen" eller "forbedre spillet" itererede GPT-5.3-Codex autonomt over millioner af tokens og byggede meget funktionelle, polerede spil.
Bedre forståelse af hensigt
Sammenlignet med GPT-5.2-Codex forstår den nye model bedre brugerens hensigt, når der bygges websteder. Simple eller under specificerede prompter fører nu som standard til websteder med:
- Fornuftige standardindstillinger
- Produktionsklare funktioner
For eksempel, da GPT-5.3-Codex blev bedt om at bygge en landingsside med priser, viste den automatisk årsabonnementet som en månedlig pris med rabat (hvilket gjorde rabatten tydelig) og oprettede en automatisk skiftende testimonial-karrusel med tre forskellige brugercitater – hvilket resulterede i et mere komplet og poleret design.
Interaktivt samarbejde
En af de mest markante forbedringer af brugeroplevelsen er muligheden for at styre modellen, mens den arbejder.
Interaktion i realtid
I stedet for at vente på et endeligt output kan brugerne nu:
- Stille spørgsmål under udførelsen
- Diskutere forskellige tilgange
- Styre mod specifikke løsninger
- Give feedback midt i opgaven
GPT-5.3-Codex forklarer, hvad den laver, reagerer på feedback og holder brugerne orienteret fra start til slut. Dette kan aktiveres i Codex-appen via Indstillinger > Generelt > Opfølgningsadfærd.
Dette transformerer oplevelsen fra at give kommandoer til en maskine til at samarbejde med en teamkammerat – et fundamentalt skift i, hvordan mennesker interagerer med AI-systemer.
Cybersecurity-egenskaber og -sikkerhed
GPT-5.3-Codex er den første model, OpenAI klassificerer som "Høj kapacitet" til cybersikkerhedsrelaterede opgaver under sit Preparedness Framework. Det er også den første model, der er direkte trænet til at identificere software-sårbarheder.
Dobbeltanvendelig natur
Fordi cybersikkerhed i sagens natur er dobbeltanvendelig (nyttig til både forsvar og angreb), tager OpenAI en forsigtig tilgang:
- Intet entydigt bevis for, at den kan automatisere cyberangreb fra ende til anden
- Implementering af omfattende cybersikkerhedssikkerhedsstak
- Implementering af sikkerhedstræning og automatiseret overvågning
- Kræver pålidelig adgang for avancerede egenskaber
Pålidelig adgang til Cyber
OpenAI lancerer Trusted Access for Cyber, et pilotprogram for at:
- Fremskynde cyberforskningsforskning
- Give forsvarere værktøjer først
- Støtte økosystemets robusthed
$10 mio. forpligtelse
På baggrund af et $1 mio. Cybersecurity Grant Program fra 2023 forpligter OpenAI sig til $10 millioner i API-kreditter for at fremskynde cyberforsvar, især for:
- Kritiske infrastruktursystemer
- Godtroende sikkerhedsforskning
Aardvark Security Agent
OpenAI udvider den private beta af Aardvark, sin sikkerhedsforskningsagent, som det første tilbud i sin suite af Codex Security-produkter og -værktøjer. De samarbejder også med open source-vedligeholdere for at give gratis kodebasescanning til bredt anvendte projekter som Next.js.
Hvordan OpenAI brugte Codex til at bygge Codex
Udviklingen af GPT-5.3-Codex giver et fascinerende casestudie i AI-accelereret forskning.
Researchteamets Use Cases
Researchteamet brugte tidlige versioner af GPT-5.3-Codex til at:
- Overvåge og fejlfinde træningskørslen for udgivelsen
- Spore mønstre i løbet af træningen
- Give dybdegående analyse af interaktionskvalitet
- Foreslå rettelser og bygge rige applikationer til menneskelige forskere
- Præcist forstå, hvordan modellens adfærd adskilte sig fra tidligere modeller
Engineeringteamets Use Cases
Engineeringteamet brugte Codex til at:
- Optimere og tilpasse harness til GPT-5.3-Codex
- Identificere kontekstgengivelsesfejl, der påvirker brugere
- Find årsagen til lave cache-hitrater
- Dynamisk skalere GPU-klynger for at tilpasse sig trafikstigninger
- Holde ventetiden stabil under lanceringen
Datavidenskabs Use Cases
Under alpha-test arbejdede en datavidenskabsmand med GPT-5.3-Codex for at:
- Bygge regex-klassificeringer for at estimere hyppigheden af afklaringer, brugerresponser og opgavefremskridt
- Køre disse klassificeringer skalerbart over alle sessionslogfiler
- Bygge nye datapipelines og visualisere resultater mere detaljeret end standard dashboarding-værktøjer
- Samarbejde om analyse af resultater, hvor Codex opsummerer vigtige indsigter over tusindvis af datapunkter på under tre minutter
Produktivitetsgevinster
Resultatet? Folk, der byggede med Codex, var gladere, da agenten:
- Bedre forstod deres hensigt
- Gjorde flere fremskridt pr. tur
- Stillede færre afklarende spørgsmål
Tilgængelighed og priser
Sådan får du adgang
GPT-5.3-Codex er tilgængelig med det samme for betalende ChatGPT-brugere på tværs af alle Codex-overflader:
- Desktop-app (macOS og Windows)
- Kommandolinjegrænseflade (CLI)
- IDE-udvidelser (VS Code, JetBrains osv.)
Abonnementsplaner
I en begrænset periode vil betalte planer modtage dobbelt så mange normale ratebegrænsninger.
API-priser
Ved lanceringen har OpenAI ikke frigivet officielle API-priser for GPT-5.3-Codex. API-adgang beskrives som "udrulles snart" og "kommer i de følgende uger."
Til reference er den aktuelle API-pris for den tidligere model (GPT-5.2-Codex):
Infrastruktur
GPT-5.3-Codex blev co-designet til, trænet med og betjent på NVIDIA GB200 NVL72-systemer – et bevis på det tætte samarbejde mellem OpenAI og NVIDIA om at flytte grænserne for AI-kapacitet.
Sammenligning med konkurrenter
Udgivelsen af GPT-5.3-Codex kom kun få minutter efter Anthropic's annoncering af Claude Opus 4.6, hvilket skabte en øjeblikkelig sammenligning mellem de to modeller.
GPT-5.3-Codex Styrker
- Terminal-Bench 2.0: 77,3 vs. Opus 4.6's 65,4 (+18,6 % fordel)
- 25 % hurtigere performance
- "Høj pålidelighed, lav varians" designfilosofi
- Selvbyggende egenskab (hjalp med at skabe sig selv)
- Første "Høj kapacitet" cybersikkerhedsklassificering
Claude Opus 4.6 Styrker
- 1 million token kontekstvindue (væsentligt større)
- Agent Teams kollaborativ funktionalitet
- Bredere alsidighed på tværs af videnarbejdsscenarier
- Højere kreativitetstemperatur (mere personlighed)
Designfilosofiforskelle
Det større billede
GPT-5.3-Codex repræsenterer mere end bare en inkrementel opgradering – det er et trin i retning af generelle agenter, der kan ræsonnere, bygge og udføre på tværs af hele spektret af teknisk arbejde i den virkelige verden.
Fra kodeagent til computeragent
OpenAI formulerer eksplicit denne udvikling: "Codex bevæger sig ud over at skrive kode til at bruge den som et værktøj til at betjene en computer og udføre arbejde fra ende til anden."
Dette er et dybtgående skift. Det, der startede som et fokus på at være "den bedste kodningsagent", er blevet grundlaget for en mere generel samarbejdspartner på computeren – hvilket udvider både hvem der kan bygge, og hvad der er muligt med AI.
Accelerering af AI-udvikling
Det faktum, at GPT-5.3-Codex hjalp med at bygge sig selv, er en forsmag på, hvad der kommer. Som OpenAI-forskere bemærker, "beskriver mange forskere og ingeniører hos OpenAI deres job i dag som fundamentalt anderledes end det var for blot to måneder siden."
Dette antyder, at vi går ind i en periode med accelererende afkast i AI-udvikling, hvor hver generation af modeller hjælper med at bygge den næste – hvilket potentielt komprimerer tidslinjer fra år til måneder.
Implikationer for udviklere
For softwareudviklere er implikationerne betydelige:
- Hurtigere udviklingscyklusser - AI håndterer mere af det rutinemæssige arbejde</a2>
- Abstraktion på højere niveau - Udviklere kan fokusere på arkitektur og design</a2>
- Interaktivt samarbejde - Mindre som at bruge et værktøj, mere som at arbejde sammen med en teamkammerat</a2>
- Nye egenskaber - Opgaver, der tidligere krævede specialiseret viden, er nu tilgængelige</a2>
Implikationer for virksomheder
For virksomheder repræsenterer GPT-5.3-Codex:
- Øget produktivitet - Mere arbejde bliver udført på kortere tid</a2>
- Lavere barrierer - Færre specialiserede færdigheder er nødvendige til visse opgaver</a2>
- Nye sikkerhedsovervejelser - "Høj kapacitet" cybersikkerhedsklassificering kræver omhyggelig styring</a2>
- Konkurrencefordel - Tidlig indførelse af kraftfuld agentbaseret AI</a2>
Konklusion
GPT-5.3-Codex er en milepæl inden for kunstig intelligens. Den kombinerer:
- State-of-the-art kodningsperformance
- Avancerede agentbaserede egenskaber
- Selvforbedring (den hjalp med at bygge sig selv)
Det faktum, at den var medvirkende til sin egen skabelse, tjener både som en teknisk præstation og en metafor for, hvor AI er på vej hen. Efterhånden som modeller bliver mere kapable, er de ikke kun værktøjer, vi bruger – de er ved at blive partnere i den kreative og udviklingsmæssige proces selv.
Den samtidige udgivelse med Claude Opus 4.6, kun få minutter fra hinanden, understreger intensiteten af konkurrencen i AI-rummet. Men vigtigere er det, at det signalerer, at vi er gået ind i en ny fase af AI-kapacitet – en fase, hvor agenter pålideligt kan håndtere komplekse, langsigtede opgaver på tværs af hele spektret af professionelt computerarbejde.
Som OpenAI udtrykker det: "Det, der startede som et fokus på at være den bedste kodningsagent, er blevet grundlaget for en mere generel samarbejdspartner på computeren."
Spørgsmålet er nu ikke kun, hvad disse modeller kan gøre – det er, hvad vi vil vælge at bygge med dem.
Kilder
Ansvarsfraskrivelse: Denne artikel er baseret på information tilgængelig pr. 6. februar 2026. Specifikationer, priser og tilgængelighed kan ændre sig. Se den officielle OpenAI-dokumentation for den mest aktuelle information.