Introduktion

Den 5. februar 2026 annoncerede OpenAI GPT-5.3-Codex, deres mest avancerede agentbaserede kodningsmodel til dato. Denne udgivelse markerer en betydelig milepæl i kunstig intelligens – ikke kun for dens imponerende tekniske egenskaber, men også fordi det er den første model, der var medvirkende til at skabe sig selv.

GPT-5.3-Codex repræsenterer et fundamentalt skift fra et kode-skrivningsværktøj til en interaktiv AI-samarbejdspartner, der er i stand til at håndtere langsigtede, virkelige tekniske opgaver på tværs af hele spektret af professionelle computeropgaver.

Hvad gør GPT-5.3-Codex anderledes?

En ægte agentbaseret model

I modsætning til traditionelle kodeassistenter, der blot genererer kodestykker, er GPT-5.3-Codex designet som en "agentbaseret" model. Det betyder, at den kan:

Beholde kontekst over langvarige opgaver, der strækker sig over timer eller endda dage

Bruge værktøjer autonomt, herunder kommandolinjegrænseflader, filsystemer og udviklingsmiljøer

Tilpasse og iterere baseret på feedback i realtid uden at miste overblikket

Håndtere komplekse, flertrins workflows, der kræver research, planlægning og udførelse

Selvskabende præstation

Det måske mest bemærkelsesværdige aspekt ved GPT-5.3-Codex er, at Codex-teamet brugte tidlige versioner af modellen til at:

Fejlfinde sin egen træningsproces

Administrere sin egen implementering

Diagnosticere testresultater og evalueringer

Optimere infrastrukturen til den endelige udgivelse

Denne selvhenvisende udviklingscyklus demonstrerer, hvordan AI er begyndt at accelerere sin egen forbedring – en milepæl, som OpenAI-forskere beskrev som at have efterladt dem "overvældede over, hvor meget Codex var i stand til at fremskynde sin egen udvikling."

Performanceforbedringer

GPT-5.3-Codex er 25 % hurtigere end sin forgænger (GPT-5.2-Codex) takket være forbedringer i OpenAIs infrastruktur og inferensstack. Denne hastighedsforbedring muliggør mere responsivt samarbejde i realtid og hurtigere iterationscyklusser.

Benchmark-performance: Dataene

GPT-5.3-Codex opnår state-of-the-art performance på tværs af flere centrale benchmarks, der måler kodning, agentbaserede egenskaber og reel computerbrug.

SWE-Bench Pro

SWE-Bench Pro er en streng evaluering af reel softwareudvikling, der spænder over fire programmeringssprog (Python, JavaScript, TypeScript og Go). I modsætning til sin forgænger (SWE-Bench Verified), som kun testede Python, er SWE-Bench Pro designet til at være mere resistent over for kontaminering og mere industrirelevant.

Terminal-Bench 2.0

Den 13,3 % forbedring på Terminal-Bench 2.0 er særligt signifikant. Denne benchmark måler de terminalfærdigheder, som en kodningsagent har brug for – navigering i filsystemer, udførelse af kommandoer og administration af udviklingsworkflows. Især opnår GPT-5.3-Codex dette med færre tokens end nogen tidligere model, hvilket gør den mere effektiv.

OSWorld-Verified

Det 26,5 % spring på OSWorld-Verified demonstrerer dramatisk forbedrede computerbrugsegenskaber. OSWorld er en agentbaseret computerbrugsbenchmark, hvor agenter skal udføre produktivitetsopgaver i et visuelt skrivebordsmiljø. Denne massive forbedring viser, at GPT-5.3-Codex er langt bedre til at navigere i virkelige grænseflader end tidligere modeller.

Ud over kode: En generel agent

Mens GPT-5.3-Codex udmærker sig inden for programmering, strækker dens egenskaber sig langt ud over kodegenerering. OpenAI positionerer den som en agent, der kan håndtere "næsten alt, hvad udviklere og fagfolk kan gøre på en computer."

Support til softwarelivscyklus

Modellen er bygget til at understøtte hele softwareudviklingslivscyklussen:

Fejlfinding - Identificering og rettelse af fejl

Implementering - Administration af udgivelser og infrastruktur

Overvågning - Sporing af performance og metrics

Skrivning af PRD'er - Produktspecifikationsdokumenter

Redigering af tekst - Dokumentation og marketingtekst

Brugerundersøgelse - Analyse af brugerfeedback

Test - Skrivning og kørsel af testsuiter

Metrics-analyse - Datadrevet beslutningstagning

Videnarbejdsegenskaber

På GDPval (OpenAIs evaluering fra 2025, der måler performance på videnarbejdsopgaver på tværs af 44 erhverv) matcher GPT-5.3-Codex GPT-5.2's performance. Dette inkluderer opgaver som:

Oprettelse af slidedæk og præsentationer

Analyse af data i regneark

Dokumentstyring og -organisation

Research og syntese

Eksempel på webudvikling

For at demonstrere modellens egenskaber bad OpenAI GPT-5.3-Codex om at bygge to komplette spil fra bunden:

Et racerspil (version 2 af Codex-appens lanceringsspil)

Et dykkerspil

Ved kun at bruge en "udvikl webspil"-færdighed og generiske opfølgningsprompter som "ret fejlen" eller "forbedre spillet" itererede GPT-5.3-Codex autonomt over millioner af tokens og byggede meget funktionelle, polerede spil.

Bedre forståelse af hensigt

Sammenlignet med GPT-5.2-Codex forstår den nye model bedre brugerens hensigt, når der bygges websteder. Simple eller under specificerede prompter fører nu som standard til websteder med:

Mere funktionalitet

Fornuftige standardindstillinger

Produktionsklare funktioner

For eksempel, da GPT-5.3-Codex blev bedt om at bygge en landingsside med priser, viste den automatisk årsabonnementet som en månedlig pris med rabat (hvilket gjorde rabatten tydelig) og oprettede en automatisk skiftende testimonial-karrusel med tre forskellige brugercitater – hvilket resulterede i et mere komplet og poleret design.

Interaktivt samarbejde

En af de mest markante forbedringer af brugeroplevelsen er muligheden for at styre modellen, mens den arbejder.

Interaktion i realtid

I stedet for at vente på et endeligt output kan brugerne nu:

Stille spørgsmål under udførelsen

Diskutere forskellige tilgange

Styre mod specifikke løsninger

Give feedback midt i opgaven

GPT-5.3-Codex forklarer, hvad den laver, reagerer på feedback og holder brugerne orienteret fra start til slut. Dette kan aktiveres i Codex-appen via Indstillinger > Generelt > Opfølgningsadfærd.

Dette transformerer oplevelsen fra at give kommandoer til en maskine til at samarbejde med en teamkammerat – et fundamentalt skift i, hvordan mennesker interagerer med AI-systemer.

Cybersecurity-egenskaber og -sikkerhed

GPT-5.3-Codex er den første model, OpenAI klassificerer som "Høj kapacitet" til cybersikkerhedsrelaterede opgaver under sit Preparedness Framework. Det er også den første model, der er direkte trænet til at identificere software-sårbarheder.

Dobbeltanvendelig natur

Fordi cybersikkerhed i sagens natur er dobbeltanvendelig (nyttig til både forsvar og angreb), tager OpenAI en forsigtig tilgang:

Intet entydigt bevis for, at den kan automatisere cyberangreb fra ende til anden

Implementering af omfattende cybersikkerhedssikkerhedsstak

Implementering af sikkerhedstræning og automatiseret overvågning

Kræver pålidelig adgang for avancerede egenskaber

Pålidelig adgang til Cyber

OpenAI lancerer Trusted Access for Cyber, et pilotprogram for at:

Fremskynde cyberforskningsforskning

Give forsvarere værktøjer først

Støtte økosystemets robusthed

$10 mio. forpligtelse

På baggrund af et $1 mio. Cybersecurity Grant Program fra 2023 forpligter OpenAI sig til $10 millioner i API-kreditter for at fremskynde cyberforsvar, især for:

Open source-software

Kritiske infrastruktursystemer

Godtroende sikkerhedsforskning

Aardvark Security Agent

OpenAI udvider den private beta af Aardvark, sin sikkerhedsforskningsagent, som det første tilbud i sin suite af Codex Security-produkter og -værktøjer. De samarbejder også med open source-vedligeholdere for at give gratis kodebasescanning til bredt anvendte projekter som Next.js.

Hvordan OpenAI brugte Codex til at bygge Codex

Udviklingen af GPT-5.3-Codex giver et fascinerende casestudie i AI-accelereret forskning.

Researchteamets Use Cases

Researchteamet brugte tidlige versioner af GPT-5.3-Codex til at:

Overvåge og fejlfinde træningskørslen for udgivelsen

Spore mønstre i løbet af træningen

Give dybdegående analyse af interaktionskvalitet

Foreslå rettelser og bygge rige applikationer til menneskelige forskere

Præcist forstå, hvordan modellens adfærd adskilte sig fra tidligere modeller

Engineeringteamets Use Cases

Engineeringteamet brugte Codex til at:

Optimere og tilpasse harness til GPT-5.3-Codex

Identificere kontekstgengivelsesfejl, der påvirker brugere

Find årsagen til lave cache-hitrater

Dynamisk skalere GPU-klynger for at tilpasse sig trafikstigninger

Holde ventetiden stabil under lanceringen

Datavidenskabs Use Cases

Under alpha-test arbejdede en datavidenskabsmand med GPT-5.3-Codex for at:

Bygge regex-klassificeringer for at estimere hyppigheden af afklaringer, brugerresponser og opgavefremskridt

Køre disse klassificeringer skalerbart over alle sessionslogfiler

Bygge nye datapipelines og visualisere resultater mere detaljeret end standard dashboarding-værktøjer

Samarbejde om analyse af resultater, hvor Codex opsummerer vigtige indsigter over tusindvis af datapunkter på under tre minutter

Produktivitetsgevinster

Resultatet? Folk, der byggede med Codex, var gladere, da agenten:

Bedre forstod deres hensigt

Gjorde flere fremskridt pr. tur

Stillede færre afklarende spørgsmål

Tilgængelighed og priser

Sådan får du adgang

GPT-5.3-Codex er tilgængelig med det samme for betalende ChatGPT-brugere på tværs af alle Codex-overflader:

Desktop-app (macOS og Windows)

Kommandolinjegrænseflade (CLI)

IDE-udvidelser (VS Code, JetBrains osv.)

Webgrænseflade

Abonnementsplaner

I en begrænset periode vil betalte planer modtage dobbelt så mange normale ratebegrænsninger.

API-priser

Ved lanceringen har OpenAI ikke frigivet officielle API-priser for GPT-5.3-Codex. API-adgang beskrives som "udrulles snart" og "kommer i de følgende uger."

Til reference er den aktuelle API-pris for den tidligere model (GPT-5.2-Codex):

Infrastruktur

GPT-5.3-Codex blev co-designet til, trænet med og betjent på NVIDIA GB200 NVL72-systemer – et bevis på det tætte samarbejde mellem OpenAI og NVIDIA om at flytte grænserne for AI-kapacitet.

Sammenligning med konkurrenter

Udgivelsen af GPT-5.3-Codex kom kun få minutter efter Anthropic's annoncering af Claude Opus 4.6, hvilket skabte en øjeblikkelig sammenligning mellem de to modeller.

GPT-5.3-Codex Styrker

Terminal-Bench 2.0: 77,3 vs. Opus 4.6's 65,4 (+18,6 % fordel)

25 % hurtigere performance

"Høj pålidelighed, lav varians" designfilosofi

Selvbyggende egenskab (hjalp med at skabe sig selv)

Første "Høj kapacitet" cybersikkerhedsklassificering

Claude Opus 4.6 Styrker

1 million token kontekstvindue (væsentligt større)

Agent Teams kollaborativ funktionalitet

Bredere alsidighed på tværs af videnarbejdsscenarier

Højere kreativitetstemperatur (mere personlighed)

Designfilosofiforskelle

Det større billede

GPT-5.3-Codex repræsenterer mere end bare en inkrementel opgradering – det er et trin i retning af generelle agenter, der kan ræsonnere, bygge og udføre på tværs af hele spektret af teknisk arbejde i den virkelige verden.

Fra kodeagent til computeragent

OpenAI formulerer eksplicit denne udvikling: "Codex bevæger sig ud over at skrive kode til at bruge den som et værktøj til at betjene en computer og udføre arbejde fra ende til anden."

Dette er et dybtgående skift. Det, der startede som et fokus på at være "den bedste kodningsagent", er blevet grundlaget for en mere generel samarbejdspartner på computeren – hvilket udvider både hvem der kan bygge, og hvad der er muligt med AI.

Accelerering af AI-udvikling

Det faktum, at GPT-5.3-Codex hjalp med at bygge sig selv, er en forsmag på, hvad der kommer. Som OpenAI-forskere bemærker, "beskriver mange forskere og ingeniører hos OpenAI deres job i dag som fundamentalt anderledes end det var for blot to måneder siden."

Dette antyder, at vi går ind i en periode med accelererende afkast i AI-udvikling, hvor hver generation af modeller hjælper med at bygge den næste – hvilket potentielt komprimerer tidslinjer fra år til måneder.

Implikationer for udviklere

For softwareudviklere er implikationerne betydelige:

Hurtigere udviklingscyklusser - AI håndterer mere af det rutinemæssige arbejde</a2>

Abstraktion på højere niveau - Udviklere kan fokusere på arkitektur og design</a2>

Interaktivt samarbejde - Mindre som at bruge et værktøj, mere som at arbejde sammen med en teamkammerat</a2>

Nye egenskaber - Opgaver, der tidligere krævede specialiseret viden, er nu tilgængelige</a2>

Implikationer for virksomheder

For virksomheder repræsenterer GPT-5.3-Codex:

Øget produktivitet - Mere arbejde bliver udført på kortere tid</a2>

Lavere barrierer - Færre specialiserede færdigheder er nødvendige til visse opgaver</a2>

Nye sikkerhedsovervejelser - "Høj kapacitet" cybersikkerhedsklassificering kræver omhyggelig styring</a2>

Konkurrencefordel - Tidlig indførelse af kraftfuld agentbaseret AI</a2>

Konklusion

GPT-5.3-Codex er en milepæl inden for kunstig intelligens. Den kombinerer:

State-of-the-art kodningsperformance

Avancerede agentbaserede egenskaber

Interaktivt samarbejde

Selvforbedring (den hjalp med at bygge sig selv)

Reel computerbrug

Det faktum, at den var medvirkende til sin egen skabelse, tjener både som en teknisk præstation og en metafor for, hvor AI er på vej hen. Efterhånden som modeller bliver mere kapable, er de ikke kun værktøjer, vi bruger – de er ved at blive partnere i den kreative og udviklingsmæssige proces selv.

Den samtidige udgivelse med Claude Opus 4.6, kun få minutter fra hinanden, understreger intensiteten af konkurrencen i AI-rummet. Men vigtigere er det, at det signalerer, at vi er gået ind i en ny fase af AI-kapacitet – en fase, hvor agenter pålideligt kan håndtere komplekse, langsigtede opgaver på tværs af hele spektret af professionelt computerarbejde.

Som OpenAI udtrykker det: "Det, der startede som et fokus på at være den bedste kodningsagent, er blevet grundlaget for en mere generel samarbejdspartner på computeren."

Spørgsmålet er nu ikke kun, hvad disse modeller kan gøre – det er, hvad vi vil vælge at bygge med dem.

Kilder

Introduktion til GPT-5.3-Codex - OpenAI Officiel Annoncering

GPT-5.3-Codex System Card - OpenAI

GPT 5.3 Codex priser, benchmarks og funktioner forklaret - eesel AI

OpenAI: Ny kodningsmodel GPT-5.3-Codex hjalp med at bygge sig selv - Mashable

Med GPT-5.3-Codex pitcher OpenAI Codex til mere end bare at skrive kode - Ars Technica

OpenAI lancerer ny agentisk kodningsmodel kun få minutter efter at Anthropic dropper sin egen - TechCrunch

Opus 4.6 vs CODEX 5.3, første rigtige sammenligning - Reddit

GPT 5.3 Codex vs. Opus 4.6: Den store konvergens - Every

OpenAI Platform Priser

Codex Priser

SWE-Bench Officiel Leaderboard

Ansvarsfraskrivelse: Denne artikel er baseret på information tilgængelig pr. 6. februar 2026. Specifikationer, priser og tilgængelighed kan ændre sig. Se den officielle OpenAI-dokumentation for den mest aktuelle information.

GPT-5.3-Codex: OpenAI's mest kapable agentbaserede kodningsmodel