Introduktion

Den 5 februari 2026 tillkännagav OpenAI GPT-5.3-Codex, deras mest avancerade agentbaserade kodningsmodell hittills. Denna lansering markerar en betydande milstolpe inom artificiell intelligens – inte bara för dess imponerande tekniska förmågor utan också för att det är den första modellen som var avgörande för att skapa sig själv.

GPT-5.3-Codex representerar en fundamental förändring från ett kodskrivarverktyg till en interaktiv AI-medarbetare som kan hantera långsiktigt, verkligt tekniskt arbete över hela spektrumet av professionella databaserade uppgifter.

Vad gör GPT-5.3-Codex annorlunda?

En verkligt agentbaserad modell

Till skillnad från traditionella kodningsassistenter som helt enkelt genererar kodsnuttar är GPT-5.3-Codex utformad som en "agentbaserad" modell. Detta innebär att den kan:

Behålla kontext över långvariga uppgifter som sträcker sig över timmar eller till och med dagar

Använda verktyg autonomt, inklusive kommandoradsgränssnitt, filsystem och utvecklingsmiljöer

Anpassa och iterera baserat på feedback i realtid utan att tappa bort sig

Hantera komplexa arbetsflöden i flera steg som kräver research, planering och utförande

Självskapande prestation

Den kanske mest anmärkningsvärda aspekten av GPT-5.3-Codex är att Codex-teamet använde tidiga versioner av modellen för att:

Felsöka sin egen träningsprocess

Hantera sin egen driftsättning

Diagnostisera testresultat och utvärderingar

Optimera infrastrukturen för den slutliga versionen

Denna självrefererande utvecklingscykel visar hur AI börjar accelerera sin egen förbättring – en milstolpe som OpenAI:s forskare beskrev som att de blev "blown away by how much Codex was able to accelerate its own development."

Prestandaförbättringar

GPT-5.3-Codex är 25 % snabbare än sin föregångare (GPT-5.2-Codex), tack vare förbättringar i OpenAI:s infrastruktur och inferensstack. Denna hastighetsförbättring möjliggör mer responsivt samarbete i realtid och snabbare iterationscykler.

Benchmark-prestanda: Datan

GPT-5.3-Codex uppnår toppmodern prestanda över flera viktiga benchmarks som mäter kodning, agentbaserade förmågor och verklig datoranvändning.

SWE-Bench Pro

SWE-Bench Pro är en rigorös utvärdering av verklig programvaruteknik som spänner över fyra programmeringsspråk (Python, JavaScript, TypeScript och Go). Till skillnad från sin föregångare (SWE-Bench Verified) som endast testade Python, är SWE-Bench Pro utformad för att vara mer kontamineringsresistent och branschrelevant.

Terminal-Bench 2.0

Den 13,3-procentiga förbättringen på Terminal-Bench 2.0 är särskilt betydande. Detta benchmark mäter de terminalfärdigheter som en kodningsagent behöver – navigera i filsystem, utföra kommandon och hantera utvecklingsarbetsflöden. Noterbart är att GPT-5.3-Codex uppnår detta med färre tokens än någon tidigare modell, vilket gör den mer effektiv.

OSWorld-Verified

Den 26,5-procentiga ökningen på OSWorld-Verified visar dramatiskt förbättrade datoranvändningsförmågor. OSWorld är ett agentbaserat datoranvändningsbenchmark där agenter måste utföra produktivitetsuppgifter i en visuell skrivbordsmiljö. Denna massiva förbättring visar att GPT-5.3-Codex är mycket bättre på att navigera i verkliga gränssnitt än tidigare modeller.

Bortom kod: En agent för allmänna ändamål

Medan GPT-5.3-Codex utmärker sig inom programmering sträcker sig dess kapacitet långt bortom kodgenerering. OpenAI positionerar den som en agent som kan hantera "nästan allt utvecklare och professionella kan göra på en dator".

Stöd för programvarans livscykel

Modellen är byggd för att stödja hela programvaruutvecklingslivscykeln:

Felsökning - Identifiera och fixa buggar

Driftsättning - Hantera releaser och infrastruktur

Övervakning - Spåra prestanda och mätvärden

Skriva PRD:er - Produktspecifikationsdokument

Redigera text - Dokumentation och marknadsföringstext

Användarundersökning - Analysera användarfeedback

Testning - Skriva och köra testsviter

Mätvärdesanalys - Datadriven beslutsfattande

Kunskapsarbetsförmågor

På GDPval (OpenAI:s utvärdering från 2025 som mäter prestanda på kunskapsarbetsuppgifter inom 44 yrken) matchar GPT-5.3-Codex GPT-5.2:s prestanda. Detta inkluderar uppgifter som:

Skapa presentationsmaterial och presentationer

Analysera data i kalkylblad

Dokumenthantering och organisering

Research och syntes

Exempel på webbutveckling

För att demonstrera modellens kapacitet bad OpenAI GPT-5.3-Codex att bygga två kompletta spel från grunden:

Ett racingspel (version 2 av Codex app launch game)

Ett dykningsspel

Genom att endast använda en "develop web game"-färdighet och generiska uppföljningsprompter som "fix the bug" eller "improve the game" itererade GPT-5.3-Codex autonomt över miljontals tokens och byggde mycket funktionella, polerade spel.

Bättre förståelse för avsikt

Jämfört med GPT-5.2-Codex förstår den nya modellen användarens avsikt bättre när man bygger webbplatser. Enkla eller underspecificerade prompter leder nu som standard till webbplatser med:

Mer funktionalitet

Förnuftiga standardvärden

Produktionsklara funktioner

Till exempel, när den ombads att bygga en prissättningslandningssida, visade GPT-5.3-Codex automatiskt årsplanen som ett rabatterat månadspris (vilket gjorde rabatten tydlig) och skapade en automatiskt övergående testimonials-karusell med tre distinkta användarcitat – vilket resulterade i en mer komplett och polerad design.

Interaktivt samarbete

En av de viktigaste förbättringarna av användarupplevelsen är möjligheten att styra modellen medan den arbetar.

Interaktion i realtid

Istället för att vänta på ett slutligt resultat kan användare nu:

Ställa frågor under körning

Diskutera olika tillvägagångssätt

Styra mot specifika lösningar

Ge feedback mitt i uppgiften

GPT-5.3-Codex pratar igenom vad den gör, svarar på feedback och håller användarna informerade från början till slut. Detta kan aktiveras i Codex-appen via Settings > General > Follow-up behavior.

Detta förvandlar upplevelsen från att ge kommandon till en maskin till att samarbeta med en teammedlem – en fundamental förändring i hur människor interagerar med AI-system.

Cybersäkerhetsförmågor och säkerhet

GPT-5.3-Codex är den första modellen OpenAI klassificerar som "High capability" för cybersäkerhetsrelaterade uppgifter enligt deras Preparedness Framework. Det är också den första modellen som är direkt tränad för att identifiera sårbarheter i programvara.

Dubbelnatur

Eftersom cybersäkerhet till sin natur är dubbelnatur (användbar för både försvar och anfall) tar OpenAI ett försiktighetsgrepp:

Inget definitivt bevis att den kan automatisera cyberattacker från början till slut

Implementera en omfattande cybersäkerhetsstack

Implementera säkerhetsträning och automatisk övervakning

Kräva betrodd åtkomst för avancerade funktioner

Betrodd åtkomst för cyber

OpenAI lanserar Trusted Access for Cyber, ett pilotprogram för att:

Accelerera forskning inom cyberförsvar

Ge verktyg till försvarare först

Stödja ekosystemets resiliens

$10 miljoner åtagande

Med utgångspunkt i ett Cybersecurity Grant Program på 1 miljon dollar från 2023 åtar sig OpenAI 10 miljoner dollar i API-krediter för att accelerera cyberförsvar, särskilt för:

Programvara med öppen källkod

Kritiska infrastruktursystem

Säkerhetsforskning i god tro

Aardvark Security Agent

OpenAI utökar den privata betan av Aardvark, sin säkerhetsforskningsagent, som det första erbjudandet i sin svit av Codex Security-produkter och verktyg. De samarbetar också med underhållare av öppen källkod för att tillhandahålla gratis kodbas-skanning för allmänt använda projekt som Next.js.

Hur OpenAI använde Codex för att bygga Codex

Utvecklingen av GPT-5.3-Codex ger en fascinerande fallstudie i AI-accelererad forskning.

Användningsfall för forskarteamet

Forskningsteamet använde tidiga versioner av GPT-5.3-Codex för att:

Övervaka och felsöka träningskörningen för releasen

Spåra mönster under hela träningsförloppet

Tillhandahålla djupgående analys av interaktionskvaliteten

Föreslå korrigeringar och bygga omfattande applikationer för mänskliga forskare

Exakt förstå hur modellens beteende skiljde sig från tidigare modeller

Användningsfall för ingenjörsteamet

Ingenjörsteamet använde Codex för att:

Optimera och anpassa selen för GPT-5.3-Codex

Identifiera buggar vid rendering av kontext som påverkar användarna

Orsaka låga cacheträffar

Dynamiskt skala GPU-kluster för att anpassa sig till trafikökningar

Hålla latensen stabil under lanseringen

Användningsfall för datavetenskap

Under alfatestningen arbetade en datavetare med GPT-5.3-Codex för att:

Bygga regex-klassificerare för att uppskatta frekvensen av förtydliganden, användarsvar och uppgiftsframsteg

Köra dessa klassificerare skalbart över alla sessionsloggar

Bygga nya datapipelines och visualisera resultat mer omfattande än standardinstrumentpaneler

Samanalysera resultat, där Codex sammanfattar viktiga insikter över tusentals datapunkter på under tre minuter

Produktivitetsvinster

Resultatet? Personer som bygger med Codex var lyckligare eftersom agenten:

Bättre förstod deras avsikt

Gjorde fler framsteg per tur

Ställde färre förtydligande frågor

Tillgänglighet och prissättning

Hur man får tillgång

GPT-5.3-Codex är omedelbart tillgänglig för betalande ChatGPT-användare på alla Codex-ytor:

Skrivbordsapp (macOS och Windows)

Kommandoradsgränssnitt (CLI)

IDE-tillägg (VS Code, JetBrains, etc.)

Webbgränssnitt

Abonnemangsplaner

Under en begränsad tid kommer betalande planer att få dubbla de normala hastighetsbegränsningarna.

API-prissättning

Från och med lanseringen har OpenAI inte släppt någon officiell API-prissättning för GPT-5.3-Codex. API-åtkomst beskrivs som "rolling out soon" och "coming in the following weeks".

Som referens är den nuvarande API-prissättningen för den tidigare modellen (GPT-5.2-Codex):

Infrastruktur

GPT-5.3-Codex samutvecklades för, tränades med och levereras på NVIDIA GB200 NVL72-system – ett bevis på det nära samarbetet mellan OpenAI och NVIDIA för att flytta fram gränserna för AI-kapacitet.

Jämförelse med konkurrenter

Lanseringen av GPT-5.3-Codex kom bara några minuter efter Anthropic:s tillkännagivande av Claude Opus 4.6, vilket skapade en omedelbar jämförelse mellan de två modellerna.

GPT-5.3-Codex styrkor

Terminal-Bench 2.0: 77,3 jämfört med Opus 4.6:s 65,4 (+18,6 % fördel)

25 % snabbare prestanda

Designfilosofi med "hög tillförlitlighet, låg varians"

Självskapande förmåga (hjälpte till att skapa sig själv)

Första "High capability" cybersäkerhetsklassificeringen

Claude Opus 4.6 styrkor

Kontextfönster på 1 miljon tokens (väsentligt större)

Agent Teams samarbetsfunktionalitet

Bredare mångsidighet över scenarier för kunskapsarbete

Högre kreativitetstemperatur (mer personlighet)

Skillnader i designfilosofi

Den större bilden

GPT-5.3-Codex representerar mer än bara en stegvis uppgradering – det är ett stort steg mot agenter för allmänna ändamål som kan resonera, bygga och utföra över hela spektrumet av verkligt tekniskt arbete.

Från kodagent till datoragent

OpenAI ramar uttryckligen in denna utveckling: "Codex is moving beyond writing code to using it as a tool to operate a computer and complete work end to end."

Detta är en djupgående förändring. Det som började som ett fokus på att vara "den bästa kodagenten" har blivit grunden för en mer generell medarbetare på datorn – vilket utökar både vem som kan bygga och vad som är möjligt med AI.

Accelerera AI-utvecklingen

Det faktum att GPT-5.3-Codex hjälpte till att bygga sig själv är en förhandsvisning av vad som komma skall. Som OpenAI:s forskare noterar, "many researchers and engineers at OpenAI describe their job today as being fundamentally different from what it was just two months ago."

Detta antyder att vi går in i en period av accelererande avkastning inom AI-utveckling, där varje generation av modeller hjälper till att bygga nästa – vilket potentiellt komprimerar tidslinjerna från år till månader.

Implikationer för utvecklare

För programvaruutvecklare är implikationerna betydande:

Snabbare utvecklingscykler – AI hanterar mer av det rutinmässiga arbetet

Abstraktion på högre nivå – Utvecklare kan fokusera på arkitektur och design

Interaktivt samarbete – Mindre som att använda ett verktyg, mer som att arbeta med en teammedlem

Nya möjligheter – Uppgifter som tidigare krävde specialkunskaper är nu tillgängliga

Implikationer för företag

För företag representerar GPT-5.3-Codex:

Ökad produktivitet – Mer arbete blir gjort på kortare tid

Lägre hinder – Färre specialkunskaper behövs för vissa uppgifter

Nya säkerhetsöverväganden – Cybersäkerhetsklassificering med "hög kapacitet" kräver noggrann styrning

Konkurrensfördel – Tidig användning av kraftfull agentbaserad AI

Slutsats

GPT-5.3-Codex är en milstolpe inom artificiell intelligens. Den kombinerar:

Toppmodern kodningsprestanda

Avancerade agentbaserade förmågor

Interaktivt samarbete

Självförbättring (den hjälpte till att bygga sig själv)

Verklig datoranvändning

Det faktum att den var avgörande i sin egen skapelse fungerar både som en teknisk prestation och en metafor för vart AI är på väg. När modeller blir mer kapabla är de inte bara verktyg vi använder – de blir partners i den kreativa och utvecklingsprocessen själv.

Den samtidiga lanseringen med Claude Opus 4.6, bara några minuter isär, understryker intensiteten i konkurrensen inom AI-området. Men ännu viktigare signalerar det att vi har gått in i en ny fas av AI-kapacitet – en där agenter på ett tillförlitligt sätt kan hantera komplexa, långsiktiga uppgifter över hela spektrumet av professionellt datorarbete.

Som OpenAI uttrycker det: "What started as a focus on being the best coding agent has become the foundation for a more general collaborator on the computer."

Frågan är nu inte bara vad dessa modeller kan göra – det är vad vi kommer att välja att bygga med dem.

Källor

Introducing GPT-5.3-Codex - OpenAI Official Announcement

GPT-5.3-Codex System Card - OpenAI

GPT 5.3 Codex pricing, benchmarks, and features explained - eesel AI

OpenAI: New coding model GPT-5.3-Codex helped build itself - Mashable

With GPT-5.3-Codex, OpenAI pitches Codex for more than just writing code - Ars Technica

OpenAI launches new agentic coding model only minutes after Anthropic drops its own - TechCrunch

Opus 4.6 vs CODEX 5.3, first real comparison - Reddit

GPT 5.3 Codex vs. Opus 4.6: The Great Convergence - Every

OpenAI Platform Pricing

Codex Pricing

SWE-Bench Official Leaderboard

Disclaimer: Den här artikeln är baserad på information som är tillgänglig per den 6 februari 2026. Specifikationer, priser och tillgänglighet kan ändras. Se den officiella OpenAI-dokumentationen för den mest aktuella informationen.

GPT-5.3-Codex: OpenAI:s mest kapabla agentbaserade kodningsmodell