Úvod
5. února 2026 společnost OpenAI oznámila GPT-5.3-Codex, svůj dosud nejpokročilejší agentní model pro kódování. Toto vydání představuje významný milník v umělé inteligenci – nejen pro své působivé technické schopnosti, ale také proto, že je to první model, který byl nápomocný při svém vlastním vytvoření.
GPT-5.3-Codex představuje zásadní posun od nástroje pro psaní kódu k interaktivnímu spolupracovníkovi s umělou inteligencí, který je schopen zvládnout dlouhodobou technickou práci v reálném světě v celém spektru profesionálních výpočetních úloh.
Čím se GPT-5.3-Codex liší?
Skutečný agentní model
Na rozdíl od tradičních asistentů kódování, kteří jednoduše generují úryvky kódu, je GPT-5.3-Codex navržen jako „agentní“ model. To znamená, že může:
- Udržovat kontext u dlouhodobých úloh, které trvají hodiny nebo dokonce dny
- Autonomně používat nástroje, včetně rozhraní příkazového řádku, souborových systémů a vývojových prostředí
- Adaptovat se a iterovat na základě zpětné vazby v reálném čase, aniž by ztratil přehled
- Zvládat komplexní vícestupňové pracovní postupy, které vyžadují výzkum, plánování a provedení
Sebezdokonalovací úspěch
Snad nejpozoruhodnějším aspektem GPT-5.3-Codex je, že tým Codexu používal rané verze modelu k:
- Ladění vlastního procesu učení
- Správě vlastního nasazení
- Diagnostice výsledků testů a hodnocení
- Optimalizaci infrastruktury pro finální verzi
Tento autoreferenční vývojový cyklus ukazuje, jak umělá inteligence začíná urychlovat své vlastní zlepšování – milník, který výzkumníci OpenAI popsali tak, že je „ohromilo, jak moc dokázal Codex urychlit svůj vlastní vývoj.“
Zlepšení výkonu
GPT-5.3-Codex je o 25 % rychlejší než jeho předchůdce (GPT-5.2-Codex), a to díky vylepšením v infrastruktuře a inferenčním stacku OpenAI. Toto zrychlení umožňuje responzivnější spolupráci v reálném čase a rychlejší iterační cykly.
Benchmark výkon: Data
GPT-5.3-Codex dosahuje špičkového výkonu v několika klíčových benchmarkech, které měří kódování, agentní schopnosti a používání počítače v reálném světě.
SWE-Bench Pro
SWE-Bench Pro je důkladné hodnocení softwarového inženýrství v reálném světě, které zahrnuje čtyři programovací jazyky (Python, JavaScript, TypeScript a Go). Na rozdíl od svého předchůdce (SWE-Bench Verified), který testoval pouze Python, je SWE-Bench Pro navržen tak, aby byl odolnější vůči kontaminaci a relevantnější pro průmysl.
Terminal-Bench 2.0
13,3% zlepšení na Terminal-Bench 2.0 je obzvláště významné. Tento benchmark měří dovednosti terminálu, které kódovací agent potřebuje – navigaci v souborových systémech, provádění příkazů a správu vývojových pracovních postupů. Zejména GPT-5.3-Codex toho dosahuje s menším počtem tokenů než jakýkoli předchozí model, což jej činí efektivnějším.
OSWorld-Verified
26,5% skok na OSWorld-Verified demonstruje dramaticky vylepšené schopnosti používání počítače. OSWorld je agentní benchmark používání počítače, kde agenti musí dokončit úkoly produktivity ve vizuálním desktopovém prostředí. Toto masivní zlepšení ukazuje, že GPT-5.3-Codex je mnohem lepší v navigaci v rozhraních reálného světa než předchozí modely.
Mimo kód: Agent pro všeobecné použití
Zatímco GPT-5.3-Codex vyniká v programování, jeho schopnosti sahají daleko za generování kódu. OpenAI jej staví do pozice agenta, který zvládne „téměř cokoli, co vývojáři a profesionálové mohou dělat na počítači.“
Podpora softwarového životního cyklu
Model je postaven tak, aby podporoval celý životní cyklus vývoje softwaru:
- Ladění - Identifikace a oprava chyb
- Nasazení - Správa verzí a infrastruktury
- Monitorování - Sledování výkonu a metrik
- Psaní PRD - Dokumenty s požadavky na produkt
- Úprava textu - Dokumentace a marketingový text
- Uživatelský výzkum - Analýza uživatelské zpětné vazby
- Testování - Psaní a spouštění testovacích sad
- Analýza metrik - Rozhodování na základě dat
Schopnosti znalostní práce
Na GDPval (hodnocení OpenAI z roku 2025, které měří výkon při úlohách znalostní práce napříč 44 profesemi) se GPT-5.3-Codex vyrovná výkonu GPT-5.2. To zahrnuje úkoly, jako jsou:
- Vytváření prezentací a slidů
- Správa a organizace dokumentů
Příklad webového vývoje
Pro demonstraci schopností modelu požádala OpenAI GPT-5.3-Codex, aby od základu vytvořil dvě kompletní hry:
- Závodní hra (verze 2 spouštěcí hry aplikace Codex)
Pouze s použitím dovednosti „vyvinout webovou hru“ a obecných následných výzev, jako je „oprav chybu“ nebo „vylepši hru“, GPT-5.3-Codex autonomně iteroval přes miliony tokenů a vytvořil vysoce funkční, vyladěné hry.
Lepší porozumění záměru
Ve srovnání s GPT-5.2-Codex nový model lépe rozumí záměru uživatele při vytváření webových stránek. Jednoduché nebo nedostatečně specifikované výzvy nyní standardně vedou k webům s:
- Rozumnými výchozími hodnotami
- Funkcemi připravenými pro produkci
Například, když byl požádán o vytvoření cenové vstupní stránky, GPT-5.3-Codex automaticky zobrazil roční plán jako zlevněnou měsíční cenu (čímž jasně ukázal slevu) a vytvořil automaticky přecházející kolotoč referencí se třemi různými citáty uživatelů – výsledkem byl kompletnější a vyladěnější design.
Interaktivní spolupráce
Jedním z nejvýznamnějších vylepšení uživatelského zážitku je možnost řídit model během jeho práce.
Interakce v reálném čase
Místo čekání na finální výstup mohou nyní uživatelé:
- Pokládat otázky během provádění
- Diskutovat o různých přístupech
- Směrovat ke konkrétním řešením
- Poskytovat zpětnou vazbu uprostřed úkolu
GPT-5.3-Codex hovoří o tom, co dělá, reaguje na zpětnou vazbu a udržuje uživatele v obraze od začátku do konce. To lze povolit v aplikaci Codex prostřednictvím Nastavení > Obecné > Chování při následných krocích.
Toto transformuje zážitek od zadávání příkazů stroji ke spolupráci se spoluhráčem – zásadní posun v tom, jak lidé interagují se systémy umělé inteligence.
Kyberbezpečnostní schopnosti a bezpečnost
GPT-5.3-Codex je první model, který OpenAI klasifikuje jako „Vysoce schopný“ pro úkoly související s kybernetickou bezpečností v rámci svého rámce připravenosti. Je to také první model přímo trénovaný na identifikaci softwarových zranitelností.
Dvojí povaha
Protože kybernetická bezpečnost je ze své podstaty dvojího užití (užitečná pro obranu i útok), OpenAI zaujímá preventivní přístup:
- Žádné definitivní důkazy, že dokáže automatizovat kybernetické útoky end-to-end
- Nasazení komplexního bezpečnostního balíčku kybernetické bezpečnosti
- Implementace bezpečnostního školení a automatizovaného monitoringu
- Vyžadování důvěryhodného přístupu pro pokročilé schopnosti
Důvěryhodný přístup pro kybernetickou bezpečnost
OpenAI spouští Důvěryhodný přístup pro kybernetickou bezpečnost, pilotní program pro:
- Urychlení výzkumu kybernetické obrany
- Poskytnutí nástrojů obráncům jako prvním
- Podporu odolnosti ekosystému
Závazek 10 milionů dolarů
Na základě programu Cybersecurity Grant Program z roku 2023 ve výši 1 milionu dolarů se OpenAI zavazuje 10 milionů dolarů v API kreditech k urychlení kybernetické obrany, zejména pro:
- Kritické infrastrukturní systémy
- Bezúhonný bezpečnostní výzkum
Bezpečnostní agent Aardvark
OpenAI rozšiřuje soukromou beta verzi Aardvark, svého agenta pro bezpečnostní výzkum, jako první nabídku ve své sadě produktů a nástrojů Codex Security. Spolupracují také s správci open-source na poskytování bezplatného skenování kódu pro široce používané projekty, jako je Next.js.
Jak OpenAI použila Codex k vytvoření Codexu
Vývoj GPT-5.3-Codex poskytuje fascinující případovou studii výzkumu urychleného umělou inteligencí.
Případy použití výzkumného týmu
Výzkumný tým používal rané verze GPT-5.3-Codex k:
- Monitorování a ladění tréninkového běhu pro vydání
- Sledování vzorců v průběhu tréninku
- Poskytování hloubkové analýzy kvality interakce
- Navrhování oprav a vytváření bohatých aplikací pro lidské výzkumníky
- Přesnému pochopení toho, jak se chování modelu lišilo od předchozích modelů
Případy použití inženýrského týmu
Inženýrský tým používal Codex k:
- Optimalizaci a úpravě postroje pro GPT-5.3-Codex
- Identifikaci chyb vykreslování kontextu ovlivňujících uživatele
- Odhalení příčin nízké míry zásahů do mezipaměti
- Dynamickému škálování clusterů GPU pro přizpůsobení se náhlým nárůstům provozu
- Udržení stabilní latence během spuštění
Případy použití datové vědy
Během alfa testování datový vědec pracoval s GPT-5.3-Codex na:
- Vytváření regex klasifikátorů pro odhad frekvence upřesnění, uživatelských odpovědí a postupu úkolu
- Spouštění těchto klasifikátorů škálovatelně přes všechny protokoly relací
- Vytváření nových datových kanálů a vizualizaci výsledků bohatším způsobem než standardní nástroje pro dashboard
- Společné analýze výsledků, přičemž Codex shrnuje klíčové poznatky z tisíců datových bodů za méně než tři minuty
Zvýšení produktivity
Výsledek? Lidé pracující s Codexem byli šťastnější, protože agent:
- Dělal větší pokrok na tah
- Kladl méně objasňujících otázek
Dostupnost a ceny
Jak získat přístup
GPT-5.3-Codex je k dispozici okamžitě pro platící uživatele ChatGPT ve všech rozhraních Codex:
- Desktopová aplikace (macOS a Windows)
- Rozhraní příkazového řádku (CLI)
- Rozšíření IDE (VS Code, JetBrains atd.)
Plány předplatného
Po omezenou dobu obdrží placené plány dvojnásobné normální limity rychlosti.
Ceny API
K datu spuštění OpenAI nezveřejnila oficiální ceny API pro GPT-5.3-Codex. Přístup k API je popsán jako „postupné zavádění brzy“ a „přichází v následujících týdnech.“
Pro srovnání, aktuální ceny API pro předchozí model (GPT-5.2-Codex) jsou:
Infrastruktura
GPT-5.3-Codex byl spolunavržen, trénován a obsluhován na systémech NVIDIA GB200 NVL72 – což svědčí o úzké spolupráci mezi OpenAI a NVIDIA při posouvání hranic schopností umělé inteligence.
Srovnání s konkurencí
Vydání GPT-5.3-Codex přišlo jen několik minut po oznámení Claude Opus 4.6 od společnosti Anthropic, což vedlo k okamžitému srovnání mezi oběma modely.
Silné stránky GPT-5.3-Codex
- Terminal-Bench 2.0: 77,3 vs. 65,4 Opus 4.6 (+18,6 % výhoda)
- Filozofie návrhu „vysoká spolehlivost, nízká variance“
- Schopnost sebezdokonalování (pomohl se vytvořit)
- První klasifikace „vysoká schopnost“ v kybernetické bezpečnosti
Silné stránky Claude Opus 4.6
- 1 milion tokenů kontextové okno (výrazně větší)
- Agent Teams funkce pro spolupráci
- Širší všestrannost napříč scénáři znalostní práce
- Vyšší teplota kreativity (více osobnosti)
Rozdíly ve filozofii návrhu
Širší pohled
GPT-5.3-Codex představuje více než jen přírůstkovou aktualizaci – je to krok vpřed směrem k agentům pro všeobecné použití, kteří dokážou uvažovat, vytvářet a provádět v celém spektru technické práce v reálném světě.
Od agenta pro kód k agentu pro počítač
OpenAI explicitně formuluje tento vývoj: „Codex se posouvá od psaní kódu k jeho používání jako nástroje pro ovládání počítače a dokončování práce end to end.“
To je zásadní posun. To, co začalo jako zaměření na to být „nejlepším agentem pro kódování“, se stalo základem pro obecnějšího spolupracovníka na počítači – rozšiřuje se jak okruh těch, kteří mohou vytvářet, tak i to, co je s umělou inteligencí možné.
Urychlení vývoje umělé inteligence
Skutečnost, že GPT-5.3-Codex pomohl vytvořit sám sebe, je náhledem toho, co přijde. Jak poznamenávají výzkumníci OpenAI, „mnoho výzkumníků a inženýrů v OpenAI popisuje svou práci dnes jako zásadně odlišnou od toho, čím byla ještě před dvěma měsíci.“
To naznačuje, že vstupujeme do období zrychlujících se výnosů ve vývoji umělé inteligence, kde každá generace modelů pomáhá vytvářet další – potenciálně zkracuje časové osy z let na měsíce.
Dopady pro vývojáře
Pro vývojáře softwaru jsou dopady významné:
- Rychlejší vývojové cykly - AI zvládá více rutinní práce
- Abstrakce na vyšší úrovni - Vývojáři se mohou soustředit na architekturu a design
- Interaktivní spolupráce - Méně jako používání nástroje, více jako práce se spoluhráčem
- Nové schopnosti - Úkoly, které dříve vyžadovaly specializované znalosti, jsou nyní dostupné
Dopady pro podniky
Pro podniky GPT-5.3-Codex představuje:
- Zvýšená produktivita - Více práce se udělá za kratší dobu
- Nižší bariéry - Pro určité úkoly je potřeba méně specializovaných dovedností
- Nové bezpečnostní aspekty - Klasifikace „vysoká schopnost“ v kybernetické bezpečnosti vyžaduje pečlivou správu
- Konkurenční výhoda - Včasné přijetí výkonné agentní umělé inteligence
Závěr
GPT-5.3-Codex je mezník v umělé inteligenci. Kombinuje:
- Špičkový výkon v kódování
- Pokročilé agentní schopnosti
- Sebezdokonalování (pomohl se vytvořit)
- Používání počítače v reálném světě
Skutečnost, že byl nápomocný při svém vlastním vytvoření, slouží jako technický úspěch i jako metafora toho, kam umělá inteligence směřuje. Jak se modely stávají schopnějšími, nejsou to jen nástroje, které používáme – stávají se partnery v samotném kreativním a vývojovém procesu.
Současné vydání s Claude Opus 4.6, jen několik minut po sobě, podtrhuje intenzitu konkurence v oblasti umělé inteligence. Ale co je důležitější, signalizuje, že jsme vstoupili do nové fáze schopností umělé inteligence – fáze, kdy agenti mohou spolehlivě zvládat komplexní, dlouhodobé úkoly v celém spektru profesionální práce s počítačem.
Jak to říká OpenAI: „To, co začalo jako zaměření na to, být nejlepším agentem pro kódování, se stalo základem pro obecnějšího spolupracovníka na počítači.“
Otázka nyní není jen to, co tyto modely dokážou – je to to, co se s nimi rozhodneme vytvořit.
Zdroje
Upozornění: Tento článek je založen na informacích dostupných k 6. únoru 2026. Specifikace, ceny a dostupnost se mohou změnit. Nejaktuálnější informace naleznete v oficiální dokumentaci OpenAI.