Въведение

На 5 февруари 2026 г. OpenAI обяви GPT-5.3-Codex, най-модерният си агентичен модел за кодиране до момента. Това издание бележи значителен етап в развитието на изкуствения интелект – не само заради впечатляващите му технически възможности, но и защото е първият модел, който изигра важна роля в създаването на самия себе си.

представлява фундаментална промяна от инструмент за писане на код към интерактивен AI сътрудник, способен да се справя с дългосрочна, реална техническа работа в целия спектър от професионални компютърни задачи.

Какво прави различен?

Истински агентичен модел

За разлика от традиционните асистенти за кодиране, които просто генерират фрагменти от код, е проектиран като "агентичен" модел. Това означава, че той може:

Да поддържа контекст при дългосрочни задачи, които продължават часове или дори дни

Да използва инструменти автономно, включително интерфейси на командния ред, файлови системи и среди за разработка

Да се адаптира и повтаря въз основа на обратна връзка в реално време, без да губи позицията си

Да обработва сложни многоетапни работни процеси, които изискват проучване, планиране и изпълнение

Самоизграждащо се постижение

Може би най-забележителният аспект на е, че екипът на Codex е използвал ранни версии на модела, за да:

Отстранява грешки в собствения си процес на обучение

Управлява собственото си внедряване

Диагностицира резултатите от тестовете и оценките

Оптимизира инфраструктурата за окончателното издание

Този самореферентен цикъл на разработка демонстрира как AI започва да ускорява собственото си подобрение - етап, който изследователите на OpenAI описват като "поразени от това колко много Codex успя да ускори собственото си развитие."

Подобрения в производителността

25% по-бърз е 25% по-бърз от своя предшественик (GPT-5.2-Codex), благодарение на подобренията в инфраструктурата и стека за заключение на OpenAI. Това подобрение на скоростта позволява по-отзивчиво сътрудничество в реално време и по-бързи цикли на итерация.

Резултати от тестовете: Данните

постига най-добри резултати в няколко ключови теста, които измерват кодирането, агентичните възможности и използването на компютър в реалния свят.

SWE-Bench Pro

SWE-Bench Pro е строга оценка на софтуерното инженерство в реалния свят, която обхваща четири езика за програмиране (Python, JavaScript, TypeScript и Go). За разлика от своя предшественик (SWE-Bench Verified), който тестваше само Python, SWE-Bench Pro е проектиран да бъде по-устойчив на замърсяване и по-подходящ за индустрията.

Terminal-Bench 2.0

GPT-5.3-Codex в Terminal-Bench 2.0 е особено значително. Този тест измерва терминалните умения, от които се нуждае един кодиращ агент - навигиране във файлови системи, изпълнение на команди и управление на работни процеси за разработка. Забележително е, че GPT-5.3-Codex постига това с по-малко токени от всеки предишен модел, което го прави по-ефективен.

OSWorld-Verified

GPT-5.3-Codex в OSWorld-Verified демонстрира драстично подобрени възможности за използване на компютър. OSWorld е агентичен тест за използване на компютър, където агентите трябва да изпълняват задачи за продуктивност във визуална настолна среда. Това масивно подобрение показва, че GPT-5.3-Codex е далеч по-добър в навигирането в реални интерфейси от предишните модели.

Отвъд кода: Агент с общо предназначение

Въпреки че превъзхожда програмирането, неговите възможности се простират далеч отвъд генерирането на код. OpenAI го позиционира като агент, който може да се справи с "почти всичко, което разработчиците и професионалистите могат да правят на компютър."

Поддръжка на жизнения цикъл на софтуера

Моделът е създаден да поддържа целия жизнен цикъл на разработка на софтуер:

Отстраняване на грешки - Идентифициране и коригиране на грешки

Разгръщане - Управление на издания и инфраструктура

Мониторинг - Проследяване на производителността и показателите

Писане на PRD - Документи с продуктови изисквания

Редактиране на текст - Документация и маркетингов текст

Потребителско проучване - Анализиране на обратна връзка от потребителите

Тестване - Писане и изпълнение на тестови пакети

Анализ на показатели - Вземане на решения, основани на данни

Възможности за работа със знания

На GPT-5.3-Codex (оценката на OpenAI за 2025 г., измерваща ефективността при задачи за работа със знания в 44 професии), GPT-5.3-Codex съответства на производителността на GPT-5.2. Това включва задачи като:

Създаване на слайдове и презентации

Анализиране на данни в електронни таблици

Управление и организация на документи

Проучване и синтез

Пример за уеб разработка

За да демонстрира възможностите на модела, OpenAI помоли да изгради две завършени игри от нулата:

Състезателна игра (версия 2 на играта за стартиране на приложението Codex)

Игра за гмуркане

Използвайки само умението "разработване на уеб игра" и общи подканващи съобщения като "поправете грешката" или "подобрете играта", итерира автономно над милиони токени, изграждайки високофункционални, усъвършенствани игри.

По-добро разбиране на намеренията

В сравнение с GPT-5.2-Codex, новият модел по-добре разбира намеренията на потребителя при изграждането на уебсайтове. Обикновените или недостатъчно определени подкани вече водят до сайтове с:

Повече функционалност

Разумни стойности по подразбиране

Готови за производство функции

Например, когато е помолен да изгради целева страница за ценообразуване, автоматично показва годишния план като месечна цена с отстъпка (като прави отстъпката ясна) и създава автоматично преминаващ въртележка с отзиви с три различни цитата на потребители - което води до по-завършен и усъвършенстван дизайн.

Интерактивно сътрудничество

Едно от най-значимите подобрения в потребителското изживяване е възможността да се насочва модела, докато той работи.

Взаимодействие в реално време

Вместо да чакат окончателен резултат, потребителите вече могат:

Да задават въпроси по време на изпълнение

Да обсъждат различни подходи

Да насочват към конкретни решения

Да предоставят обратна връзка по средата на задачата

Настройки > Общи > Поведение при проследяване говори за това, което прави, отговаря на обратната връзка и държи потребителите в течение от началото до края. Това може да бъде активирано в приложението Codex чрез Настройки > Общи > Поведение при проследяване.

Това трансформира изживяването от даване на команди на машина в сътрудничество със съотборник - фундаментална промяна в начина, по който хората взаимодействат с AI системи.

Възможности и безопасност за киберсигурност

първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността е първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността съгласно своята Рамка за готовност. Също така е първият модел, обучен директно да идентифицира софтуерни уязвимости.

Природа на двойна употреба

Тъй като киберсигурността по своята същност е с двойна употреба (полезна както за защита, така и за нападение), OpenAI предприема предпазен подход:

Няма окончателни доказателства, че може да автоматизира кибератаки от край до край

Разгръщане на цялостен стек за безопасност на киберсигурността

Прилагане на обучение за безопасност и автоматизиран мониторинг

Изискване на надежден достъп за разширени възможности

Надежден достъп за киберсигурност

OpenAI стартира Надежден достъп за киберсигурност, пилотна програма за:

Ускоряване на изследванията в областта на киберзащитата

Предоставяне на инструменти на защитниците първи

Подкрепа на устойчивостта на екосистемата

Ангажимент за $10 милиона

Надграждайки програма за безвъзмездна помощ за киберсигурност от $1 милион от 2023 г., OpenAI се ангажира с $10 милиона в API кредити за ускоряване на киберзащитата, особено за:

Софтуер с отворен код

Критични инфраструктурни системи

Изследвания за сигурност с добра воля

Агент за сигурност Aardvark

OpenAI разширява частната бета версия на Aardvark, своя агент за изследване на сигурността, като първата оферта в своя пакет от продукти и инструменти за сигурност на Codex. Те също така си партнират с поддържащи софтуер с отворен код, за да осигурят безплатно сканиране на кодовата база за широко използвани проекти като Next.js.

Как OpenAI използва Codex, за да изгради Codex

Разработването на предоставя завладяващо тематично проучване в ускорените от AI изследвания.

Случаи на използване от изследователския екип

Изследователският екип използва ранни версии на , за да:

Наблюдава и отстранява грешки в процеса на обучение за изданието

Проследява модели по време на обучението

Осигурява дълбок анализ на качеството на взаимодействието

Предлага корекции и изгражда богати приложения за човешки изследователи

Прецизно разбира как поведението на модела се различава от предишните модели

Случаи на използване от инженерния екип

Инженерният екип използва Codex, за да:

Оптимизира и адаптира сбруята за GPT-5.3-Codex

Идентифицира грешки при рендиране на контекст, които влияят на потребителите

Установява първопричината за ниските нива на хитове в кеша

Динамично мащабира GPU клъстери, за да се адаптира към пиковете на трафика

Поддържа стабилна латентност по време на стартиране

Случаи на използване на Data Science

По време на алфа тестването, анализатор на данни работи с , за да:

Изгражда класификатори на регулярни изрази, за да оцени честотата на разяснения, отговори на потребителите и напредък на задачите

Изпълнява тези класификатори мащабно върху всички регистрационни файлове на сесии

Изгражда нови тръбопроводи за данни и визуализира резултатите по-богато от стандартните инструменти за табла за управление

Съвместно анализира резултатите, като Codex обобщава ключови прозрения за хиляди точки от данни за по-малко от три минути

Повишаване на производителността

Резултатът? Хората, които изграждат с Codex, са по-щастливи, тъй като агентът:

Разбира по-добре намеренията им

Постига повече напредък на ход

Задава по-малко въпроси за разяснение

Наличност и цени

Как да получите достъп

на разположение веднага е на разположение веднага за платени потребители на ChatGPT във всички повърхности на Codex:

Настолно приложение (macOS и Windows)

Интерфейс на командния ред (CLI)

IDE разширения (VS Code, JetBrains и др.)

Уеб интерфейс

Абонаментни планове

За ограничено време платените планове ще получат двойно по-високи нормални лимити на скоростта.

API цени

Към момента на стартиране GPT-5.3-Codex за GPT-5.3-Codex. Достъпът до API е описан като "скоро ще бъде пуснат" и "предстоящ през следващите седмици."

За справка, текущите API цени за предишния модел (GPT-5.2-Codex) са:

Инфраструктура

NVIDIA GB200 NVL72 системи е съвместно проектиран, обучен и обслужван на NVIDIA GB200 NVL72 системи - свидетелство за тясното сътрудничество между OpenAI и NVIDIA в разширяването на границите на възможностите на AI.

Сравнение с конкурентите

Издаването на Claude Opus 4.6 дойде само минути след обявяването на Claude Opus 4.6 от Anthropic, създавайки незабавно сравнение между двата модела.

Силни страни на

Terminal-Bench 2.0: 77,3 срещу 65,4 на Opus 4.6 (+18,6% предимство)

25% по-бърза производителност

Философия на дизайна "Висока надеждност, ниска вариация"

Възможност за самоизграждане (помогна за създаването на самия себе си)

Първа класификация за киберсигурност "Висока способност"

Силни страни на Claude Opus 4.6

Прозорец на контекста от 1 милион токени (значително по-голям)

Екипи от агенти функционалност за съвместна работа

По-широка гъвкавост в сценарии за работа със знания

По-висока температура на креативност (повече индивидуалност)

Разлики във философията на дизайна

По-голямата картина

агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват представлява повече от просто постепенно надграждане - това е промяна към агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват в целия спектър от реална техническа работа.

От кодов агент към компютърен агент

OpenAI изрично оформя тази еволюция: "Codex се движи отвъд писането на код, за да го използва като инструмент за работа с компютър и завършване на работата от край до край."

Това е дълбока промяна. Това, което започна като фокус върху това да бъде "най-добрият агент за кодиране", се превърна в основа за по-общ сътрудник на компютъра - разширявайки както кой може да изгражда, така и какво е възможно с AI.

Ускоряване на развитието на AI

Фактът, че помогна за изграждането на самия себе си, е предварителен преглед на това, което предстои. Както отбелязват изследователите на OpenAI, "много изследователи и инженери в OpenAI описват работата си днес като фундаментално различна от това, което беше само преди два месеца."

Това предполага, че навлизаме в период на ускоряваща се възвръщаемост в развитието на AI, където всяко поколение модели помага за изграждането на следващото - потенциално свивайки сроковете от години на месеци.

Последици за разработчиците

За софтуерните разработчици последиците са значителни:

По-бързи цикли на разработка - AI се справя с повече от рутинната работа

Абстракция на по-високо ниво - Разработчиците могат да се съсредоточат върху архитектурата и дизайна

Интерактивно сътрудничество - По-малко като използване на инструмент, повече като работа със съотборник

Нови възможности - Задачи, които преди това са изисквали специализирани знания, вече са достъпни

Последици за бизнеса

За бизнеса представлява:

Повишена производителност - Повече работа се върши за по-малко време

По-ниски бариери - Необходими са по-малко специализирани умения за определени задачи

Нови съображения за сигурност - Класификацията за киберсигурност "Висока способност" изисква внимателно управление

Конкурентно предимство - Ранно приемане на мощен агентичен AI

Заключение

е забележително постижение в изкуствения интелект. Той съчетава:

Най-съвременна производителност на кодиране

Разширени агентични възможности

Интерактивно сътрудничество

Самоусъвършенстване (помогна за изграждането на самия себе си)

Използване на компютър в реалния свят

Фактът, че той изигра важна роля в собственото си създаване, служи едновременно като техническо постижение и като метафора за това накъде е насочен AI. Тъй като моделите стават по-способни, те не са просто инструменти, които използваме - те се превръщат в партньори в самия творчески и развоен процес.

Едновременното издание с Claude Opus 4.6, само минути по-късно, подчертава интензивността на конкуренцията в пространството на AI. Но по-важното е, че сигнализира, че сме навлезли в нова фаза на възможностите на AI - такава, където агентите могат надеждно да се справят със сложни, дългосрочни задачи в целия спектър от професионална компютърна работа.

Както OpenAI го казва: "Това, което започна като фокус върху това да бъде най-добрият агент за кодиране, се превърна в основа за по-общ сътрудник на компютъра."

Въпросът сега не е само какво могат да направят тези модели - а какво ще изберем да изградим с тях.

Източници

Представяне на GPT-5.3-Codex - Официално съобщение на OpenAI

Системна карта на GPT-5.3-Codex - OpenAI

Ценообразуване, тестове и характеристики на GPT 5.3 Codex, обяснени - eesel AI

OpenAI: Новият модел за кодиране GPT-5.3-Codex помогна за създаването на самия себе си - Mashable

С GPT-5.3-Codex, OpenAI предлага Codex за повече от просто писане на код - Ars Technica

OpenAI стартира нов агентичен модел за кодиране само минути след като Anthropic пусна своя собствен - TechCrunch

Opus 4.6 срещу CODEX 5.3, първо реално сравнение - Reddit

GPT 5.3 Codex срещу Opus 4.6: Голямото сближаване - Every

Ценообразуване на платформата OpenAI

Ценообразуване на Codex

Официална класация на SWE-Bench

Отказ от отговорност: Тази статия се основава на информация, налична към 6 февруари 2026 г. Спецификациите, цените и наличността могат да се променят. Моля, вижте официалната документация на OpenAI за най-актуалната информация.

GPT-5.3-Codex: Най-способният агентски модел за програмиране на OpenAI