Въведение
На 5 февруари 2026 г. OpenAI обяви GPT-5.3-Codex, най-модерният си агентичен модел за кодиране до момента. Това издание бележи значителен етап в развитието на изкуствения интелект – не само заради впечатляващите му технически възможности, но и защото е първият модел, който изигра важна роля в създаването на самия себе си.
представлява фундаментална промяна от инструмент за писане на код към интерактивен AI сътрудник, способен да се справя с дългосрочна, реална техническа работа в целия спектър от професионални компютърни задачи.
Какво прави различен?
Истински агентичен модел
За разлика от традиционните асистенти за кодиране, които просто генерират фрагменти от код, е проектиран като "агентичен" модел. Това означава, че той може:
- Да поддържа контекст при дългосрочни задачи, които продължават часове или дори дни
- Да използва инструменти автономно, включително интерфейси на командния ред, файлови системи и среди за разработка
- Да се адаптира и повтаря въз основа на обратна връзка в реално време, без да губи позицията си
- Да обработва сложни многоетапни работни процеси, които изискват проучване, планиране и изпълнение
Самоизграждащо се постижение
Може би най-забележителният аспект на е, че екипът на Codex е използвал ранни версии на модела, за да:
- Отстранява грешки в собствения си процес на обучение
- Управлява собственото си внедряване
- Диагностицира резултатите от тестовете и оценките
- Оптимизира инфраструктурата за окончателното издание
Този самореферентен цикъл на разработка демонстрира как AI започва да ускорява собственото си подобрение - етап, който изследователите на OpenAI описват като "поразени от това колко много Codex успя да ускори собственото си развитие."
Подобрения в производителността
25% по-бърз е 25% по-бърз от своя предшественик (GPT-5.2-Codex), благодарение на подобренията в инфраструктурата и стека за заключение на OpenAI. Това подобрение на скоростта позволява по-отзивчиво сътрудничество в реално време и по-бързи цикли на итерация.
Резултати от тестовете: Данните
постига най-добри резултати в няколко ключови теста, които измерват кодирането, агентичните възможности и използването на компютър в реалния свят.
SWE-Bench Pro
SWE-Bench Pro е строга оценка на софтуерното инженерство в реалния свят, която обхваща четири езика за програмиране (Python, JavaScript, TypeScript и Go). За разлика от своя предшественик (SWE-Bench Verified), който тестваше само Python, SWE-Bench Pro е проектиран да бъде по-устойчив на замърсяване и по-подходящ за индустрията.
Terminal-Bench 2.0
GPT-5.3-Codex в Terminal-Bench 2.0 е особено значително. Този тест измерва терминалните умения, от които се нуждае един кодиращ агент - навигиране във файлови системи, изпълнение на команди и управление на работни процеси за разработка. Забележително е, че GPT-5.3-Codex постига това с по-малко токени от всеки предишен модел, което го прави по-ефективен.
OSWorld-Verified
GPT-5.3-Codex в OSWorld-Verified демонстрира драстично подобрени възможности за използване на компютър. OSWorld е агентичен тест за използване на компютър, където агентите трябва да изпълняват задачи за продуктивност във визуална настолна среда. Това масивно подобрение показва, че GPT-5.3-Codex е далеч по-добър в навигирането в реални интерфейси от предишните модели.
Отвъд кода: Агент с общо предназначение
Въпреки че превъзхожда програмирането, неговите възможности се простират далеч отвъд генерирането на код. OpenAI го позиционира като агент, който може да се справи с "почти всичко, което разработчиците и професионалистите могат да правят на компютър."
Поддръжка на жизнения цикъл на софтуера
Моделът е създаден да поддържа целия жизнен цикъл на разработка на софтуер:
- Отстраняване на грешки - Идентифициране и коригиране на грешки
- Разгръщане - Управление на издания и инфраструктура
- Мониторинг - Проследяване на производителността и показателите
- Писане на PRD - Документи с продуктови изисквания
- Редактиране на текст - Документация и маркетингов текст
- Потребителско проучване - Анализиране на обратна връзка от потребителите
- Тестване - Писане и изпълнение на тестови пакети
- Анализ на показатели - Вземане на решения, основани на данни
Възможности за работа със знания
На GPT-5.3-Codex (оценката на OpenAI за 2025 г., измерваща ефективността при задачи за работа със знания в 44 професии), GPT-5.3-Codex съответства на производителността на GPT-5.2. Това включва задачи като:
- Създаване на слайдове и презентации
- Анализиране на данни в електронни таблици
- Управление и организация на документи
Пример за уеб разработка
За да демонстрира възможностите на модела, OpenAI помоли да изгради две завършени игри от нулата:
- Състезателна игра (версия 2 на играта за стартиране на приложението Codex)
Използвайки само умението "разработване на уеб игра" и общи подканващи съобщения като "поправете грешката" или "подобрете играта", итерира автономно над милиони токени, изграждайки високофункционални, усъвършенствани игри.
По-добро разбиране на намеренията
В сравнение с GPT-5.2-Codex, новият модел по-добре разбира намеренията на потребителя при изграждането на уебсайтове. Обикновените или недостатъчно определени подкани вече водят до сайтове с:
- Разумни стойности по подразбиране
- Готови за производство функции
Например, когато е помолен да изгради целева страница за ценообразуване, автоматично показва годишния план като месечна цена с отстъпка (като прави отстъпката ясна) и създава автоматично преминаващ въртележка с отзиви с три различни цитата на потребители - което води до по-завършен и усъвършенстван дизайн.
Интерактивно сътрудничество
Едно от най-значимите подобрения в потребителското изживяване е възможността да се насочва модела, докато той работи.
Взаимодействие в реално време
Вместо да чакат окончателен резултат, потребителите вече могат:
- Да задават въпроси по време на изпълнение
- Да обсъждат различни подходи
- Да насочват към конкретни решения
- Да предоставят обратна връзка по средата на задачата
Настройки > Общи > Поведение при проследяване говори за това, което прави, отговаря на обратната връзка и държи потребителите в течение от началото до края. Това може да бъде активирано в приложението Codex чрез Настройки > Общи > Поведение при проследяване.
Това трансформира изживяването от даване на команди на машина в сътрудничество със съотборник - фундаментална промяна в начина, по който хората взаимодействат с AI системи.
Възможности и безопасност за киберсигурност
първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността е първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността съгласно своята Рамка за готовност. Също така е първият модел, обучен директно да идентифицира софтуерни уязвимости.
Природа на двойна употреба
Тъй като киберсигурността по своята същност е с двойна употреба (полезна както за защита, така и за нападение), OpenAI предприема предпазен подход:
- Няма окончателни доказателства, че може да автоматизира кибератаки от край до край
- Разгръщане на цялостен стек за безопасност на киберсигурността
- Прилагане на обучение за безопасност и автоматизиран мониторинг
- Изискване на надежден достъп за разширени възможности
Надежден достъп за киберсигурност
OpenAI стартира Надежден достъп за киберсигурност, пилотна програма за:
- Ускоряване на изследванията в областта на киберзащитата
- Предоставяне на инструменти на защитниците първи
- Подкрепа на устойчивостта на екосистемата
Ангажимент за $10 милиона
Надграждайки програма за безвъзмездна помощ за киберсигурност от $1 милион от 2023 г., OpenAI се ангажира с $10 милиона в API кредити за ускоряване на киберзащитата, особено за:
- Критични инфраструктурни системи
- Изследвания за сигурност с добра воля
Агент за сигурност Aardvark
OpenAI разширява частната бета версия на Aardvark, своя агент за изследване на сигурността, като първата оферта в своя пакет от продукти и инструменти за сигурност на Codex. Те също така си партнират с поддържащи софтуер с отворен код, за да осигурят безплатно сканиране на кодовата база за широко използвани проекти като Next.js.
Как OpenAI използва Codex, за да изгради Codex
Разработването на предоставя завладяващо тематично проучване в ускорените от AI изследвания.
Случаи на използване от изследователския екип
Изследователският екип използва ранни версии на , за да:
- Наблюдава и отстранява грешки в процеса на обучение за изданието
- Проследява модели по време на обучението
- Осигурява дълбок анализ на качеството на взаимодействието
- Предлага корекции и изгражда богати приложения за човешки изследователи
- Прецизно разбира как поведението на модела се различава от предишните модели
Случаи на използване от инженерния екип
Инженерният екип използва Codex, за да:
- Оптимизира и адаптира сбруята за GPT-5.3-Codex
- Идентифицира грешки при рендиране на контекст, които влияят на потребителите
- Установява първопричината за ниските нива на хитове в кеша
- Динамично мащабира GPU клъстери, за да се адаптира към пиковете на трафика
- Поддържа стабилна латентност по време на стартиране
Случаи на използване на Data Science
По време на алфа тестването, анализатор на данни работи с , за да:
- Изгражда класификатори на регулярни изрази, за да оцени честотата на разяснения, отговори на потребителите и напредък на задачите
- Изпълнява тези класификатори мащабно върху всички регистрационни файлове на сесии
- Изгражда нови тръбопроводи за данни и визуализира резултатите по-богато от стандартните инструменти за табла за управление
- Съвместно анализира резултатите, като Codex обобщава ключови прозрения за хиляди точки от данни за по-малко от три минути
Повишаване на производителността
Резултатът? Хората, които изграждат с Codex, са по-щастливи, тъй като агентът:
- Разбира по-добре намеренията им
- Постига повече напредък на ход
- Задава по-малко въпроси за разяснение
Наличност и цени
Как да получите достъп
на разположение веднага е на разположение веднага за платени потребители на ChatGPT във всички повърхности на Codex:
- Настолно приложение (macOS и Windows)
- Интерфейс на командния ред (CLI)
- IDE разширения (VS Code, JetBrains и др.)
Абонаментни планове
За ограничено време платените планове ще получат двойно по-високи нормални лимити на скоростта.
API цени
Към момента на стартиране GPT-5.3-Codex за GPT-5.3-Codex. Достъпът до API е описан като "скоро ще бъде пуснат" и "предстоящ през следващите седмици."
За справка, текущите API цени за предишния модел (GPT-5.2-Codex) са:
Инфраструктура
NVIDIA GB200 NVL72 системи е съвместно проектиран, обучен и обслужван на NVIDIA GB200 NVL72 системи - свидетелство за тясното сътрудничество между OpenAI и NVIDIA в разширяването на границите на възможностите на AI.
Сравнение с конкурентите
Издаването на Claude Opus 4.6 дойде само минути след обявяването на Claude Opus 4.6 от Anthropic, създавайки незабавно сравнение между двата модела.
Силни страни на
- Terminal-Bench 2.0: 77,3 срещу 65,4 на Opus 4.6 (+18,6% предимство)
- 25% по-бърза производителност
- Философия на дизайна "Висока надеждност, ниска вариация"
- Възможност за самоизграждане (помогна за създаването на самия себе си)
- Първа класификация за киберсигурност "Висока способност"
Силни страни на Claude Opus 4.6
- Прозорец на контекста от 1 милион токени (значително по-голям)
- Екипи от агенти функционалност за съвместна работа
- По-широка гъвкавост в сценарии за работа със знания
- По-висока температура на креативност (повече индивидуалност)
Разлики във философията на дизайна
По-голямата картина
агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват представлява повече от просто постепенно надграждане - това е промяна към агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват в целия спектър от реална техническа работа.
От кодов агент към компютърен агент
OpenAI изрично оформя тази еволюция: "Codex се движи отвъд писането на код, за да го използва като инструмент за работа с компютър и завършване на работата от край до край."
Това е дълбока промяна. Това, което започна като фокус върху това да бъде "най-добрият агент за кодиране", се превърна в основа за по-общ сътрудник на компютъра - разширявайки както кой може да изгражда, така и какво е възможно с AI.
Ускоряване на развитието на AI
Фактът, че помогна за изграждането на самия себе си, е предварителен преглед на това, което предстои. Както отбелязват изследователите на OpenAI, "много изследователи и инженери в OpenAI описват работата си днес като фундаментално различна от това, което беше само преди два месеца."
Това предполага, че навлизаме в период на ускоряваща се възвръщаемост в развитието на AI, където всяко поколение модели помага за изграждането на следващото - потенциално свивайки сроковете от години на месеци.
Последици за разработчиците
За софтуерните разработчици последиците са значителни:
- По-бързи цикли на разработка - AI се справя с повече от рутинната работа
- Абстракция на по-високо ниво - Разработчиците могат да се съсредоточат върху архитектурата и дизайна
- Интерактивно сътрудничество - По-малко като използване на инструмент, повече като работа със съотборник
- Нови възможности - Задачи, които преди това са изисквали специализирани знания, вече са достъпни
Последици за бизнеса
За бизнеса представлява:
- Повишена производителност - Повече работа се върши за по-малко време
- По-ниски бариери - Необходими са по-малко специализирани умения за определени задачи
- Нови съображения за сигурност - Класификацията за киберсигурност "Висока способност" изисква внимателно управление
- Конкурентно предимство - Ранно приемане на мощен агентичен AI
Заключение
е забележително постижение в изкуствения интелект. Той съчетава:
- Най-съвременна производителност на кодиране
- Разширени агентични възможности
- Интерактивно сътрудничество
- Самоусъвършенстване (помогна за изграждането на самия себе си)
- Използване на компютър в реалния свят
Фактът, че той изигра важна роля в собственото си създаване, служи едновременно като техническо постижение и като метафора за това накъде е насочен AI. Тъй като моделите стават по-способни, те не са просто инструменти, които използваме - те се превръщат в партньори в самия творчески и развоен процес.
Едновременното издание с Claude Opus 4.6, само минути по-късно, подчертава интензивността на конкуренцията в пространството на AI. Но по-важното е, че сигнализира, че сме навлезли в нова фаза на възможностите на AI - такава, където агентите могат надеждно да се справят със сложни, дългосрочни задачи в целия спектър от професионална компютърна работа.
Както OpenAI го казва: "Това, което започна като фокус върху това да бъде най-добрият агент за кодиране, се превърна в основа за по-общ сътрудник на компютъра."
Въпросът сега не е само какво могат да направят тези модели - а какво ще изберем да изградим с тях.
Източници
Отказ от отговорност: Тази статия се основава на информация, налична към 6 февруари 2026 г. Спецификациите, цените и наличността могат да се променят. Моля, вижте официалната документация на OpenAI за най-актуалната информация.