Sider.ai
  • Чат
  • Wisebase
  • Инструменти
  • Разширение
  • клиенти
  • Ценообразуване
Свали сега
Влизам

Учете по-бързо, мислете по-дълбоко и растете по-умно със Sider.

Продукти
Приложения
  • Разширения
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Инструменти
  • Уеб създателNew
  • AI СлайдовеNew
  • AI Писател на есета
  • Nano Banana Pro
  • Nano Banana Infographic
  • AI Генератор на изображения
  • Италиански генератор на мозъчна мъгла
  • Премахване на фон
  • Смяна на фона
  • Изтриване на снимка
  • Премахване на текст
  • Ретуширане
  • Увеличаване на изображение
  • Създайте
  • AI Преводач
  • Преводач на изображения
  • PDF Преводач
Sider
  • Свържете се с нас
  • Център за помощ
  • Изтегляне
  • Ценообразуване
  • Образователен план
  • Какво е ново
  • Блог
  • Общество
  • Партньори
  • Партньорска програма
  • Покани
©2026 Всички права запазени
Условия за ползване
Политика за поверителност
  • Начална страница
  • Блог
  • AI Новини
  • GPT-5.3-Codex: Най-способният агентски модел за програмиране на OpenAI

GPT-5.3-Codex: Най-способният агентски модел за програмиране на OpenAI

Актуализирано на 6 фев 2026

1 мин


Въведение

На 5 февруари 2026 г. OpenAI обяви GPT-5.3-Codex, най-модерният си агентичен модел за кодиране до момента. Това издание бележи значителен етап в развитието на изкуствения интелект – не само заради впечатляващите му технически възможности, но и защото е първият модел, който изигра важна роля в създаването на самия себе си.
представлява фундаментална промяна от инструмент за писане на код към интерактивен AI сътрудник, способен да се справя с дългосрочна, реална техническа работа в целия спектър от професионални компютърни задачи.

Какво прави различен?

Истински агентичен модел

За разлика от традиционните асистенти за кодиране, които просто генерират фрагменти от код, е проектиран като "агентичен" модел. Това означава, че той може:
  • Да поддържа контекст при дългосрочни задачи, които продължават часове или дори дни
  • Да използва инструменти автономно, включително интерфейси на командния ред, файлови системи и среди за разработка
  • Да се адаптира и повтаря въз основа на обратна връзка в реално време, без да губи позицията си
  • Да обработва сложни многоетапни работни процеси, които изискват проучване, планиране и изпълнение

Самоизграждащо се постижение

Може би най-забележителният аспект на е, че екипът на Codex е използвал ранни версии на модела, за да:
  • Отстранява грешки в собствения си процес на обучение
  • Управлява собственото си внедряване
  • Диагностицира резултатите от тестовете и оценките
  • Оптимизира инфраструктурата за окончателното издание
Този самореферентен цикъл на разработка демонстрира как AI започва да ускорява собственото си подобрение - етап, който изследователите на OpenAI описват като "поразени от това колко много Codex успя да ускори собственото си развитие."

Подобрения в производителността

25% по-бърз е 25% по-бърз от своя предшественик (GPT-5.2-Codex), благодарение на подобренията в инфраструктурата и стека за заключение на OpenAI. Това подобрение на скоростта позволява по-отзивчиво сътрудничество в реално време и по-бързи цикли на итерация.

Резултати от тестовете: Данните

постига най-добри резултати в няколко ключови теста, които измерват кодирането, агентичните възможности и използването на компютър в реалния свят.

SWE-Bench Pro

SWE-Bench Pro е строга оценка на софтуерното инженерство в реалния свят, която обхваща четири езика за програмиране (Python, JavaScript, TypeScript и Go). За разлика от своя предшественик (SWE-Bench Verified), който тестваше само Python, SWE-Bench Pro е проектиран да бъде по-устойчив на замърсяване и по-подходящ за индустрията.

Terminal-Bench 2.0

GPT-5.3-Codex в Terminal-Bench 2.0 е особено значително. Този тест измерва терминалните умения, от които се нуждае един кодиращ агент - навигиране във файлови системи, изпълнение на команди и управление на работни процеси за разработка. Забележително е, че GPT-5.3-Codex постига това с по-малко токени от всеки предишен модел, което го прави по-ефективен.

OSWorld-Verified

GPT-5.3-Codex в OSWorld-Verified демонстрира драстично подобрени възможности за използване на компютър. OSWorld е агентичен тест за използване на компютър, където агентите трябва да изпълняват задачи за продуктивност във визуална настолна среда. Това масивно подобрение показва, че GPT-5.3-Codex е далеч по-добър в навигирането в реални интерфейси от предишните модели.

Отвъд кода: Агент с общо предназначение

Въпреки че превъзхожда програмирането, неговите възможности се простират далеч отвъд генерирането на код. OpenAI го позиционира като агент, който може да се справи с "почти всичко, което разработчиците и професионалистите могат да правят на компютър."

Поддръжка на жизнения цикъл на софтуера

Моделът е създаден да поддържа целия жизнен цикъл на разработка на софтуер:
  • Отстраняване на грешки - Идентифициране и коригиране на грешки
  • Разгръщане - Управление на издания и инфраструктура
  • Мониторинг - Проследяване на производителността и показателите
  • Писане на PRD - Документи с продуктови изисквания
  • Редактиране на текст - Документация и маркетингов текст
  • Потребителско проучване - Анализиране на обратна връзка от потребителите
  • Тестване - Писане и изпълнение на тестови пакети
  • Анализ на показатели - Вземане на решения, основани на данни

Възможности за работа със знания

На GPT-5.3-Codex (оценката на OpenAI за 2025 г., измерваща ефективността при задачи за работа със знания в 44 професии), GPT-5.3-Codex съответства на производителността на GPT-5.2. Това включва задачи като:
  • Създаване на слайдове и презентации
  • Анализиране на данни в електронни таблици
  • Управление и организация на документи
  • Проучване и синтез

Пример за уеб разработка

За да демонстрира възможностите на модела, OpenAI помоли да изгради две завършени игри от нулата:
  • Състезателна игра (версия 2 на играта за стартиране на приложението Codex)
  • Игра за гмуркане
Използвайки само умението "разработване на уеб игра" и общи подканващи съобщения като "поправете грешката" или "подобрете играта", итерира автономно над милиони токени, изграждайки високофункционални, усъвършенствани игри.

По-добро разбиране на намеренията

В сравнение с GPT-5.2-Codex, новият модел по-добре разбира намеренията на потребителя при изграждането на уебсайтове. Обикновените или недостатъчно определени подкани вече водят до сайтове с:
  • Повече функционалност
  • Разумни стойности по подразбиране
  • Готови за производство функции
Например, когато е помолен да изгради целева страница за ценообразуване, автоматично показва годишния план като месечна цена с отстъпка (като прави отстъпката ясна) и създава автоматично преминаващ въртележка с отзиви с три различни цитата на потребители - което води до по-завършен и усъвършенстван дизайн.

Интерактивно сътрудничество

Едно от най-значимите подобрения в потребителското изживяване е възможността да се насочва модела, докато той работи.

Взаимодействие в реално време

Вместо да чакат окончателен резултат, потребителите вече могат:
  • Да задават въпроси по време на изпълнение
  • Да обсъждат различни подходи
  • Да насочват към конкретни решения
  • Да предоставят обратна връзка по средата на задачата
Настройки > Общи > Поведение при проследяване говори за това, което прави, отговаря на обратната връзка и държи потребителите в течение от началото до края. Това може да бъде активирано в приложението Codex чрез Настройки > Общи > Поведение при проследяване.
Това трансформира изживяването от даване на команди на машина в сътрудничество със съотборник - фундаментална промяна в начина, по който хората взаимодействат с AI системи.

Възможности и безопасност за киберсигурност

първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността е първият модел, който OpenAI класифицира като "Висока способност" за задачи, свързани с киберсигурността съгласно своята Рамка за готовност. Също така е първият модел, обучен директно да идентифицира софтуерни уязвимости.

Природа на двойна употреба

Тъй като киберсигурността по своята същност е с двойна употреба (полезна както за защита, така и за нападение), OpenAI предприема предпазен подход:
  • Няма окончателни доказателства, че може да автоматизира кибератаки от край до край
  • Разгръщане на цялостен стек за безопасност на киберсигурността
  • Прилагане на обучение за безопасност и автоматизиран мониторинг
  • Изискване на надежден достъп за разширени възможности

Надежден достъп за киберсигурност

OpenAI стартира Надежден достъп за киберсигурност, пилотна програма за:
  • Ускоряване на изследванията в областта на киберзащитата
  • Предоставяне на инструменти на защитниците първи
  • Подкрепа на устойчивостта на екосистемата

Ангажимент за $10 милиона

Надграждайки програма за безвъзмездна помощ за киберсигурност от $1 милион от 2023 г., OpenAI се ангажира с $10 милиона в API кредити за ускоряване на киберзащитата, особено за:
  • Софтуер с отворен код
  • Критични инфраструктурни системи
  • Изследвания за сигурност с добра воля

Агент за сигурност Aardvark

OpenAI разширява частната бета версия на Aardvark, своя агент за изследване на сигурността, като първата оферта в своя пакет от продукти и инструменти за сигурност на Codex. Те също така си партнират с поддържащи софтуер с отворен код, за да осигурят безплатно сканиране на кодовата база за широко използвани проекти като Next.js.

Как OpenAI използва Codex, за да изгради Codex

Разработването на предоставя завладяващо тематично проучване в ускорените от AI изследвания.

Случаи на използване от изследователския екип

Изследователският екип използва ранни версии на , за да:
  • Наблюдава и отстранява грешки в процеса на обучение за изданието
  • Проследява модели по време на обучението
  • Осигурява дълбок анализ на качеството на взаимодействието
  • Предлага корекции и изгражда богати приложения за човешки изследователи
  • Прецизно разбира как поведението на модела се различава от предишните модели

Случаи на използване от инженерния екип

Инженерният екип използва Codex, за да:
  • Оптимизира и адаптира сбруята за GPT-5.3-Codex
  • Идентифицира грешки при рендиране на контекст, които влияят на потребителите
  • Установява първопричината за ниските нива на хитове в кеша
  • Динамично мащабира GPU клъстери, за да се адаптира към пиковете на трафика
  • Поддържа стабилна латентност по време на стартиране

Случаи на използване на Data Science

По време на алфа тестването, анализатор на данни работи с , за да:
  • Изгражда класификатори на регулярни изрази, за да оцени честотата на разяснения, отговори на потребителите и напредък на задачите
  • Изпълнява тези класификатори мащабно върху всички регистрационни файлове на сесии
  • Изгражда нови тръбопроводи за данни и визуализира резултатите по-богато от стандартните инструменти за табла за управление
  • Съвместно анализира резултатите, като Codex обобщава ключови прозрения за хиляди точки от данни за по-малко от три минути

Повишаване на производителността

Резултатът? Хората, които изграждат с Codex, са по-щастливи, тъй като агентът:
  • Разбира по-добре намеренията им
  • Постига повече напредък на ход
  • Задава по-малко въпроси за разяснение

Наличност и цени

Как да получите достъп

на разположение веднага е на разположение веднага за платени потребители на ChatGPT във всички повърхности на Codex:
  • Настолно приложение (macOS и Windows)
  • Интерфейс на командния ред (CLI)
  • IDE разширения (VS Code, JetBrains и др.)
  • Уеб интерфейс

Абонаментни планове

За ограничено време платените планове ще получат двойно по-високи нормални лимити на скоростта.

API цени

Към момента на стартиране GPT-5.3-Codex за GPT-5.3-Codex. Достъпът до API е описан като "скоро ще бъде пуснат" и "предстоящ през следващите седмици."
За справка, текущите API цени за предишния модел (GPT-5.2-Codex) са:

Инфраструктура

NVIDIA GB200 NVL72 системи е съвместно проектиран, обучен и обслужван на NVIDIA GB200 NVL72 системи - свидетелство за тясното сътрудничество между OpenAI и NVIDIA в разширяването на границите на възможностите на AI.

Сравнение с конкурентите

Издаването на Claude Opus 4.6 дойде само минути след обявяването на Claude Opus 4.6 от Anthropic, създавайки незабавно сравнение между двата модела.

Силни страни на

  • Terminal-Bench 2.0: 77,3 срещу 65,4 на Opus 4.6 (+18,6% предимство)
  • 25% по-бърза производителност
  • Философия на дизайна "Висока надеждност, ниска вариация"
  • Възможност за самоизграждане (помогна за създаването на самия себе си)
  • Първа класификация за киберсигурност "Висока способност"

Силни страни на Claude Opus 4.6

  • Прозорец на контекста от 1 милион токени (значително по-голям)
  • Екипи от агенти функционалност за съвместна работа
  • По-широка гъвкавост в сценарии за работа със знания
  • По-висока температура на креативност (повече индивидуалност)

Разлики във философията на дизайна

По-голямата картина

агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват представлява повече от просто постепенно надграждане - това е промяна към агенти с общо предназначение, които могат да разсъждават, изграждат и изпълняват в целия спектър от реална техническа работа.

От кодов агент към компютърен агент

OpenAI изрично оформя тази еволюция: "Codex се движи отвъд писането на код, за да го използва като инструмент за работа с компютър и завършване на работата от край до край."
Това е дълбока промяна. Това, което започна като фокус върху това да бъде "най-добрият агент за кодиране", се превърна в основа за по-общ сътрудник на компютъра - разширявайки както кой може да изгражда, така и какво е възможно с AI.

Ускоряване на развитието на AI

Фактът, че помогна за изграждането на самия себе си, е предварителен преглед на това, което предстои. Както отбелязват изследователите на OpenAI, "много изследователи и инженери в OpenAI описват работата си днес като фундаментално различна от това, което беше само преди два месеца."
Това предполага, че навлизаме в период на ускоряваща се възвръщаемост в развитието на AI, където всяко поколение модели помага за изграждането на следващото - потенциално свивайки сроковете от години на месеци.

Последици за разработчиците

За софтуерните разработчици последиците са значителни:
  • По-бързи цикли на разработка - AI се справя с повече от рутинната работа
  • Абстракция на по-високо ниво - Разработчиците могат да се съсредоточат върху архитектурата и дизайна
  • Интерактивно сътрудничество - По-малко като използване на инструмент, повече като работа със съотборник
  • Нови възможности - Задачи, които преди това са изисквали специализирани знания, вече са достъпни

Последици за бизнеса

За бизнеса представлява:
  • Повишена производителност - Повече работа се върши за по-малко време
  • По-ниски бариери - Необходими са по-малко специализирани умения за определени задачи
  • Нови съображения за сигурност - Класификацията за киберсигурност "Висока способност" изисква внимателно управление
  • Конкурентно предимство - Ранно приемане на мощен агентичен AI

Заключение

е забележително постижение в изкуствения интелект. Той съчетава:
  • Най-съвременна производителност на кодиране
  • Разширени агентични възможности
  • Интерактивно сътрудничество
  • Самоусъвършенстване (помогна за изграждането на самия себе си)
  • Използване на компютър в реалния свят
Фактът, че той изигра важна роля в собственото си създаване, служи едновременно като техническо постижение и като метафора за това накъде е насочен AI. Тъй като моделите стават по-способни, те не са просто инструменти, които използваме - те се превръщат в партньори в самия творчески и развоен процес.
Едновременното издание с Claude Opus 4.6, само минути по-късно, подчертава интензивността на конкуренцията в пространството на AI. Но по-важното е, че сигнализира, че сме навлезли в нова фаза на възможностите на AI - такава, където агентите могат надеждно да се справят със сложни, дългосрочни задачи в целия спектър от професионална компютърна работа.
Както OpenAI го казва: "Това, което започна като фокус върху това да бъде най-добрият агент за кодиране, се превърна в основа за по-общ сътрудник на компютъра."
Въпросът сега не е само какво могат да направят тези модели - а какво ще изберем да изградим с тях.

Източници

Представяне на GPT-5.3-Codex - Официално съобщение на OpenAI
Системна карта на GPT-5.3-Codex - OpenAI
Ценообразуване, тестове и характеристики на GPT 5.3 Codex, обяснени - eesel AI
OpenAI: Новият модел за кодиране GPT-5.3-Codex помогна за създаването на самия себе си - Mashable
С GPT-5.3-Codex, OpenAI предлага Codex за повече от просто писане на код - Ars Technica
OpenAI стартира нов агентичен модел за кодиране само минути след като Anthropic пусна своя собствен - TechCrunch
Opus 4.6 срещу CODEX 5.3, първо реално сравнение - Reddit
GPT 5.3 Codex срещу Opus 4.6: Голямото сближаване - Every
Ценообразуване на платформата OpenAI
Ценообразуване на Codex
Официална класация на SWE-Bench

Отказ от отговорност: Тази статия се основава на информация, налична към 6 февруари 2026 г. Спецификациите, цените и наличността могат да се променят. Моля, вижте официалната документация на OpenAI за най-актуалната информация.

Нови статии
Подробна хронология на еволюцията и постиженията на OpenAI

Подробна хронология на еволюцията и постиженията на OpenAI

Compose AI Разширение за Chrome | Ревю и Алтернатива

Compose AI Разширение за Chrome | Ревю и Алтернатива