Вступ
5 лютого 2026 року OpenAI оголосила про GPT-5.3-Codex, свою найсучаснішу на сьогодні модель агентивного кодування. Цей реліз знаменує собою значну віху в штучному інтелекті — не лише завдяки його вражаючим технічним можливостям, але й тому, що це перша модель, яка зіграла важливу роль у створенні самої себе.
являє собою фундаментальний зсув від інструменту для написання коду до інтерактивного AI-помічника, здатного обробляти довготривалі, реальні технічні завдання в усьому спектрі професійних обчислювальних задач.
Що відрізняє від інших?
Справжня агентивна модель
На відміну від традиційних помічників з кодування, які просто генерують фрагменти коду, розроблено як «агентивна» модель. Це означає, що він може:
- Підтримувати контекст протягом тривалих завдань, які тривають годинами або навіть днями
- Використовувати інструменти автономно, включаючи інтерфейси командного рядка, файлові системи та середовища розробки
- Адаптуватися та ітерувати на основі зворотного зв'язку в реальному часі, не втрачаючи контекст
- Обробляти складні багатокрокові робочі процеси, які потребують дослідження, планування та виконання
Самостійне досягнення
Мабуть, найвизначнішим аспектом є те, що команда Codex використовувала ранні версії моделі для:
- Налагодження власного процесу навчання
- Управління власним розгортанням
- Діагностики результатів тестування та оцінювання
- Оптимізації інфраструктури для остаточного релізу
Цей самореферентний цикл розробки демонструє, як ШІ починає прискорювати власне вдосконалення — віха, яку дослідники OpenAI описали як те, що вони були «вражені тим, наскільки Codex зміг прискорити власну розробку».
Покращення продуктивності
25% швидший на 25% швидший за свого попередника (GPT-5.2-Codex) завдяки покращенням в інфраструктурі та стеку висновування OpenAI. Це покращення швидкості забезпечує більш чуйну співпрацю в реальному часі та швидші цикли ітерацій.
Ефективність еталонного тестування: Дані
досягає найвищої продуктивності за кількома ключовими еталонними показниками, які вимірюють кодування, агентивні можливості та використання комп’ютера в реальному світі.
SWE-Bench Pro — це ретельна оцінка реальної розробки програмного забезпечення, яка охоплює чотири мови програмування (Python, JavaScript, TypeScript і Go). На відміну від свого попередника (), який тестував лише Python, розроблено як більш стійкий до забруднення та релевантний для промисловості.
GPT-5.3-Codex на GPT-5.3-Codex є особливо значним. Цей еталон вимірює термінальні навички, які потрібні агенту кодування — навігацію файловими системами, виконання команд і керування робочими процесами розробки. Примітно, що GPT-5.3-Codex досягає цього з меншою кількістю токенів, ніж будь-яка попередня модель, що робить його більш ефективним.
GPT-5.3-Codex на GPT-5.3-Codex демонструє значно покращені можливості використання комп’ютера. GPT-5.3-Codex — це еталон для агентивного використання комп’ютера, де агенти повинні виконувати завдання продуктивності у візуальному середовищі робочого столу. Це масштабне покращення показує, що GPT-5.3-Codex набагато краще орієнтується в реальних інтерфейсах, ніж попередні моделі.
Більше, ніж код: агент загального призначення
Хоча чудово справляється з програмуванням, його можливості виходять далеко за межі генерації коду. OpenAI позиціонує його як агента, який може обробляти «майже все, що розробники та професіонали можуть робити на комп’ютері».
Підтримка життєвого циклу програмного забезпечення
Модель створена для підтримки всього життєвого циклу розробки програмного забезпечення:
- Налагодження - Виявлення та виправлення помилок
- Розгортання - Управління релізами та інфраструктурою
- Моніторинг - Відстеження продуктивності та показників
- Написання PRD - Документи з вимогами до продукту
- Редагування копій - Документація та маркетинговий текст
- Дослідження користувачів - Аналіз відгуків користувачів
- Тестування - Написання та запуск наборів тестів
- Аналіз показників - Прийняття рішень на основі даних
Можливості для інтелектуальної роботи
На GPT-5.2 (оцінка OpenAI 2025 року, що вимірює продуктивність у завданнях інтелектуальної роботи за 44 професіями), GPT-5.2 відповідає продуктивності GPT-5.2. Це включає такі завдання, як:
- Створення слайдів і презентацій
- Аналіз даних у електронних таблицях
- Керування документами та їх організація
Приклад веб-розробки
Щоб продемонструвати можливості моделі, OpenAI попросила створити дві повноцінні гри з нуля:
- Гра про перегони (версія 2 гри для запуску програми Codex)
Використовуючи лише навичку «розробити веб-гру» та загальні наступні підказки, як-от «виправити помилку» або «покращити гру», автономно ітерував мільйони токенів, створюючи високофункціональні, відшліфовані ігри.
Краще розуміння намірів
Порівняно з , нова модель краще розуміє наміри користувача під час створення веб-сайтів. Прості або недостатньо визначені підказки тепер за замовчуванням призводять до сайтів з:
- Розумними значеннями за замовчуванням
- Готовими до виробництва функціями
Наприклад, коли попросили створити цільову сторінку з цінами, автоматично відобразив річний план як місячну ціну зі знижкою (зробивши знижку зрозумілою) і створив автоматично перехідну карусель відгуків з трьома різними цитатами користувачів, що призвело до більш повного та відшліфованого дизайну.
Інтерактивна співпраця
Одним із найзначніших покращень користувацького досвіду є можливість керувати моделлю під час її роботи.
Взаємодія в реальному часі
Замість того, щоб чекати на остаточний результат, користувачі тепер можуть:
- Ставити запитання під час виконання
- Обговорювати різні підходи
- Спрямовувати до конкретних рішень
- Надавати відгук у середині завдання
Налаштування > Загальні > Подальша поведінка розповідає про те, що він робить, реагує на відгуки та тримає користувачів в курсі від початку до кінця. Це можна ввімкнути в додатку Codex через Налаштування > Загальні > Подальша поведінка.
Це перетворює досвід з віддавання команд машині на співпрацю з товаришем по команді — фундаментальний зсув у тому, як люди взаємодіють із системами штучного інтелекту.
Можливості та безпека в галузі кібербезпеки
перша модель, яку OpenAI класифікує як «Високопродуктивну» для завдань, пов’язаних із кібербезпекою — це перша модель, яку OpenAI класифікує як «Високопродуктивну» для завдань, пов’язаних із кібербезпекою відповідно до своєї Рамки готовності. Це також перша модель, безпосередньо навчена ідентифікувати вразливості програмного забезпечення.
Подвійна природа
Оскільки кібербезпека за своєю суттю має подвійне призначення (корисна як для захисту, так і для нападу), OpenAI вживає запобіжних заходів:
- Немає остаточних доказів, що він може автоматизувати кібератаки наскрізно
- Розгортання комплексної стеку безпеки кібербезпеки
- Впровадження навчання з питань безпеки та автоматизованого моніторингу
- Вимога надійного доступу для розширених можливостей
Надійний доступ для кібербезпеки
OpenAI запускає Надійний доступ для кібербезпеки, пілотну програму для:
- Прискорення досліджень у галузі кіберзахисту
- Першочергове надання інструментів захисникам
- Підтримка стійкості екосистеми
Зобов'язання на 10 мільйонів доларів
Спираючись на Програму грантів на кібербезпеку в розмірі 1 мільйона доларів США з 2023 року, OpenAI виділяє 10 мільйонів доларів США в API кредитах для прискорення кіберзахисту, особливо для:
- Програмного забезпечення з відкритим кодом
- Систем критичної інфраструктури
- Добросовісних досліджень у галузі безпеки
Агент безпеки Aardvark
OpenAI розширює приватну бета-версію Aardvark, свого агента з дослідження безпеки, як першу пропозицію в своєму наборі продуктів і інструментів Codex Security. Вони також співпрацюють з мейнтейнерами відкритого коду, щоб забезпечити безкоштовне сканування кодової бази для широко використовуваних проектів, таких як Next.js.
Як OpenAI використовувала Codex для створення Codex
Розробка є захоплюючим прикладом прискорених ШІ досліджень.
Варіанти використання команди дослідників
Команда дослідників використовувала ранні версії для:
- Моніторингу та налагодження запуску навчання для випуску
- Відстеження моделей протягом усього курсу навчання
- Забезпечення глибокого аналізу якості взаємодії
- Пропонування виправлень та створення розширених програм для дослідників-людей
- Точного розуміння того, чим поведінка моделі відрізнялася від попередніх моделей
Варіанти використання команди інженерів
Команда інженерів використовувала Codex для:
- Оптимізації та адаптації системи для <a2>GPT-5.3-Codex</a2>
- Виявлення помилок рендерингу контексту, які впливають на користувачів
- Виявлення першопричини низьких показників попадання в кеш
- Динамічного масштабування кластерів GPU для адаптації до сплесків трафіку
- Підтримки стабільної затримки під час запуску
Варіанти використання науки про дані
Під час альфа-тестування спеціаліст з науки про дані працював з для:
- Створення класифікаторів regex для оцінки частоти уточнень, відповідей користувачів і прогресу виконання завдань
- Масштабного запуску цих класифікаторів у всіх журналах сеансів
- Створення нових конвеєрів даних і візуалізації результатів багатше, ніж стандартні інструменти інформаційних панелей
- Спільного аналізу результатів, при цьому Codex підсумовує ключові висновки за тисячами точок даних менш ніж за три хвилини
Підвищення продуктивності
Результат? Люди, які створюють за допомогою Codex, були щасливішими, оскільки агент:
- Краще розумів їхній намір
- Досягав більшого прогресу за хід
- Задавав менше уточнюючих запитань
Доступність та ціни
Як отримати доступ
доступний одразу доступний одразу для платних користувачів ChatGPT на всіх поверхнях Codex:
- Настільна програма (macOS і Windows)
- Інтерфейс командного рядка (CLI)
- Розширення IDE (VS Code, JetBrains тощо)
Плани підписки
Протягом обмеженого часу платні плани отримають вдвічі більші нормальні ліміти швидкості.
Ціни на API
На момент запуску GPT-5.3-Codex для GPT-5.3-Codex. Доступ до API описується як «розгортання найближчим часом» і «наступними тижнями».
Для довідки, поточна ціна API для попередньої моделі (GPT-5.2-Codex) становить:
Інфраструктура
системах NVIDIA GB200 NVL72 було спільно розроблено для, навчено за допомогою та обслуговувано на системах NVIDIA GB200 NVL72 — це свідчення тісної співпраці між OpenAI та NVIDIA у розширенні меж можливостей ШІ.
Порівняння з конкурентами
Випуск Claude Opus 4.6 відбувся лише через кілька хвилин після оголошення Anthropic про Claude Opus 4.6, що створило миттєве порівняння між двома моделями.
Сильні сторони
- Terminal-Bench 2.0: 77,3 проти 65,4 у Opus 4.6 (перевага +18,6%)
- На 25% швидша продуктивність
- Філософія проектування «Висока надійність, низька дисперсія»
- Можливість самостійного створення (допоміг створити себе)
- Перша класифікація «Висока здатність» в галузі кібербезпеки
Сильні сторони
- Контекстне вікно на 1 мільйон токенів (значно більше)
- Командна функціональність Agent Teams
- Ширша універсальність у сценаріях інтелектуальної роботи
- Вища температура творчості (більше індивідуальності)
Відмінності в філософії дизайну
Загальна картина
агентів загального призначення, які можуть міркувати, будувати та виконувати являє собою більше, ніж просто поступове оновлення — це крок до агентів загального призначення, які можуть міркувати, будувати та виконувати в усьому спектрі реальної технічної роботи.
Від кодового агента до комп’ютерного агента
OpenAI чітко визначає цю еволюцію: «Codex переходить від написання коду до використання його як інструменту для управління комп’ютером і виконання роботи наскрізно».
Це глибока зміна. Те, що почалося як зосередженість на тому, щоб бути «найкращим агентом з кодування», стало основою для більш загального співробітника на комп’ютері, розширюючи як тих, хто може будувати, так і те, що можливо за допомогою ШІ.
Прискорення розробки ШІ
Той факт, що допоміг створити себе, є попереднім переглядом того, що буде далі. Як зазначають дослідники OpenAI, «багато дослідників і інженерів в OpenAI описують свою роботу сьогодні як принципово іншу від того, якою вона була лише два місяці тому».
Це свідчить про те, що ми вступаємо в період прискорення прибутків у розробці ШІ, де кожне покоління моделей допомагає будувати наступне, потенційно стискаючи терміни з років до місяців.
Наслідки для розробників
Для розробників програмного забезпечення наслідки є значними:
- Швидші цикли розробки - ШІ обробляє більше рутинної роботи
- Абстракція вищого рівня - Розробники можуть зосередитися на архітектурі та дизайні
- Інтерактивна співпраця - Менше схоже на використання інструменту, більше на роботу з товаришем по команді
- Нові можливості - Завдання, які раніше вимагали спеціальних знань, тепер доступні
Наслідки для бізнесу
Для підприємств являє собою:
- Підвищення продуктивності - Більше роботи виконується за менший час
- Нижчі бар'єри - Для певних завдань потрібно менше спеціалізованих навичок
- Нові міркування щодо безпеки - Класифікація кібербезпеки «Висока здатність» вимагає ретельного управління
- Конкурентна перевага - Раннє впровадження потужного агентивного ШІ
Висновок
— це визначне досягнення в штучному інтелекті. Він поєднує в собі:
- Найсучаснішу продуктивність кодування
- Розширені агентивні можливості
- Самоудосконалення (допоміг створити себе)
- Використання комп’ютера в реальному світі
Той факт, що він відіграв важливу роль у власному створенні, є як технічним досягненням, так і метафорою того, куди рухається ШІ. Оскільки моделі стають більш здатними, вони є не просто інструментами, які ми використовуємо, а стають партнерами в самому творчому процесі та процесі розробки.
Одночасний випуск з , лише за кілька хвилин, підкреслює інтенсивність конкуренції в сфері ШІ. Але, що важливіше, це свідчить про те, що ми вступили в нову фазу можливостей ШІ — фазу, де агенти можуть надійно обробляти складні, довготривалі завдання в усьому спектрі професійної комп’ютерної роботи.
Як висловилася OpenAI: «Те, що почалося як зосередженість на тому, щоб бути найкращим агентом з кодування, стало основою для більш загального співробітника на комп’ютері».
Питання зараз не в тому, що можуть робити ці моделі, а в тому, що ми вирішимо з ними створити.
Джерела
Відмова від відповідальності: Ця стаття базується на інформації, доступній станом на 6 лютого 2026 року. Технічні характеристики, ціни та наявність можуть змінюватися. Будь ласка, зверніться до офіційної документації OpenAI для отримання найновішої інформації.