Introducción

El 5 de febrero de 2026, OpenAI anunció GPT-5.3-Codex, su modelo de codificación agentic más avanzado hasta la fecha. Este lanzamiento marca un hito significativo en la inteligencia artificial, no solo por sus impresionantes capacidades técnicas, sino también porque es el primer modelo que fue fundamental en su propia creación.

GPT-5.3-Codex representa un cambio fundamental de una herramienta de escritura de código a un colaborador de IA interactivo capaz de manejar trabajo técnico del mundo real y a largo plazo en todo el espectro de tareas informáticas profesionales.

¿Qué diferencia a GPT-5.3-Codex?

Un verdadero modelo Agentic

A diferencia de los asistentes de codificación tradicionales que simplemente generan fragmentos de código, GPT-5.3-Codex está diseñado como un modelo "agentic". Esto significa que puede:

Mantener el contexto durante tareas de larga duración que se extienden por horas o incluso días

Usar herramientas de forma autónoma, incluyendo interfaces de línea de comandos, sistemas de archivos y entornos de desarrollo

Adaptarse e iterar basándose en la retroalimentación en tiempo real sin perder su posición

Manejar flujos de trabajo complejos de varios pasos que requieren investigación, planificación y ejecución

Logro de autoconstrucción

Quizás el aspecto más notable de GPT-5.3-Codex es que el equipo de Codex utilizó versiones tempranas del modelo para:

Depurar su propio proceso de entrenamiento

Gestionar su propio despliegue

Diagnosticar los resultados de las pruebas y las evaluaciones

Optimizar la infraestructura para la versión final

Este ciclo de desarrollo autorreferencial demuestra cómo la IA está comenzando a acelerar su propia mejora, un hito que los investigadores de OpenAI describieron como dejarlos "impresionados por cuánto Codex fue capaz de acelerar su propio desarrollo".

Mejoras de rendimiento

GPT-5.3-Codex es 25% más rápido que su predecesor (GPT-5.2-Codex), gracias a las mejoras en la infraestructura y la pila de inferencia de OpenAI. Esta mejora de velocidad permite una colaboración en tiempo real más receptiva y ciclos de iteración más rápidos.

Rendimiento de referencia: Los datos

GPT-5.3-Codex logra un rendimiento de última generación en varios puntos de referencia clave que miden la codificación, las capacidades agentic y el uso de computadoras en el mundo real.

SWE-Bench Pro

SWE-Bench Pro es una evaluación rigurosa de la ingeniería de software del mundo real que abarca cuatro lenguajes de programación (Python, JavaScript, TypeScript y Go). A diferencia de su predecesor (SWE-Bench Verified) que solo probó Python, SWE-Bench Pro está diseñado para ser más resistente a la contaminación y relevante para la industria.

Terminal-Bench 2.0

La mejora del 13.3% en Terminal-Bench 2.0 es particularmente significativa. Este punto de referencia mide las habilidades de terminal que necesita un agente de codificación: navegar por los sistemas de archivos, ejecutar comandos y administrar flujos de trabajo de desarrollo. Notablemente, GPT-5.3-Codex logra esto con menos tokens que cualquier modelo anterior, lo que lo hace más eficiente.

OSWorld-Verified

El salto del 26.5% en OSWorld-Verified demuestra capacidades de uso de computadora dramáticamente mejoradas. OSWorld es un punto de referencia de uso de computadora agentic donde los agentes deben completar tareas de productividad en un entorno de escritorio visual. Esta mejora masiva muestra que GPT-5.3-Codex es mucho mejor para navegar por interfaces del mundo real que los modelos anteriores.

Más allá del código: un agente de propósito general

Si bien GPT-5.3-Codex sobresale en la programación, sus capacidades se extienden mucho más allá de la generación de código. OpenAI lo posiciona como un agente que puede manejar "casi cualquier cosa que los desarrolladores y profesionales puedan hacer en una computadora".

Soporte del ciclo de vida del software

El modelo está construido para soportar todo el ciclo de vida del desarrollo de software:

Depuración - Identificación y corrección de errores

Despliegue - Gestión de lanzamientos e infraestructura

Monitoreo - Seguimiento del rendimiento y las métricas

Escritura de PRDs - Documentos de requisitos del producto

Edición de textos - Documentación y texto de marketing

Investigación de usuarios - Análisis de los comentarios de los usuarios

Pruebas - Escritura y ejecución de suites de pruebas

Análisis de métricas - Toma de decisiones basada en datos

Capacidades de trabajo del conocimiento

En GDPval (la evaluación de OpenAI de 2025 que mide el rendimiento en tareas de trabajo del conocimiento en 44 ocupaciones), GPT-5.3-Codex coincide con el rendimiento de GPT-5.2. Esto incluye tareas como:

Creación de presentaciones de diapositivas

Análisis de datos en hojas de cálculo

Gestión y organización de documentos

Investigación y síntesis

Ejemplo de desarrollo web

Para demostrar las capacidades del modelo, OpenAI le pidió a GPT-5.3-Codex que construyera dos juegos completos desde cero:

Un juego de carreras (versión 2 del juego de lanzamiento de la aplicación Codex)

Un juego de buceo

Usando solo una habilidad de "desarrollar juego web" y indicaciones de seguimiento genéricas como "arreglar el error" o "mejorar el juego", GPT-5.3-Codex iteró de forma autónoma sobre millones de tokens, construyendo juegos altamente funcionales y pulidos.

Mejor comprensión de la intención

En comparación con GPT-5.2-Codex, el nuevo modelo comprende mejor la intención del usuario al construir sitios web. Las indicaciones simples o poco especificadas ahora se dirigen por defecto a sitios con:

Más funcionalidad

Valores predeterminados sensatos

Características listas para producción

Por ejemplo, cuando se le pidió que construyera una página de destino de precios, GPT-5.3-Codex mostró automáticamente el plan anual como un precio mensual con descuento (haciendo que el descuento fuera claro) y creó un carrusel de testimonios de transición automática con tres citas de usuarios distintas, lo que resultó en un diseño más completo y pulido.

Colaboración interactiva

Una de las mejoras más significativas en la experiencia del usuario es la capacidad de dirigir el modelo mientras trabaja.

Interacción en tiempo real

En lugar de esperar una salida final, los usuarios ahora pueden:

Hacer preguntas durante la ejecución

Discutir diferentes enfoques

Dirigir hacia soluciones específicas

Proporcionar retroalimentación a mitad de la tarea

GPT-5.3-Codex explica lo que está haciendo, responde a los comentarios y mantiene a los usuarios informados de principio a fin. Esto se puede habilitar en la aplicación Codex a través de Configuración > General > Comportamiento de seguimiento.

Esto transforma la experiencia de dar órdenes a una máquina a colaborar con un compañero de equipo, un cambio fundamental en cómo los humanos interactúan con los sistemas de IA.

Capacidades y seguridad de ciberseguridad

GPT-5.3-Codex es el primer modelo que OpenAI clasifica como de "Alta capacidad" para tareas relacionadas con la ciberseguridad bajo su Marco de Preparación. También es el primer modelo entrenado directamente para identificar vulnerabilidades de software.

Naturaleza de doble uso

Debido a que la ciberseguridad es inherentemente de doble uso (útil tanto para la defensa como para el ataque), OpenAI está adoptando un enfoque de precaución:

Sin evidencia definitiva de que pueda automatizar los ataques cibernéticos de extremo a extremo

Implementando una pila integral de seguridad de ciberseguridad

Implementando capacitación en seguridad y monitoreo automatizado

Requerir acceso confiable para capacidades avanzadas

Acceso confiable para Cyber

OpenAI está lanzando Acceso confiable para Cyber, un programa piloto para:

Acelerar la investigación de defensa cibernética

Dar herramientas a los defensores primero

Apoyar la resiliencia del ecosistema

Compromiso de $10 millones

Basándose en un Programa de Subvenciones de Ciberseguridad de $1 millón de 2023, OpenAI está comprometiendo $10 millones en créditos de API para acelerar la defensa cibernética, especialmente para:

Software de código abierto

Sistemas de infraestructura crítica

Investigación de seguridad de buena fe

Agente de seguridad Aardvark

OpenAI está expandiendo la versión beta privada de Aardvark, su agente de investigación de seguridad, como la primera oferta en su suite de productos y herramientas de seguridad de Codex. También se están asociando con mantenedores de código abierto para proporcionar escaneo de código base gratuito para proyectos ampliamente utilizados como Next.js.

Cómo OpenAI usó Codex para construir Codex

El desarrollo de GPT-5.3-Codex proporciona un fascinante estudio de caso en la investigación acelerada por IA.

Casos de uso del equipo de investigación

El equipo de investigación utilizó versiones tempranas de GPT-5.3-Codex para:

Monitorear y depurar la ejecución del entrenamiento para el lanzamiento

Rastrear patrones a lo largo del curso del entrenamiento

Proporcionar un análisis profundo sobre la calidad de la interacción

Proponer soluciones y construir aplicaciones enriquecidas para investigadores humanos

Comprender con precisión cómo el comportamiento del modelo difería de los modelos anteriores

Casos de uso del equipo de ingeniería

El equipo de ingeniería utilizó Codex para:

Optimizar y adaptar el arnés para GPT-5.3-Codex

Identificar errores de renderizado de contexto que impactan a los usuarios

Encontrar la causa raíz de las bajas tasas de aciertos de caché

Escalar dinámicamente los clústeres de GPU para ajustarse a los aumentos de tráfico

Mantener la latencia estable durante el lanzamiento

Casos de uso de ciencia de datos

Durante las pruebas alfa, un científico de datos trabajó con GPT-5.3-Codex para:

Construir clasificadores regex para estimar la frecuencia de aclaraciones, respuestas de los usuarios y progreso de la tarea

Ejecutar estos clasificadores de forma escalable sobre todos los registros de sesión

Construir nuevas canalizaciones de datos y visualizar los resultados de forma más rica que las herramientas de panel estándar

Coanalizar los resultados, con Codex resumiendo las ideas clave sobre miles de puntos de datos en menos de tres minutos

Ganancias de productividad

¿El resultado? Las personas que construyen con Codex estaban más felices ya que el agente:

Entendía mejor su intención

Hacía más progreso por turno

Hacía menos preguntas aclaratorias

Disponibilidad y precios

Cómo acceder

GPT-5.3-Codex está disponible de inmediato para los usuarios pagos de ChatGPT en todas las superficies de Codex:

Aplicación de escritorio (macOS y Windows)

Interfaz de línea de comandos (CLI)

Extensiones IDE (VS Code, JetBrains, etc.)

Interfaz web

Planes de suscripción

Por tiempo limitado, los planes de pago recibirán el doble de los límites de velocidad normales.

Precios de la API

Al momento del lanzamiento, OpenAI no ha publicado los precios oficiales de la API para GPT-5.3-Codex. El acceso a la API se describe como "desplegándose pronto" y "en las siguientes semanas".

Como referencia, el precio actual de la API para el modelo anterior (GPT-5.2-Codex) es:

Infraestructura

GPT-5.3-Codex fue co-diseñado, entrenado y servido en sistemas NVIDIA GB200 NVL72, un testimonio de la estrecha colaboración entre OpenAI y NVIDIA para superar los límites de la capacidad de la IA.

Comparación con la competencia

El lanzamiento de GPT-5.3-Codex se produjo apenas minutos después del anuncio de Anthropic de Claude Opus 4.6, estableciendo una comparación inmediata entre los dos modelos.

Fortalezas de GPT-5.3-Codex

Terminal-Bench 2.0: 77.3 vs 65.4 de Opus 4.6 (ventaja de +18.6%)

Rendimiento 25% más rápido

Filosofía de diseño de "alta fiabilidad, baja varianza"

Capacidad de autoconstrucción (ayudó a crearse a sí mismo)

Primera clasificación de ciberseguridad de "Alta capacidad"

Fortalezas de Claude Opus 4.6

Ventana de contexto de 1 millón de tokens (significativamente más grande)

Funcionalidad colaborativa de Agent Teams

Versatilidad más amplia en escenarios de trabajo del conocimiento

Temperatura de creatividad más alta (más personalidad)

Diferencias en la filosofía de diseño

El panorama general

GPT-5.3-Codex representa más que una simple actualización incremental, es un cambio radical hacia agentes de propósito general que pueden razonar, construir y ejecutar en todo el espectro del trabajo técnico del mundo real.

De agente de código a agente de computadora

OpenAI enmarca explícitamente esta evolución: "Codex está pasando de escribir código a usarlo como una herramienta para operar una computadora y completar el trabajo de principio a fin".

Este es un cambio profundo. Lo que comenzó como un enfoque en ser "el mejor agente de codificación" se ha convertido en la base para un colaborador más general en la computadora, expandiendo tanto quién puede construir como lo que es posible con la IA.

Acelerando el desarrollo de la IA

El hecho de que GPT-5.3-Codex ayudó a construirse a sí mismo es una vista previa de lo que está por venir. Como señalan los investigadores de OpenAI, "muchos investigadores e ingenieros de OpenAI describen su trabajo hoy como fundamentalmente diferente de lo que era hace solo dos meses".

Esto sugiere que estamos entrando en un período de rendimientos acelerados en el desarrollo de la IA, donde cada generación de modelos ayuda a construir la siguiente, potencialmente comprimiendo los plazos de años a meses.

Implicaciones para los desarrolladores

Para los desarrolladores de software, las implicaciones son significativas:

Ciclos de desarrollo más rápidos - La IA maneja más del trabajo de rutina

Abstracción de nivel superior - Los desarrolladores pueden concentrarse en la arquitectura y el diseño

Colaboración interactiva - Menos como usar una herramienta, más como trabajar con un compañero de equipo

Nuevas capacidades - Las tareas que antes requerían conocimientos especializados ahora son accesibles

Implicaciones para las empresas

Para las empresas, GPT-5.3-Codex representa:

Mayor productividad - Se hace más trabajo en menos tiempo

Barreras más bajas - Se necesitan menos habilidades especializadas para ciertas tareas

Nuevas consideraciones de seguridad - La clasificación de ciberseguridad de "Alta capacidad" requiere una gobernanza cuidadosa

Ventaja competitiva - Adopción temprana de IA agentic poderosa

Conclusión

GPT-5.3-Codex es un logro histórico en la inteligencia artificial. Combina:

Rendimiento de codificación de última generación

Capacidades agentic avanzadas

Colaboración interactiva

Automejora (ayudó a construirse a sí mismo)

Uso de computadoras en el mundo real

El hecho de que fue fundamental en su propia creación sirve tanto como un logro técnico como una metáfora de hacia dónde se dirige la IA. A medida que los modelos se vuelven más capaces, no son solo herramientas que usamos, se están convirtiendo en socios en el proceso creativo y de desarrollo en sí.

El lanzamiento simultáneo con Claude Opus 4.6, con solo minutos de diferencia, subraya la intensidad de la competencia en el espacio de la IA. Pero lo que es más importante, señala que hemos entrado en una nueva fase de capacidad de la IA, una en la que los agentes pueden manejar de manera confiable tareas complejas y de largo alcance en todo el espectro del trabajo informático profesional.

Como dice OpenAI: "Lo que comenzó como un enfoque en ser el mejor agente de codificación se ha convertido en la base para un colaborador más general en la computadora".

La pregunta ahora no es solo lo que estos modelos pueden hacer, sino lo que elegiremos construir con ellos.

Fuentes

Presentamos GPT-5.3-Codex - Anuncio oficial de OpenAI

Tarjeta de sistema GPT-5.3-Codex - OpenAI

Precios, puntos de referencia y características de GPT 5.3 Codex explicados - eesel AI

OpenAI: El nuevo modelo de codificación GPT-5.3-Codex ayudó a construirse a sí mismo - Mashable

Con GPT-5.3-Codex, OpenAI presenta Codex para algo más que solo escribir código - Ars Technica

OpenAI lanza un nuevo modelo de codificación agentic solo minutos después de que Anthropic lanzara el suyo - TechCrunch

Opus 4.6 vs CODEX 5.3, primera comparación real - Reddit

GPT 5.3 Codex vs. Opus 4.6: La gran convergencia - Every

Precios de la plataforma OpenAI

Precios de Codex

Tabla de clasificación oficial de SWE-Bench

Descargo de responsabilidad: Este artículo se basa en la información disponible al 6 de febrero de 2026. Las especificaciones, los precios y la disponibilidad pueden cambiar. Consulte la documentación oficial de OpenAI para obtener la información más actualizada.

GPT-5.3-Codex: El modelo de codificación agentic más potente de OpenAI