Introducción
El 5 de febrero de 2026, OpenAI anunció GPT-5.3-Codex, su modelo de codificación agentic más avanzado hasta la fecha. Este lanzamiento marca un hito significativo en la inteligencia artificial, no solo por sus impresionantes capacidades técnicas, sino también porque es el primer modelo que fue fundamental en su propia creación.
GPT-5.3-Codex representa un cambio fundamental de una herramienta de escritura de código a un colaborador de IA interactivo capaz de manejar trabajo técnico del mundo real y a largo plazo en todo el espectro de tareas informáticas profesionales.
¿Qué diferencia a GPT-5.3-Codex?
Un verdadero modelo Agentic
A diferencia de los asistentes de codificación tradicionales que simplemente generan fragmentos de código, GPT-5.3-Codex está diseñado como un modelo "agentic". Esto significa que puede:
- Mantener el contexto durante tareas de larga duración que se extienden por horas o incluso días
- Usar herramientas de forma autónoma, incluyendo interfaces de línea de comandos, sistemas de archivos y entornos de desarrollo
- Adaptarse e iterar basándose en la retroalimentación en tiempo real sin perder su posición
- Manejar flujos de trabajo complejos de varios pasos que requieren investigación, planificación y ejecución
Logro de autoconstrucción
Quizás el aspecto más notable de GPT-5.3-Codex es que el equipo de Codex utilizó versiones tempranas del modelo para:
- Depurar su propio proceso de entrenamiento
- Gestionar su propio despliegue
- Diagnosticar los resultados de las pruebas y las evaluaciones
- Optimizar la infraestructura para la versión final
Este ciclo de desarrollo autorreferencial demuestra cómo la IA está comenzando a acelerar su propia mejora, un hito que los investigadores de OpenAI describieron como dejarlos "impresionados por cuánto Codex fue capaz de acelerar su propio desarrollo".
Mejoras de rendimiento
GPT-5.3-Codex es 25% más rápido que su predecesor (GPT-5.2-Codex), gracias a las mejoras en la infraestructura y la pila de inferencia de OpenAI. Esta mejora de velocidad permite una colaboración en tiempo real más receptiva y ciclos de iteración más rápidos.
Rendimiento de referencia: Los datos
GPT-5.3-Codex logra un rendimiento de última generación en varios puntos de referencia clave que miden la codificación, las capacidades agentic y el uso de computadoras en el mundo real.
SWE-Bench Pro
SWE-Bench Pro es una evaluación rigurosa de la ingeniería de software del mundo real que abarca cuatro lenguajes de programación (Python, JavaScript, TypeScript y Go). A diferencia de su predecesor (SWE-Bench Verified) que solo probó Python, SWE-Bench Pro está diseñado para ser más resistente a la contaminación y relevante para la industria.
Terminal-Bench 2.0
La mejora del 13.3% en Terminal-Bench 2.0 es particularmente significativa. Este punto de referencia mide las habilidades de terminal que necesita un agente de codificación: navegar por los sistemas de archivos, ejecutar comandos y administrar flujos de trabajo de desarrollo. Notablemente, GPT-5.3-Codex logra esto con menos tokens que cualquier modelo anterior, lo que lo hace más eficiente.
OSWorld-Verified
El salto del 26.5% en OSWorld-Verified demuestra capacidades de uso de computadora dramáticamente mejoradas. OSWorld es un punto de referencia de uso de computadora agentic donde los agentes deben completar tareas de productividad en un entorno de escritorio visual. Esta mejora masiva muestra que GPT-5.3-Codex es mucho mejor para navegar por interfaces del mundo real que los modelos anteriores.
Más allá del código: un agente de propósito general
Si bien GPT-5.3-Codex sobresale en la programación, sus capacidades se extienden mucho más allá de la generación de código. OpenAI lo posiciona como un agente que puede manejar "casi cualquier cosa que los desarrolladores y profesionales puedan hacer en una computadora".
Soporte del ciclo de vida del software
El modelo está construido para soportar todo el ciclo de vida del desarrollo de software:
- Depuración - Identificación y corrección de errores
- Despliegue - Gestión de lanzamientos e infraestructura
- Monitoreo - Seguimiento del rendimiento y las métricas
- Escritura de PRDs - Documentos de requisitos del producto
- Edición de textos - Documentación y texto de marketing
- Investigación de usuarios - Análisis de los comentarios de los usuarios
- Pruebas - Escritura y ejecución de suites de pruebas
- Análisis de métricas - Toma de decisiones basada en datos
Capacidades de trabajo del conocimiento
En GDPval (la evaluación de OpenAI de 2025 que mide el rendimiento en tareas de trabajo del conocimiento en 44 ocupaciones), GPT-5.3-Codex coincide con el rendimiento de GPT-5.2. Esto incluye tareas como:
- Creación de presentaciones de diapositivas
- Análisis de datos en hojas de cálculo
- Gestión y organización de documentos
Ejemplo de desarrollo web
Para demostrar las capacidades del modelo, OpenAI le pidió a GPT-5.3-Codex que construyera dos juegos completos desde cero:
- Un juego de carreras (versión 2 del juego de lanzamiento de la aplicación Codex)
Usando solo una habilidad de "desarrollar juego web" y indicaciones de seguimiento genéricas como "arreglar el error" o "mejorar el juego", GPT-5.3-Codex iteró de forma autónoma sobre millones de tokens, construyendo juegos altamente funcionales y pulidos.
Mejor comprensión de la intención
En comparación con GPT-5.2-Codex, el nuevo modelo comprende mejor la intención del usuario al construir sitios web. Las indicaciones simples o poco especificadas ahora se dirigen por defecto a sitios con:
- Valores predeterminados sensatos
- Características listas para producción
Por ejemplo, cuando se le pidió que construyera una página de destino de precios, GPT-5.3-Codex mostró automáticamente el plan anual como un precio mensual con descuento (haciendo que el descuento fuera claro) y creó un carrusel de testimonios de transición automática con tres citas de usuarios distintas, lo que resultó en un diseño más completo y pulido.
Colaboración interactiva
Una de las mejoras más significativas en la experiencia del usuario es la capacidad de dirigir el modelo mientras trabaja.
Interacción en tiempo real
En lugar de esperar una salida final, los usuarios ahora pueden:
- Hacer preguntas durante la ejecución
- Discutir diferentes enfoques
- Dirigir hacia soluciones específicas
- Proporcionar retroalimentación a mitad de la tarea
GPT-5.3-Codex explica lo que está haciendo, responde a los comentarios y mantiene a los usuarios informados de principio a fin. Esto se puede habilitar en la aplicación Codex a través de Configuración > General > Comportamiento de seguimiento.
Esto transforma la experiencia de dar órdenes a una máquina a colaborar con un compañero de equipo, un cambio fundamental en cómo los humanos interactúan con los sistemas de IA.
Capacidades y seguridad de ciberseguridad
GPT-5.3-Codex es el primer modelo que OpenAI clasifica como de "Alta capacidad" para tareas relacionadas con la ciberseguridad bajo su Marco de Preparación. También es el primer modelo entrenado directamente para identificar vulnerabilidades de software.
Naturaleza de doble uso
Debido a que la ciberseguridad es inherentemente de doble uso (útil tanto para la defensa como para el ataque), OpenAI está adoptando un enfoque de precaución:
- Sin evidencia definitiva de que pueda automatizar los ataques cibernéticos de extremo a extremo
- Implementando una pila integral de seguridad de ciberseguridad
- Implementando capacitación en seguridad y monitoreo automatizado
- Requerir acceso confiable para capacidades avanzadas
Acceso confiable para Cyber
OpenAI está lanzando Acceso confiable para Cyber, un programa piloto para:
- Acelerar la investigación de defensa cibernética
- Dar herramientas a los defensores primero
- Apoyar la resiliencia del ecosistema
Compromiso de $10 millones
Basándose en un Programa de Subvenciones de Ciberseguridad de $1 millón de 2023, OpenAI está comprometiendo $10 millones en créditos de API para acelerar la defensa cibernética, especialmente para:
- Software de código abierto
- Sistemas de infraestructura crítica
- Investigación de seguridad de buena fe
Agente de seguridad Aardvark
OpenAI está expandiendo la versión beta privada de Aardvark, su agente de investigación de seguridad, como la primera oferta en su suite de productos y herramientas de seguridad de Codex. También se están asociando con mantenedores de código abierto para proporcionar escaneo de código base gratuito para proyectos ampliamente utilizados como Next.js.
Cómo OpenAI usó Codex para construir Codex
El desarrollo de GPT-5.3-Codex proporciona un fascinante estudio de caso en la investigación acelerada por IA.
Casos de uso del equipo de investigación
El equipo de investigación utilizó versiones tempranas de GPT-5.3-Codex para:
- Monitorear y depurar la ejecución del entrenamiento para el lanzamiento
- Rastrear patrones a lo largo del curso del entrenamiento
- Proporcionar un análisis profundo sobre la calidad de la interacción
- Proponer soluciones y construir aplicaciones enriquecidas para investigadores humanos
- Comprender con precisión cómo el comportamiento del modelo difería de los modelos anteriores
Casos de uso del equipo de ingeniería
El equipo de ingeniería utilizó Codex para:
- Optimizar y adaptar el arnés para GPT-5.3-Codex
- Identificar errores de renderizado de contexto que impactan a los usuarios
- Encontrar la causa raíz de las bajas tasas de aciertos de caché
- Escalar dinámicamente los clústeres de GPU para ajustarse a los aumentos de tráfico
- Mantener la latencia estable durante el lanzamiento
Casos de uso de ciencia de datos
Durante las pruebas alfa, un científico de datos trabajó con GPT-5.3-Codex para:
- Construir clasificadores regex para estimar la frecuencia de aclaraciones, respuestas de los usuarios y progreso de la tarea
- Ejecutar estos clasificadores de forma escalable sobre todos los registros de sesión
- Construir nuevas canalizaciones de datos y visualizar los resultados de forma más rica que las herramientas de panel estándar
- Coanalizar los resultados, con Codex resumiendo las ideas clave sobre miles de puntos de datos en menos de tres minutos
Ganancias de productividad
¿El resultado? Las personas que construyen con Codex estaban más felices ya que el agente:
- Entendía mejor su intención
- Hacía más progreso por turno
- Hacía menos preguntas aclaratorias
Disponibilidad y precios
Cómo acceder
GPT-5.3-Codex está disponible de inmediato para los usuarios pagos de ChatGPT en todas las superficies de Codex:
- Aplicación de escritorio (macOS y Windows)
- Interfaz de línea de comandos (CLI)
- Extensiones IDE (VS Code, JetBrains, etc.)
Planes de suscripción
Por tiempo limitado, los planes de pago recibirán el doble de los límites de velocidad normales.
Precios de la API
Al momento del lanzamiento, OpenAI no ha publicado los precios oficiales de la API para GPT-5.3-Codex. El acceso a la API se describe como "desplegándose pronto" y "en las siguientes semanas".
Como referencia, el precio actual de la API para el modelo anterior (GPT-5.2-Codex) es:
Infraestructura
GPT-5.3-Codex fue co-diseñado, entrenado y servido en sistemas NVIDIA GB200 NVL72, un testimonio de la estrecha colaboración entre OpenAI y NVIDIA para superar los límites de la capacidad de la IA.
Comparación con la competencia
El lanzamiento de GPT-5.3-Codex se produjo apenas minutos después del anuncio de Anthropic de Claude Opus 4.6, estableciendo una comparación inmediata entre los dos modelos.
Fortalezas de GPT-5.3-Codex
- Terminal-Bench 2.0: 77.3 vs 65.4 de Opus 4.6 (ventaja de +18.6%)
- Rendimiento 25% más rápido
- Filosofía de diseño de "alta fiabilidad, baja varianza"
- Capacidad de autoconstrucción (ayudó a crearse a sí mismo)
- Primera clasificación de ciberseguridad de "Alta capacidad"
Fortalezas de Claude Opus 4.6
- Ventana de contexto de 1 millón de tokens (significativamente más grande)
- Funcionalidad colaborativa de Agent Teams
- Versatilidad más amplia en escenarios de trabajo del conocimiento
- Temperatura de creatividad más alta (más personalidad)
Diferencias en la filosofía de diseño
El panorama general
GPT-5.3-Codex representa más que una simple actualización incremental, es un cambio radical hacia agentes de propósito general que pueden razonar, construir y ejecutar en todo el espectro del trabajo técnico del mundo real.
De agente de código a agente de computadora
OpenAI enmarca explícitamente esta evolución: "Codex está pasando de escribir código a usarlo como una herramienta para operar una computadora y completar el trabajo de principio a fin".
Este es un cambio profundo. Lo que comenzó como un enfoque en ser "el mejor agente de codificación" se ha convertido en la base para un colaborador más general en la computadora, expandiendo tanto quién puede construir como lo que es posible con la IA.
Acelerando el desarrollo de la IA
El hecho de que GPT-5.3-Codex ayudó a construirse a sí mismo es una vista previa de lo que está por venir. Como señalan los investigadores de OpenAI, "muchos investigadores e ingenieros de OpenAI describen su trabajo hoy como fundamentalmente diferente de lo que era hace solo dos meses".
Esto sugiere que estamos entrando en un período de rendimientos acelerados en el desarrollo de la IA, donde cada generación de modelos ayuda a construir la siguiente, potencialmente comprimiendo los plazos de años a meses.
Implicaciones para los desarrolladores
Para los desarrolladores de software, las implicaciones son significativas:
- Ciclos de desarrollo más rápidos - La IA maneja más del trabajo de rutina
- Abstracción de nivel superior - Los desarrolladores pueden concentrarse en la arquitectura y el diseño
- Colaboración interactiva - Menos como usar una herramienta, más como trabajar con un compañero de equipo
- Nuevas capacidades - Las tareas que antes requerían conocimientos especializados ahora son accesibles
Implicaciones para las empresas
Para las empresas, GPT-5.3-Codex representa:
- Mayor productividad - Se hace más trabajo en menos tiempo
- Barreras más bajas - Se necesitan menos habilidades especializadas para ciertas tareas
- Nuevas consideraciones de seguridad - La clasificación de ciberseguridad de "Alta capacidad" requiere una gobernanza cuidadosa
- Ventaja competitiva - Adopción temprana de IA agentic poderosa
Conclusión
GPT-5.3-Codex es un logro histórico en la inteligencia artificial. Combina:
- Rendimiento de codificación de última generación
- Capacidades agentic avanzadas
- Automejora (ayudó a construirse a sí mismo)
- Uso de computadoras en el mundo real
El hecho de que fue fundamental en su propia creación sirve tanto como un logro técnico como una metáfora de hacia dónde se dirige la IA. A medida que los modelos se vuelven más capaces, no son solo herramientas que usamos, se están convirtiendo en socios en el proceso creativo y de desarrollo en sí.
El lanzamiento simultáneo con Claude Opus 4.6, con solo minutos de diferencia, subraya la intensidad de la competencia en el espacio de la IA. Pero lo que es más importante, señala que hemos entrado en una nueva fase de capacidad de la IA, una en la que los agentes pueden manejar de manera confiable tareas complejas y de largo alcance en todo el espectro del trabajo informático profesional.
Como dice OpenAI: "Lo que comenzó como un enfoque en ser el mejor agente de codificación se ha convertido en la base para un colaborador más general en la computadora".
La pregunta ahora no es solo lo que estos modelos pueden hacer, sino lo que elegiremos construir con ellos.
Fuentes
Descargo de responsabilidad: Este artículo se basa en la información disponible al 6 de febrero de 2026. Las especificaciones, los precios y la disponibilidad pueden cambiar. Consulte la documentación oficial de OpenAI para obtener la información más actualizada.