Giriş

5 Şubat 2026'da OpenAI, şimdiye kadarki en gelişmiş agentic kodlama modeli olan GPT-5.3-Codex'i duyurdu. Bu sürüm, yapay zekada önemli bir kilometre taşıdır; sadece etkileyici teknik yetenekleri için değil, aynı zamanda kendini oluşturmada etkili olan ilk model olduğu için de önemlidir.

, bir kod yazma aracından, profesyonel bilişim görevlerinin tüm yelpazesinde uzun vadeli, gerçek dünya teknik işlerini halledebilen interaktif bir yapay zeka işbirlikçisine temel bir geçişi temsil ediyor.

'i Farklı Kılan Nedir?

Gerçek Bir Agentic Model

Sadece kod parçacıkları üreten geleneksel kodlama asistanlarının aksine, "agentic" bir model olarak tasarlanmıştır. Bu, şunları yapabileceği anlamına gelir:

Saatler, hatta günler süren uzun süreli görevlerde bağlamı koruyabilir

Komut satırı arayüzleri, dosya sistemleri ve geliştirme ortamları dahil olmak üzere araçları otonom olarak kullanabilir

Yerini kaybetmeden gerçek zamanlı geri bildirime göre uyum sağlayabilir ve yineleyebilir

Araştırma, planlama ve yürütme gerektiren karmaşık, çok adımlı iş akışlarını yönetebilir

Kendini İnşa Etme Başarısı

Belki de 'in en dikkat çekici yönü, Codex ekibinin modelin ilk sürümlerini şunları yapmak için kullanmasıdır:

Kendi eğitim sürecinde hata ayıklama

Kendi dağıtımını yönetme

Test sonuçlarını ve değerlendirmeleri teşhis etme

Nihai sürüm için altyapıyı optimize etme

Bu kendi kendine referanslı geliştirme döngüsü, yapay zekanın kendi gelişimini nasıl hızlandırmaya başladığını gösteriyor; OpenAI araştırmacılarının "Codex'in kendi gelişimini ne kadar hızlandırabildiğine hayran kaldık" şeklinde tanımladığı bir kilometre taşı.

Performans İyileştirmeleri

%25 daha hızlıdır, OpenAI'nin altyapısı ve çıkarım yığını iyileştirmeleri sayesinde, öncülü olan (GPT-5.2-Codex)'ten %25 daha hızlıdır. Bu hız iyileştirmesi, daha duyarlı gerçek zamanlı işbirliği ve daha hızlı yineleme döngüleri sağlar.

Kıyaslama Performansı: Veriler

, kodlama, agentic yetenekler ve gerçek dünya bilgisayar kullanımını ölçen çeşitli temel kıyaslamalarda son teknoloji performansı elde ediyor.

SWE-Bench Pro

SWE-Bench Pro, dört programlama dilini (Python, JavaScript, TypeScript ve Go) kapsayan gerçek dünya yazılım mühendisliğinin titiz bir değerlendirmesidir. Yalnızca Python'u test eden önceki sürümü (SWE-Bench Verified) aksine, SWE-Bench Pro, kirlenmeye karşı daha dirençli ve endüstriyle daha alakalı olacak şekilde tasarlanmıştır.

Terminal-Bench 2.0

Terminal-Bench 2.0'daki GPT-5.3-Codex özellikle önemlidir. Bu kıyaslama, bir kodlama aracısının ihtiyaç duyduğu terminal becerilerini (dosya sistemlerinde gezinme, komutları yürütme ve geliştirme iş akışlarını yönetme) ölçer. Özellikle, GPT-5.3-Codex bunu önceki tüm modellerden daha az token ile başararak daha verimli hale geliyor.

OSWorld-Verified

OSWorld-Verified'daki GPT-5.3-Codex, önemli ölçüde gelişmiş bilgisayar kullanım yeteneklerini gösteriyor. OSWorld, aracıların görsel bir masaüstü ortamında üretkenlik görevlerini tamamlaması gereken agentic bir bilgisayar kullanım kıyaslamasıdır. Bu büyük iyileşme, GPT-5.3-Codex'in gerçek dünya arayüzlerinde gezinmede önceki modellerden çok daha iyi olduğunu gösteriyor.

Kodun Ötesinde: Genel Amaçlı Bir Aracı

programlamada mükemmel olsa da, yetenekleri kod oluşturmanın çok ötesine uzanır. OpenAI, onu "geliştiricilerin ve profesyonellerin bir bilgisayarda yapabileceği neredeyse her şeyi" halledebilen bir aracı olarak konumlandırıyor.

Yazılım Yaşam Döngüsü Desteği

Model, tüm yazılım geliştirme yaşam döngüsünü desteklemek için oluşturulmuştur:

Hata Ayıklama - Hataları belirleme ve düzeltme

Dağıtım - Sürümleri ve altyapıyı yönetme

İzleme - Performansı ve metrikleri izleme

PRD'ler Yazma - Ürün gereksinimleri belgeleri

Metin Düzenleme - Belgeleme ve pazarlama metni

Kullanıcı Araştırması - Kullanıcı geri bildirimini analiz etme

Test Etme - Test paketleri yazma ve çalıştırma

Metrik Analizi - Veriye dayalı karar verme

Bilgi Çalışma Yetenekleri

GPT-5.3-Codex (OpenAI'nin 44 meslek genelinde bilgi işi görevlerindeki performansı ölçen 2025 değerlendirmesi) üzerinde, GPT-5.3-Codex, GPT-5.2'nin performansıyla eşleşiyor. Bu, aşağıdakiler gibi görevleri içerir:

Slayt desteleri ve sunumlar oluşturma

Elektronik tablolardaki verileri analiz etme

Belge yönetimi ve organizasyonu

Araştırma ve sentez

Web Geliştirme Örneği

Modelin yeteneklerini göstermek için OpenAI, 'ten sıfırdan iki eksiksiz oyun oluşturmasını istedi:

Bir yarış oyunu (Codex uygulama lansman oyununun 2. sürümü)

Bir dalış oyunu

Yalnızca bir "web oyunu geliştir" becerisi ve "hatayı düzelt" veya "oyunu geliştir" gibi genel takip istemleri kullanarak, otonom olarak milyonlarca token üzerinde yineleme yaparak son derece işlevsel, cilalı oyunlar oluşturdu.

Daha İyi Niyet Anlayışı

'e kıyasla, yeni model web siteleri oluştururken kullanıcı niyetini daha iyi anlıyor. Basit veya yetersiz belirtilmiş istemler artık aşağıdaki özelliklere sahip sitelere varsayılan olarak ayarlanır:

Daha fazla işlevsellik

Mantıklı varsayılanlar

Üretime hazır özellikler

Örneğin, bir fiyatlandırma açılış sayfası oluşturması istendiğinde, yıllık planı otomatik olarak indirimli bir aylık fiyat olarak görüntüledi (indirimi açıkça belirterek) ve üç farklı kullanıcı alıntısıyla otomatik olarak geçiş yapan bir referans karuseli oluşturdu; bu da daha eksiksiz ve cilalı bir tasarımla sonuçlandı.

İnteraktif İşbirliği

En önemli kullanıcı deneyimi iyileştirmelerinden biri, model çalışırken onu yönlendirme yeteneğidir.

Gerçek Zamanlı Etkileşim

Son bir çıktı beklemek yerine, kullanıcılar artık şunları yapabilir:

Yürütme sırasında sorular sorma

Farklı yaklaşımları tartışma

Belirli çözümlere yönlendirme

Görev ortasında geri bildirim sağlama

Ayarlar > Genel > Takip davranışı, ne yaptığını anlatır, geri bildirime yanıt verir ve kullanıcıları baştan sona döngüde tutar. Bu, Codex uygulamasında Ayarlar > Genel > Takip davranışı aracılığıyla etkinleştirilebilir.

Bu, deneyimi bir makineye komut vermekten bir takım arkadaşıyla işbirliği yapmaya dönüştürür; bu, insanların yapay zeka sistemleriyle nasıl etkileşim kurduğunda temel bir değişimdir.

Siber Güvenlik Yetenekleri ve Güvenliği

GPT-5.3-Codex, OpenAI'nin Hazırlık Çerçevesi kapsamında siber güvenlik ile ilgili görevler için "Yüksek yetenekli" olarak sınıflandırdığı ilk modeldir. Aynı zamanda, doğrudan yazılım açıklarını belirlemek için eğitilmiş ilk modeldir.

Çift Kullanımlı Doğa

Siber güvenlik doğası gereği çift kullanımlı (hem savunma hem de saldırı için yararlı) olduğundan, OpenAI ihtiyati bir yaklaşım benimsemektedir:

Uçtan uca siber saldırıları otomatikleştirebileceğine dair kesin bir kanıt yok

Kapsamlı bir siber güvenlik güvenlik yığını dağıtımı

Güvenlik eğitimi ve otomatik izleme uygulama

Gelişmiş yetenekler için güvenilir erişim gerektirme

Siber için Güvenilir Erişim

OpenAI, aşağıdakileri yapmak için Siber için Güvenilir Erişim adlı bir pilot program başlatıyor:

Siber savunma araştırmasını hızlandırma

Araçları önce savunmacılara ulaştırma

Ekosistem dayanıklılığını destekleme

10 Milyon Dolar Taahhüt

2023'ten itibaren 1 Milyon Dolarlık bir Siber Güvenlik Hibe Programı üzerine inşa eden OpenAI, özellikle aşağıdakiler için siber savunmayı hızlandırmak üzere 10 milyon dolarlık API kredisi taahhüt ediyor:

Açık kaynaklı yazılım

Kritik altyapı sistemleri

İyi niyetli güvenlik araştırması

Aardvark Güvenlik Aracısı

OpenAI, Codex Güvenlik ürünleri ve araçları paketindeki ilk teklifi olarak güvenlik araştırma aracısı Aardvark'ın özel beta sürümünü genişletiyor. Ayrıca, Next.js gibi yaygın olarak kullanılan projeler için ücretsiz kod tabanı taraması sağlamak üzere açık kaynaklı bakımcılarla ortaklık kuruyorlar.

OpenAI, Codex'i Codex'i Oluşturmak İçin Nasıl Kullandı?

'in geliştirilmesi, yapay zeka hızlandırmalı araştırmada büyüleyici bir vaka çalışması sunuyor.

Araştırma Ekibi Kullanım Durumları

Araştırma ekibi, 'in ilk sürümlerini şunları yapmak için kullandı:

Sürüm için eğitim çalıştırmasını izleme ve hata ayıklama

Eğitim boyunca kalıpları izleme

Etkileşim kalitesi hakkında derinlemesine analiz sağlama

Düzeltmeler önerme ve insan araştırmacılar için zengin uygulamalar oluşturma

Modelin davranışının önceki modellerden nasıl farklılaştığını tam olarak anlama

Mühendislik Ekibi Kullanım Durumları

Mühendislik ekibi, Codex'i şunları yapmak için kullandı:

GPT-5.3-Codex için donanımı optimize etme ve uyarlama

Kullanıcıları etkileyen içerik oluşturma hatalarını belirleme

Düşük önbellek isabet oranlarının temel nedenini bulma

Trafik artışlarına uyum sağlamak için GPU kümelerini dinamik olarak ölçeklendirme

Lansman sırasında gecikmeyi sabit tutma

Veri Bilimi Kullanım Durumları

Alfa testi sırasında, bir veri bilimcisi ile şunları yapmak için çalıştı:

Açıklamaların, kullanıcı yanıtlarının ve görev ilerlemesinin sıklığını tahmin etmek için regex sınıflandırıcıları oluşturma

Bu sınıflandırıcıları tüm oturum günlüklerinde ölçeklenebilir bir şekilde çalıştırma

Standart panolama araçlarından daha zengin bir şekilde yeni veri işlem hatları oluşturma ve sonuçları görselleştirme

Codex'in binlerce veri noktasındaki temel içgörüleri üç dakikadan kısa sürede özetlemesiyle sonuçları birlikte analiz etme

Verimlilik Kazanımları

Sonuç mu? İnsanlar aracı olarak Codex ile inşa etmekten daha mutluydu:

Niyetlerini daha iyi anlıyordu

Her dönüşte daha fazla ilerleme kaydediyordu

Daha az açıklayıcı soru soruyordu

Kullanılabilirlik ve Fiyatlandırma

Nasıl Erişilir

hemen kullanılabilir, tüm Codex yüzeylerinde ücretli ChatGPT kullanıcıları için hemen kullanılabilir:

Masaüstü uygulaması (macOS ve Windows)

Komut satırı arayüzü (CLI)

IDE uzantıları (VS Code, JetBrains, vb.)

Web arayüzü

Abonelik Planları

Sınırlı bir süre için, ücretli planlar normal oran sınırlarının iki katını alacaktır.

API Fiyatlandırması

Lansman itibarıyla, OpenAI, GPT-5.3-Codex için resmi API fiyatlandırması yayınlamadı. API erişimi "yakında kullanıma sunulacak" ve "önümüzdeki haftalarda gelecek" olarak tanımlanıyor.

Referans olarak, önceki modelin (GPT-5.2-Codex) mevcut API fiyatlandırması şöyledir:

Altyapı

NVIDIA GB200 NVL72 sistemleri, OpenAI ve NVIDIA arasındaki yapay zeka yeteneğinin sınırlarını zorlamadaki yakın işbirliğinin bir kanıtı olarak, NVIDIA GB200 NVL72 sistemleri için ortak olarak tasarlandı, onlarla eğitildi ve üzerinde hizmet verildi.

Rakiplerle Karşılaştırma

Claude Opus 4.6'in piyasaya sürülmesi, Anthropic'in Claude Opus 4.6 duyurusundan sadece dakikalar sonra gerçekleşti ve iki model arasında anında bir karşılaştırma yapıldı.

'in Güçlü Yönleri

Terminal-Bench 2.0: 77,3'e karşı Opus 4.6'nın 65,4'ü (+%18,6 avantaj)

%25 daha hızlı performans

"Yüksek güvenilirlik, düşük varyans" tasarım felsefesi

Kendini inşa etme yeteneği (kendini oluşturmaya yardımcı oldu)

İlk "Yüksek yetenekli" siber güvenlik sınıflandırması

Claude Opus 4.6'nın Güçlü Yönleri

1 milyon token bağlam penceresi (önemli ölçüde daha büyük)

Aracı Ekipleri işbirlikçi işlevsellik

Bilgi işi senaryolarında daha geniş çok yönlülük

Daha yüksek yaratıcılık sıcaklığı (daha fazla kişilik)

Tasarım Felsefesi Farklılıkları

Daha Büyük Resim

akıl yürütebilen, inşa edebilen ve yürütebilen genel amaçlı aracılara, yalnızca artan bir yükseltmeden daha fazlasını temsil ediyor; gerçek dünya teknik işlerinin tüm yelpazesinde akıl yürütebilen, inşa edebilen ve yürütebilen genel amaçlı aracılara doğru bir adım değişikliğidir.

Kod Aracısından Bilgisayar Aracısına

OpenAI bu evrimi açıkça çerçeveliyor: "Codex, kod yazmanın ötesine geçerek bir bilgisayarı çalıştırmak ve işi uçtan uca tamamlamak için bir araç olarak kullanmaya doğru ilerliyor."

Bu derin bir değişimdir. "En iyi kodlama aracısı" olmaya odaklanarak başlayan şey, bilgisayarda daha genel bir işbirlikçi için temel haline geldi; hem kimin inşa edebileceğini hem de yapay zeka ile neyin mümkün olduğunu genişletti.

Yapay Zeka Gelişimini Hızlandırma

'in kendisini inşa etmesine yardımcı olması, gelecek olanın bir önizlemesidir. OpenAI araştırmacılarının belirttiği gibi, "OpenAI'deki birçok araştırmacı ve mühendis bugün işlerinin sadece iki ay öncesine göre temelde farklı olduğunu belirtiyor".

Bu, yapay zeka gelişiminde her model neslinin bir sonraki modeli oluşturmaya yardımcı olduğu hızlanan getiriler dönemine girdiğimizi ve potansiyel olarak zaman çizelgelerini yıllardan aylara sıkıştırdığımızı gösteriyor.

Geliştiriciler İçin Etkileri

Yazılım geliştiriciler için etkileri önemlidir:

Daha hızlı geliştirme döngüleri - Yapay zeka rutin işlerin daha fazlasını halleder

Daha yüksek düzeyde soyutlama - Geliştiriciler mimari ve tasarıma odaklanabilir

İnteraktif işbirliği - Bir araç kullanmak gibi değil, bir takım arkadaşıyla çalışmak gibi

Yeni yetenekler - Daha önce uzmanlık bilgisi gerektiren görevlere artık erişilebilir

İşletmeler İçin Etkileri

İşletmeler için şunları temsil ediyor:

Artan üretkenlik - Daha fazla iş daha kısa sürede yapılır

Daha düşük engeller - Belirli görevler için daha az uzmanlık becerisi gerekir

Yeni güvenlik hususları - "Yüksek yetenekli" siber güvenlik sınıflandırması dikkatli yönetim gerektirir

Rekabet avantajı - Güçlü agentic yapay zekanın erken benimsenmesi

Sonuç

, yapay zekada bir dönüm noktasıdır. Şunları birleştirir:

Son teknoloji kodlama performansı

Gelişmiş agentic yetenekler

İnteraktif işbirliği

Kendini geliştirme (kendini oluşturmaya yardımcı oldu)

Gerçek dünya bilgisayar kullanımı

Kendi yaratımında etkili olması, hem teknik bir başarı hem de yapay zekanın nereye gittiğine dair bir metafor görevi görüyor. Modeller daha yetenekli hale geldikçe, sadece kullandığımız araçlar değil, yaratıcı ve geliştirme sürecinde ortaklar haline geliyorlar.

Claude Opus 4.6 ile aynı anda, sadece dakikalar arayla piyasaya sürülmesi, yapay zeka alanındaki rekabetin yoğunluğunun altını çiziyor. Ancak daha da önemlisi, yapay zeka yeteneğinin yeni bir aşamasına girdiğimizin sinyalini veriyor; burada aracılar, profesyonel bilgisayar işinin tüm yelpazesinde karmaşık, uzun vadeli görevleri güvenilir bir şekilde halledebilir.

OpenAI'nin dediği gibi: "En iyi kodlama aracısı olmaya odaklanarak başlayan şey, bilgisayarda daha genel bir işbirlikçi için temel haline geldi."

Şimdi soru, bu modellerin neler yapabileceği değil, onlarla ne inşa etmeyi seçeceğimizdir.

Kaynaklar

GPT-5.3-Codex Tanıtımı - OpenAI Resmi Duyurusu

GPT-5.3-Codex Sistem Kartı - OpenAI

GPT 5.3 Codex fiyatlandırması, kıyaslamaları ve özellikleri açıklandı - eesel AI

OpenAI: Yeni kodlama modeli GPT-5.3-Codex kendini oluşturmaya yardımcı oldu - Mashable

GPT-5.3-Codex ile OpenAI, Codex'i sadece kod yazmaktan daha fazlası için sunuyor - Ars Technica

OpenAI, Anthropic kendi modelini yayınladıktan sadece dakikalar sonra yeni agentic kodlama modelini piyasaya sürdü - TechCrunch

Opus 4.6 - CODEX 5.3 karşılaştırması - Reddit

GPT 5.3 Codex - Opus 4.6 karşılaştırması: Büyük Yakınsama - Every

OpenAI Platform Fiyatlandırması

Codex Fiyatlandırması

SWE-Bench Resmi Lider Tablosu

Sorumluluk reddi: Bu makale, 6 Şubat 2026 itibarıyla mevcut olan bilgilere dayanmaktadır. Teknik özellikler, fiyatlandırma ve kullanılabilirlik değişebilir. En güncel bilgiler için lütfen resmi OpenAI belgelerine bakın.

GPT-5.3-Codex: OpenAI'ın En Yetenekli Otonom Kodlama Modeli