Giriş
5 Şubat 2026'da OpenAI, şimdiye kadarki en gelişmiş agentic kodlama modeli olan GPT-5.3-Codex'i duyurdu. Bu sürüm, yapay zekada önemli bir kilometre taşıdır; sadece etkileyici teknik yetenekleri için değil, aynı zamanda kendini oluşturmada etkili olan ilk model olduğu için de önemlidir.
, bir kod yazma aracından, profesyonel bilişim görevlerinin tüm yelpazesinde uzun vadeli, gerçek dünya teknik işlerini halledebilen interaktif bir yapay zeka işbirlikçisine temel bir geçişi temsil ediyor.
'i Farklı Kılan Nedir?
Gerçek Bir Agentic Model
Sadece kod parçacıkları üreten geleneksel kodlama asistanlarının aksine, "agentic" bir model olarak tasarlanmıştır. Bu, şunları yapabileceği anlamına gelir:
- Saatler, hatta günler süren uzun süreli görevlerde bağlamı koruyabilir
- Komut satırı arayüzleri, dosya sistemleri ve geliştirme ortamları dahil olmak üzere araçları otonom olarak kullanabilir
- Yerini kaybetmeden gerçek zamanlı geri bildirime göre uyum sağlayabilir ve yineleyebilir
- Araştırma, planlama ve yürütme gerektiren karmaşık, çok adımlı iş akışlarını yönetebilir
Kendini İnşa Etme Başarısı
Belki de 'in en dikkat çekici yönü, Codex ekibinin modelin ilk sürümlerini şunları yapmak için kullanmasıdır:
- Kendi eğitim sürecinde hata ayıklama
- Test sonuçlarını ve değerlendirmeleri teşhis etme
- Nihai sürüm için altyapıyı optimize etme
Bu kendi kendine referanslı geliştirme döngüsü, yapay zekanın kendi gelişimini nasıl hızlandırmaya başladığını gösteriyor; OpenAI araştırmacılarının "Codex'in kendi gelişimini ne kadar hızlandırabildiğine hayran kaldık" şeklinde tanımladığı bir kilometre taşı.
Performans İyileştirmeleri
%25 daha hızlıdır, OpenAI'nin altyapısı ve çıkarım yığını iyileştirmeleri sayesinde, öncülü olan (GPT-5.2-Codex)'ten %25 daha hızlıdır. Bu hız iyileştirmesi, daha duyarlı gerçek zamanlı işbirliği ve daha hızlı yineleme döngüleri sağlar.
Kıyaslama Performansı: Veriler
, kodlama, agentic yetenekler ve gerçek dünya bilgisayar kullanımını ölçen çeşitli temel kıyaslamalarda son teknoloji performansı elde ediyor.
SWE-Bench Pro
SWE-Bench Pro, dört programlama dilini (Python, JavaScript, TypeScript ve Go) kapsayan gerçek dünya yazılım mühendisliğinin titiz bir değerlendirmesidir. Yalnızca Python'u test eden önceki sürümü (SWE-Bench Verified) aksine, SWE-Bench Pro, kirlenmeye karşı daha dirençli ve endüstriyle daha alakalı olacak şekilde tasarlanmıştır.
Terminal-Bench 2.0
Terminal-Bench 2.0'daki GPT-5.3-Codex özellikle önemlidir. Bu kıyaslama, bir kodlama aracısının ihtiyaç duyduğu terminal becerilerini (dosya sistemlerinde gezinme, komutları yürütme ve geliştirme iş akışlarını yönetme) ölçer. Özellikle, GPT-5.3-Codex bunu önceki tüm modellerden daha az token ile başararak daha verimli hale geliyor.
OSWorld-Verified
OSWorld-Verified'daki GPT-5.3-Codex, önemli ölçüde gelişmiş bilgisayar kullanım yeteneklerini gösteriyor. OSWorld, aracıların görsel bir masaüstü ortamında üretkenlik görevlerini tamamlaması gereken agentic bir bilgisayar kullanım kıyaslamasıdır. Bu büyük iyileşme, GPT-5.3-Codex'in gerçek dünya arayüzlerinde gezinmede önceki modellerden çok daha iyi olduğunu gösteriyor.
Kodun Ötesinde: Genel Amaçlı Bir Aracı
programlamada mükemmel olsa da, yetenekleri kod oluşturmanın çok ötesine uzanır. OpenAI, onu "geliştiricilerin ve profesyonellerin bir bilgisayarda yapabileceği neredeyse her şeyi" halledebilen bir aracı olarak konumlandırıyor.
Yazılım Yaşam Döngüsü Desteği
Model, tüm yazılım geliştirme yaşam döngüsünü desteklemek için oluşturulmuştur:
- Hata Ayıklama - Hataları belirleme ve düzeltme
- Dağıtım - Sürümleri ve altyapıyı yönetme
- İzleme - Performansı ve metrikleri izleme
- PRD'ler Yazma - Ürün gereksinimleri belgeleri
- Metin Düzenleme - Belgeleme ve pazarlama metni
- Kullanıcı Araştırması - Kullanıcı geri bildirimini analiz etme
- Test Etme - Test paketleri yazma ve çalıştırma
- Metrik Analizi - Veriye dayalı karar verme
Bilgi Çalışma Yetenekleri
GPT-5.3-Codex (OpenAI'nin 44 meslek genelinde bilgi işi görevlerindeki performansı ölçen 2025 değerlendirmesi) üzerinde, GPT-5.3-Codex, GPT-5.2'nin performansıyla eşleşiyor. Bu, aşağıdakiler gibi görevleri içerir:
- Slayt desteleri ve sunumlar oluşturma
- Elektronik tablolardaki verileri analiz etme
- Belge yönetimi ve organizasyonu
Web Geliştirme Örneği
Modelin yeteneklerini göstermek için OpenAI, 'ten sıfırdan iki eksiksiz oyun oluşturmasını istedi:
- Bir yarış oyunu (Codex uygulama lansman oyununun 2. sürümü)
Yalnızca bir "web oyunu geliştir" becerisi ve "hatayı düzelt" veya "oyunu geliştir" gibi genel takip istemleri kullanarak, otonom olarak milyonlarca token üzerinde yineleme yaparak son derece işlevsel, cilalı oyunlar oluşturdu.
Daha İyi Niyet Anlayışı
'e kıyasla, yeni model web siteleri oluştururken kullanıcı niyetini daha iyi anlıyor. Basit veya yetersiz belirtilmiş istemler artık aşağıdaki özelliklere sahip sitelere varsayılan olarak ayarlanır:
Örneğin, bir fiyatlandırma açılış sayfası oluşturması istendiğinde, yıllık planı otomatik olarak indirimli bir aylık fiyat olarak görüntüledi (indirimi açıkça belirterek) ve üç farklı kullanıcı alıntısıyla otomatik olarak geçiş yapan bir referans karuseli oluşturdu; bu da daha eksiksiz ve cilalı bir tasarımla sonuçlandı.
İnteraktif İşbirliği
En önemli kullanıcı deneyimi iyileştirmelerinden biri, model çalışırken onu yönlendirme yeteneğidir.
Gerçek Zamanlı Etkileşim
Son bir çıktı beklemek yerine, kullanıcılar artık şunları yapabilir:
- Yürütme sırasında sorular sorma
- Farklı yaklaşımları tartışma
- Belirli çözümlere yönlendirme
- Görev ortasında geri bildirim sağlama
Ayarlar > Genel > Takip davranışı, ne yaptığını anlatır, geri bildirime yanıt verir ve kullanıcıları baştan sona döngüde tutar. Bu, Codex uygulamasında Ayarlar > Genel > Takip davranışı aracılığıyla etkinleştirilebilir.
Bu, deneyimi bir makineye komut vermekten bir takım arkadaşıyla işbirliği yapmaya dönüştürür; bu, insanların yapay zeka sistemleriyle nasıl etkileşim kurduğunda temel bir değişimdir.
Siber Güvenlik Yetenekleri ve Güvenliği
GPT-5.3-Codex, OpenAI'nin Hazırlık Çerçevesi kapsamında siber güvenlik ile ilgili görevler için "Yüksek yetenekli" olarak sınıflandırdığı ilk modeldir. Aynı zamanda, doğrudan yazılım açıklarını belirlemek için eğitilmiş ilk modeldir.
Çift Kullanımlı Doğa
Siber güvenlik doğası gereği çift kullanımlı (hem savunma hem de saldırı için yararlı) olduğundan, OpenAI ihtiyati bir yaklaşım benimsemektedir:
- Uçtan uca siber saldırıları otomatikleştirebileceğine dair kesin bir kanıt yok
- Kapsamlı bir siber güvenlik güvenlik yığını dağıtımı
- Güvenlik eğitimi ve otomatik izleme uygulama
- Gelişmiş yetenekler için güvenilir erişim gerektirme
Siber için Güvenilir Erişim
OpenAI, aşağıdakileri yapmak için Siber için Güvenilir Erişim adlı bir pilot program başlatıyor:
- Siber savunma araştırmasını hızlandırma
- Araçları önce savunmacılara ulaştırma
- Ekosistem dayanıklılığını destekleme
10 Milyon Dolar Taahhüt
2023'ten itibaren 1 Milyon Dolarlık bir Siber Güvenlik Hibe Programı üzerine inşa eden OpenAI, özellikle aşağıdakiler için siber savunmayı hızlandırmak üzere 10 milyon dolarlık API kredisi taahhüt ediyor:
- Kritik altyapı sistemleri
- İyi niyetli güvenlik araştırması
Aardvark Güvenlik Aracısı
OpenAI, Codex Güvenlik ürünleri ve araçları paketindeki ilk teklifi olarak güvenlik araştırma aracısı Aardvark'ın özel beta sürümünü genişletiyor. Ayrıca, Next.js gibi yaygın olarak kullanılan projeler için ücretsiz kod tabanı taraması sağlamak üzere açık kaynaklı bakımcılarla ortaklık kuruyorlar.
OpenAI, Codex'i Codex'i Oluşturmak İçin Nasıl Kullandı?
'in geliştirilmesi, yapay zeka hızlandırmalı araştırmada büyüleyici bir vaka çalışması sunuyor.
Araştırma Ekibi Kullanım Durumları
Araştırma ekibi, 'in ilk sürümlerini şunları yapmak için kullandı:
- Sürüm için eğitim çalıştırmasını izleme ve hata ayıklama
- Eğitim boyunca kalıpları izleme
- Etkileşim kalitesi hakkında derinlemesine analiz sağlama
- Düzeltmeler önerme ve insan araştırmacılar için zengin uygulamalar oluşturma
- Modelin davranışının önceki modellerden nasıl farklılaştığını tam olarak anlama
Mühendislik Ekibi Kullanım Durumları
Mühendislik ekibi, Codex'i şunları yapmak için kullandı:
- GPT-5.3-Codex için donanımı optimize etme ve uyarlama
- Kullanıcıları etkileyen içerik oluşturma hatalarını belirleme
- Düşük önbellek isabet oranlarının temel nedenini bulma
- Trafik artışlarına uyum sağlamak için GPU kümelerini dinamik olarak ölçeklendirme
- Lansman sırasında gecikmeyi sabit tutma
Veri Bilimi Kullanım Durumları
Alfa testi sırasında, bir veri bilimcisi ile şunları yapmak için çalıştı:
- Açıklamaların, kullanıcı yanıtlarının ve görev ilerlemesinin sıklığını tahmin etmek için regex sınıflandırıcıları oluşturma
- Bu sınıflandırıcıları tüm oturum günlüklerinde ölçeklenebilir bir şekilde çalıştırma
- Standart panolama araçlarından daha zengin bir şekilde yeni veri işlem hatları oluşturma ve sonuçları görselleştirme
- Codex'in binlerce veri noktasındaki temel içgörüleri üç dakikadan kısa sürede özetlemesiyle sonuçları birlikte analiz etme
Verimlilik Kazanımları
Sonuç mu? İnsanlar aracı olarak Codex ile inşa etmekten daha mutluydu:
- Niyetlerini daha iyi anlıyordu
- Her dönüşte daha fazla ilerleme kaydediyordu
- Daha az açıklayıcı soru soruyordu
Kullanılabilirlik ve Fiyatlandırma
Nasıl Erişilir
hemen kullanılabilir, tüm Codex yüzeylerinde ücretli ChatGPT kullanıcıları için hemen kullanılabilir:
- Masaüstü uygulaması (macOS ve Windows)
- Komut satırı arayüzü (CLI)
- IDE uzantıları (VS Code, JetBrains, vb.)
Abonelik Planları
Sınırlı bir süre için, ücretli planlar normal oran sınırlarının iki katını alacaktır.
API Fiyatlandırması
Lansman itibarıyla, OpenAI, GPT-5.3-Codex için resmi API fiyatlandırması yayınlamadı. API erişimi "yakında kullanıma sunulacak" ve "önümüzdeki haftalarda gelecek" olarak tanımlanıyor.
Referans olarak, önceki modelin (GPT-5.2-Codex) mevcut API fiyatlandırması şöyledir:
Altyapı
NVIDIA GB200 NVL72 sistemleri, OpenAI ve NVIDIA arasındaki yapay zeka yeteneğinin sınırlarını zorlamadaki yakın işbirliğinin bir kanıtı olarak, NVIDIA GB200 NVL72 sistemleri için ortak olarak tasarlandı, onlarla eğitildi ve üzerinde hizmet verildi.
Rakiplerle Karşılaştırma
Claude Opus 4.6'in piyasaya sürülmesi, Anthropic'in Claude Opus 4.6 duyurusundan sadece dakikalar sonra gerçekleşti ve iki model arasında anında bir karşılaştırma yapıldı.
'in Güçlü Yönleri
- Terminal-Bench 2.0: 77,3'e karşı Opus 4.6'nın 65,4'ü (+%18,6 avantaj)
- %25 daha hızlı performans
- "Yüksek güvenilirlik, düşük varyans" tasarım felsefesi
- Kendini inşa etme yeteneği (kendini oluşturmaya yardımcı oldu)
- İlk "Yüksek yetenekli" siber güvenlik sınıflandırması
Claude Opus 4.6'nın Güçlü Yönleri
- 1 milyon token bağlam penceresi (önemli ölçüde daha büyük)
- Aracı Ekipleri işbirlikçi işlevsellik
- Bilgi işi senaryolarında daha geniş çok yönlülük
- Daha yüksek yaratıcılık sıcaklığı (daha fazla kişilik)
Tasarım Felsefesi Farklılıkları
Daha Büyük Resim
akıl yürütebilen, inşa edebilen ve yürütebilen genel amaçlı aracılara, yalnızca artan bir yükseltmeden daha fazlasını temsil ediyor; gerçek dünya teknik işlerinin tüm yelpazesinde akıl yürütebilen, inşa edebilen ve yürütebilen genel amaçlı aracılara doğru bir adım değişikliğidir.
Kod Aracısından Bilgisayar Aracısına
OpenAI bu evrimi açıkça çerçeveliyor: "Codex, kod yazmanın ötesine geçerek bir bilgisayarı çalıştırmak ve işi uçtan uca tamamlamak için bir araç olarak kullanmaya doğru ilerliyor."
Bu derin bir değişimdir. "En iyi kodlama aracısı" olmaya odaklanarak başlayan şey, bilgisayarda daha genel bir işbirlikçi için temel haline geldi; hem kimin inşa edebileceğini hem de yapay zeka ile neyin mümkün olduğunu genişletti.
Yapay Zeka Gelişimini Hızlandırma
'in kendisini inşa etmesine yardımcı olması, gelecek olanın bir önizlemesidir. OpenAI araştırmacılarının belirttiği gibi, "OpenAI'deki birçok araştırmacı ve mühendis bugün işlerinin sadece iki ay öncesine göre temelde farklı olduğunu belirtiyor".
Bu, yapay zeka gelişiminde her model neslinin bir sonraki modeli oluşturmaya yardımcı olduğu hızlanan getiriler dönemine girdiğimizi ve potansiyel olarak zaman çizelgelerini yıllardan aylara sıkıştırdığımızı gösteriyor.
Geliştiriciler İçin Etkileri
Yazılım geliştiriciler için etkileri önemlidir:
- Daha hızlı geliştirme döngüleri - Yapay zeka rutin işlerin daha fazlasını halleder
- Daha yüksek düzeyde soyutlama - Geliştiriciler mimari ve tasarıma odaklanabilir
- İnteraktif işbirliği - Bir araç kullanmak gibi değil, bir takım arkadaşıyla çalışmak gibi
- Yeni yetenekler - Daha önce uzmanlık bilgisi gerektiren görevlere artık erişilebilir
İşletmeler İçin Etkileri
İşletmeler için şunları temsil ediyor:
- Artan üretkenlik - Daha fazla iş daha kısa sürede yapılır
- Daha düşük engeller - Belirli görevler için daha az uzmanlık becerisi gerekir
- Yeni güvenlik hususları - "Yüksek yetenekli" siber güvenlik sınıflandırması dikkatli yönetim gerektirir
- Rekabet avantajı - Güçlü agentic yapay zekanın erken benimsenmesi
Sonuç
, yapay zekada bir dönüm noktasıdır. Şunları birleştirir:
- Son teknoloji kodlama performansı
- Gelişmiş agentic yetenekler
- Kendini geliştirme (kendini oluşturmaya yardımcı oldu)
- Gerçek dünya bilgisayar kullanımı
Kendi yaratımında etkili olması, hem teknik bir başarı hem de yapay zekanın nereye gittiğine dair bir metafor görevi görüyor. Modeller daha yetenekli hale geldikçe, sadece kullandığımız araçlar değil, yaratıcı ve geliştirme sürecinde ortaklar haline geliyorlar.
Claude Opus 4.6 ile aynı anda, sadece dakikalar arayla piyasaya sürülmesi, yapay zeka alanındaki rekabetin yoğunluğunun altını çiziyor. Ancak daha da önemlisi, yapay zeka yeteneğinin yeni bir aşamasına girdiğimizin sinyalini veriyor; burada aracılar, profesyonel bilgisayar işinin tüm yelpazesinde karmaşık, uzun vadeli görevleri güvenilir bir şekilde halledebilir.
OpenAI'nin dediği gibi: "En iyi kodlama aracısı olmaya odaklanarak başlayan şey, bilgisayarda daha genel bir işbirlikçi için temel haline geldi."
Şimdi soru, bu modellerin neler yapabileceği değil, onlarla ne inşa etmeyi seçeceğimizdir.
Kaynaklar
Sorumluluk reddi: Bu makale, 6 Şubat 2026 itibarıyla mevcut olan bilgilere dayanmaktadır. Teknik özellikler, fiyatlandırma ve kullanılabilirlik değişebilir. En güncel bilgiler için lütfen resmi OpenAI belgelerine bakın.