परिचय

5 फ़रवरी, 2026 को, OpenAI ने GPT-5.3-Codex की घोषणा की, जो अब तक का सबसे उन्नत एजेंटिक कोडिंग मॉडल है। यह रिलीज़ कृत्रिम बुद्धिमत्ता में एक महत्वपूर्ण मील का पत्थर है—न केवल इसकी प्रभावशाली तकनीकी क्षमताओं के लिए, बल्कि इसलिए भी क्योंकि यह पहला मॉडल है जो स्वयं को बनाने में सहायक था।

एक कोड-लेखन उपकरण से एक इंटरैक्टिव AI सहयोगी में एक मौलिक बदलाव का प्रतिनिधित्व करता है जो पेशेवर कंप्यूटिंग कार्यों के पूरे स्पेक्ट्रम में लंबी अवधि के, वास्तविक दुनिया के तकनीकी कार्य को संभालने में सक्षम है।

को क्या अलग बनाता है?

एक सच्चा एजेंटिक मॉडल

पारंपरिक कोडिंग सहायकों के विपरीत जो केवल कोड स्निपेट उत्पन्न करते हैं, को एक "एजेंटिक" मॉडल के रूप में डिज़ाइन किया गया है। इसका मतलब है कि यह कर सकता है:

संदर्भ बनाए रखें लंबे समय तक चलने वाले कार्यों पर जो घंटों या दिनों तक भी फैले हों

स्वायत्त रूप से उपकरणों का उपयोग करें, जिसमें कमांड-लाइन इंटरफेस, फ़ाइल सिस्टम और विकास वातावरण शामिल हैं

अनुकूलन और पुनरावृति करें वास्तविक समय की प्रतिक्रिया के आधार पर अपनी जगह खोए बिना

जटिल बहु-चरणीय वर्कफ़्लो को संभालें जिसके लिए अनुसंधान, योजना और निष्पादन की आवश्यकता होती है

स्वयं-निर्माण उपलब्धि

शायद का सबसे उल्लेखनीय पहलू यह है कि Codex टीम ने मॉडल के शुरुआती संस्करणों का उपयोग निम्न के लिए किया:

अपनी प्रशिक्षण प्रक्रिया को डिबग करें

अपने स्वयं के परिनियोजन का प्रबंधन करें

परीक्षण परिणामों और मूल्यांकनों का निदान करें

अंतिम रिलीज़ के लिए बुनियादी ढांचे को अनुकूलित करें

यह स्व-संदर्भित विकास चक्र दर्शाता है कि AI अपने स्वयं के सुधार को कैसे तेज करना शुरू कर रहा है—एक मील का पत्थर जिसे OpenAI के शोधकर्ताओं ने उन्हें "यह देखकर दंग रह जाना बताया कि Codex अपने स्वयं के विकास को कितनी तेजी से बढ़ाने में सक्षम था।"

प्रदर्शन में सुधार

25% तेज अपने पूर्ववर्ती (GPT-5.2-Codex) की तुलना में 25% तेज है, OpenAI के बुनियादी ढांचे और अनुमान स्टैक में सुधार के लिए धन्यवाद। यह गति सुधार अधिक उत्तरदायी वास्तविक समय सहयोग और तेज़ पुनरावृत्ति चक्रों को सक्षम बनाता है।

बेंचमार्क प्रदर्शन: डेटा

कई प्रमुख बेंचमार्क में अत्याधुनिक प्रदर्शन प्राप्त करता है जो कोडिंग, एजेंटिक क्षमताओं और वास्तविक दुनिया के कंप्यूटर उपयोग को मापते हैं।

SWE-Bench Pro

SWE-Bench Pro वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग का एक कठोर मूल्यांकन है जो चार प्रोग्रामिंग भाषाओं (Python, JavaScript, TypeScript और Go) में फैला है। अपने पूर्ववर्ती (SWE-Bench Verified) के विपरीत, जिसने केवल Python का परीक्षण किया, SWE-Bench Pro को अधिक संदूषण-प्रतिरोधी और उद्योग-प्रासंगिक बनाने के लिए डिज़ाइन किया गया है।

टर्मिनल-बेंच 2.0

टर्मिनल-बेंच 2.0 पर GPT-5.3-Codex विशेष रूप से महत्वपूर्ण है। यह बेंचमार्क टर्मिनल कौशल को मापता है जिसकी एक कोडिंग एजेंट को आवश्यकता होती है—फ़ाइल सिस्टम को नेविगेट करना, कमांड निष्पादित करना और विकास वर्कफ़्लो का प्रबंधन करना। विशेष रूप से, GPT-5.3-Codex इसे किसी भी पूर्व मॉडल की तुलना में कम टोकन के साथ प्राप्त करता है, जिससे यह अधिक कुशल हो जाता है।

OSWorld-Verified

OSWorld-Verified पर GPT-5.3-Codex नाटकीय रूप से बेहतर कंप्यूटर-उपयोग क्षमताओं को दर्शाती है। OSWorld एक एजेंटिक कंप्यूटर-उपयोग बेंचमार्क है जहां एजेंटों को एक दृश्य डेस्कटॉप वातावरण में उत्पादकता कार्यों को पूरा करना होता है। यह भारी सुधार दर्शाता है कि GPT-5.3-Codex पिछले मॉडलों की तुलना में वास्तविक दुनिया के इंटरफेस को नेविगेट करने में कहीं बेहतर है।

कोड से परे: एक सामान्य-उद्देश्यीय एजेंट

जबकि प्रोग्रामिंग में उत्कृष्ट है, इसकी क्षमताएं कोड पीढ़ी से कहीं आगे तक फैली हुई हैं। OpenAI इसे एक ऐसे एजेंट के रूप में रखता है जो "लगभग वह सब कुछ कर सकता है जो डेवलपर और पेशेवर कंप्यूटर पर कर सकते हैं।"

सॉफ्टवेयर जीवनचक्र समर्थन

मॉडल पूरे सॉफ्टवेयर विकास जीवनचक्र का समर्थन करने के लिए बनाया गया है:

डिबगिंग - बग की पहचान करना और ठीक करना

परिनियोजन - रिलीज़ और बुनियादी ढांचे का प्रबंधन

निगरानी - प्रदर्शन और मेट्रिक्स को ट्रैक करना

PRD लिखना - उत्पाद आवश्यकता दस्तावेज़

प्रतिलिपि संपादित करना - प्रलेखन और विपणन पाठ

उपयोगकर्ता अनुसंधान - उपयोगकर्ता प्रतिक्रिया का विश्लेषण करना

परीक्षण - परीक्षण सूट लिखना और चलाना

मेट्रिक्स विश्लेषण - डेटा-संचालित निर्णय लेना

ज्ञान कार्य क्षमताएं

GPT-5.3-Codex (OpenAI का 2025 का मूल्यांकन जो 44 व्यवसायों में ज्ञान-कार्य कार्यों पर प्रदर्शन को मापता है) पर, GPT-5.3-Codex GPT-5.2 के प्रदर्शन से मेल खाता है। इसमें जैसे कार्य शामिल हैं:

स्लाइड डेक और प्रस्तुतियां बनाना

स्प्रेडशीट में डेटा का विश्लेषण करना

दस्तावेज़ प्रबंधन और संगठन

अनुसंधान और संश्लेषण

वेब विकास उदाहरण

मॉडल की क्षमताओं को प्रदर्शित करने के लिए, OpenAI ने को शुरू से ही दो पूर्ण गेम बनाने के लिए कहा:

एक रेसिंग गेम (Codex ऐप लॉन्च गेम का संस्करण 2)

एक डाइविंग गेम

केवल एक "वेब गेम विकसित करें" कौशल और "बग ठीक करें" या "गेम को बेहतर बनाएं" जैसे सामान्य अनुवर्ती संकेतों का उपयोग करके, ने लाखों टोकन पर स्वायत्त रूप से पुनरावृति की, जिससे अत्यधिक कार्यात्मक, पॉलिश गेम का निर्माण हुआ।

बेहतर इरादे को समझना

की तुलना में, नया मॉडल वेबसाइट बनाते समय उपयोगकर्ता के इरादे को बेहतर ढंग से समझता है। सरल या अपर्याप्त रूप से निर्दिष्ट संकेत अब साइटों के लिए डिफ़ॉल्ट हैं:

अधिक कार्यक्षमता

समझदार डिफ़ॉल्ट

उत्पादन-तैयार सुविधाएँ

उदाहरण के लिए, जब एक मूल्य निर्धारण लैंडिंग पृष्ठ बनाने के लिए कहा गया, तो ने स्वचालित रूप से वार्षिक योजना को छूट वाली मासिक कीमत के रूप में प्रदर्शित किया (छूट को स्पष्ट करते हुए) और तीन अलग-अलग उपयोगकर्ता उद्धरणों के साथ एक स्वचालित रूप से संक्रमणकारी प्रशंसापत्र कैरोसेल बनाया—जिसके परिणामस्वरूप अधिक पूर्ण और पॉलिश डिज़ाइन हुआ।

इंटरैक्टिव सहयोग

सबसे महत्वपूर्ण उपयोगकर्ता अनुभव सुधारों में से एक मॉडल को काम करते समय मार्गदर्शन करने की क्षमता है।

वास्तविक समय की बातचीत

अंतिम आउटपुट की प्रतीक्षा करने के बजाय, उपयोगकर्ता अब यह कर सकते हैं:

निष्पादन के दौरान प्रश्न पूछें

विभिन्न दृष्टिकोणों पर चर्चा करें

विशिष्ट समाधानों की ओर मार्गदर्शन करें

मध्य-कार्य प्रतिक्रिया प्रदान करें

सेटिंग्स > सामान्य > अनुवर्ती व्यवहार बताता है कि यह क्या कर रहा है, प्रतिक्रिया का जवाब देता है और उपयोगकर्ताओं को शुरू से अंत तक लूप में रखता है। इसे सेटिंग्स > सामान्य > अनुवर्ती व्यवहार के माध्यम से Codex ऐप में सक्षम किया जा सकता है।

यह अनुभव को मशीन को कमांड देने से बदलकर एक टीम के साथी के साथ सहयोग करने में बदल देता है—यह इस बात में एक मौलिक बदलाव है कि मनुष्य AI सिस्टम के साथ कैसे इंटरैक्ट करते हैं।

साइबर सुरक्षा क्षमताएं और सुरक्षा

पहला मॉडल है जिसे OpenAI अपनी तत्परता फ्रेमवर्क के तहत साइबर सुरक्षा से संबंधित कार्यों के लिए "उच्च क्षमता" के रूप में वर्गीकृत करता है पहला मॉडल है जिसे OpenAI अपनी तत्परता फ्रेमवर्क के तहत साइबर सुरक्षा से संबंधित कार्यों के लिए "उच्च क्षमता" के रूप में वर्गीकृत करता है। यह सॉफ्टवेयर कमजोरियों की पहचान करने के लिए सीधे प्रशिक्षित किया गया पहला मॉडल भी है।

दोहरे उपयोग की प्रकृति

क्योंकि साइबर सुरक्षा स्वाभाविक रूप से दोहरे उपयोग वाली है (रक्षा और अपराध दोनों के लिए उपयोगी), OpenAI एक निवारक दृष्टिकोण अपना रहा है:

कोई निश्चित प्रमाण नहीं कि यह साइबर हमलों को शुरू से अंत तक स्वचालित कर सकता है

व्यापक साइबर सुरक्षा सुरक्षा स्टैक का परिनियोजन

सुरक्षा प्रशिक्षण और स्वचालित निगरानी का कार्यान्वयन

उन्नत क्षमताओं के लिए विश्वसनीय पहुंच की आवश्यकता

साइबर के लिए विश्वसनीय पहुंच

OpenAI साइबर के लिए विश्वसनीय पहुंच लॉन्च कर रहा है, एक पायलट कार्यक्रम:

साइबर रक्षा अनुसंधान को तेज करें

सबसे पहले बचावकर्ताओं को उपकरण प्राप्त कराएं

पारिस्थितिकी तंत्र लचीलापन का समर्थन करें

$10M प्रतिबद्धता

2023 से $1M साइबर सुरक्षा अनुदान कार्यक्रम पर निर्माण करते हुए, OpenAI साइबर रक्षा को गति देने के लिए $10 मिलियन API क्रेडिट देने के लिए प्रतिबद्ध है, खासकर:

ओपन सोर्स सॉफ्टवेयर

महत्वपूर्ण बुनियादी ढांचा प्रणाली

सद्भावना सुरक्षा अनुसंधान

आर्डवार्क सुरक्षा एजेंट

OpenAI आर्डवार्क के निजी बीटा का विस्तार कर रहा है, जो Codex सुरक्षा उत्पादों और उपकरणों के अपने सूट में पहली पेशकश है, जो इसकी सुरक्षा अनुसंधान एजेंट है। वे व्यापक रूप से उपयोग की जाने वाली परियोजनाओं जैसे Next.js के लिए मुफ्त कोडबेस स्कैनिंग प्रदान करने के लिए ओपन-सोर्स अनुरक्षकों के साथ भी साझेदारी कर रहे हैं।

OpenAI ने Codex का उपयोग करके Codex का निर्माण कैसे किया

का विकास AI-त्वरित अनुसंधान में एक आकर्षक केस स्टडी प्रदान करता है।

अनुसंधान टीम उपयोग के मामले

अनुसंधान टीम ने के शुरुआती संस्करणों का उपयोग निम्न के लिए किया:

निगरानी और डिबग रिलीज़ के लिए प्रशिक्षण रन

पैटर्न ट्रैक करें प्रशिक्षण के दौरान

गहरा विश्लेषण प्रदान करें बातचीत की गुणवत्ता पर

सुझाव ठीक करें और मानव शोधकर्ताओं के लिए समृद्ध अनुप्रयोग बनाएं

ठीक से समझें कि मॉडल का व्यवहार पिछले मॉडलों से कैसे अलग था

इंजीनियरिंग टीम उपयोग के मामले

इंजीनियरिंग टीम ने Codex का उपयोग निम्न के लिए किया:

अनुकूलित और अनुकूलित करें GPT-5.3-Codex के लिए हार्नेस

संदर्भ प्रतिपादन बग की पहचान करें उपयोगकर्ताओं को प्रभावित करना

कम कैश हिट दरों का मूल कारण

GPU क्लस्टर को गतिशील रूप से स्केल करें ट्रैफिक बढ़ने के लिए समायोजित करने के लिए

लॉन्च के दौरान विलंबता को स्थिर रखें

डेटा विज्ञान उपयोग के मामले

अल्फा परीक्षण के दौरान, एक डेटा वैज्ञानिक ने के साथ काम किया:

स्पष्टीकरण, उपयोगकर्ता प्रतिक्रियाओं और कार्य प्रगति की आवृत्ति का अनुमान लगाने के लिए Regex वर्गीकरणकर्ता बनाएं

इन वर्गीकरणकर्ताओं को सभी सत्र लॉग पर स्केलेबल रूप से चलाएं

नए डेटा पाइपलाइन बनाएं और मानक डैशबोर्डिंग टूल की तुलना में परिणामों को अधिक समृद्ध रूप से विज़ुअलाइज़ करें

परिणामों का सह-विश्लेषण करें, Codex तीन मिनट से कम समय में हजारों डेटा बिंदुओं पर प्रमुख अंतर्दृष्टि का सारांश देता है

उत्पादकता लाभ

परिणाम? Codex के साथ निर्माण करने वाले लोग खुश थे क्योंकि एजेंट:

उनके इरादे को बेहतर ढंग से समझा

प्रति बारी में अधिक प्रगति की

कम स्पष्टीकरण प्रश्न पूछे

उपलब्धता और मूल्य निर्धारण

कैसे एक्सेस करें

तत्काल उपलब्ध है सभी Codex सतहों पर सशुल्क ChatGPT उपयोगकर्ताओं के लिए तत्काल उपलब्ध है:

डेस्कटॉप ऐप (macOS और Windows)

कमांड-लाइन इंटरफेस (CLI)

IDE एक्सटेंशन (VS Code, JetBrains, आदि)

वेब इंटरफेस

सदस्यता योजनाएं

सीमित समय के लिए, सशुल्क योजनाओं को सामान्य दर सीमाओं से दोगुना प्राप्त होगा।

API मूल्य निर्धारण

लॉन्च के अनुसार, OpenAI ने <a2>GPT-5.3-Codex के लिए आधिकारिक API मूल्य निर्धारण जारी नहीं किया है</a2>। API एक्सेस को "जल्द ही रोल आउट" और "निम्नलिखित सप्ताहों में आ रहा है" के रूप में वर्णित किया गया है।

संदर्भ के लिए, पिछले मॉडल (GPT-5.2-Codex) के लिए वर्तमान API मूल्य निर्धारण है:

बुनियादी ढांचा

GPT-5.3-Codex को AI क्षमता की सीमाओं को आगे बढ़ाने में OpenAI और NVIDIA के बीच घनिष्ठ सहयोग के प्रमाण के रूप में NVIDIA GB200 NVL72 सिस्टम</a2> पर सह-डिज़ाइन, प्रशिक्षित और परोसा गया था।

प्रतियोगियों के साथ तुलना

Claude Opus 4.6 की रिलीज़ Anthropic द्वारा Claude Opus 4.6 की घोषणा के कुछ मिनट बाद हुई, जिससे दोनों मॉडलों के बीच तत्काल तुलना स्थापित हुई।

ताकत

टर्मिनल-बेंच 2.0: 77.3 बनाम Opus 4.6 का 65.4 (+18.6% लाभ)

25% तेज़ प्रदर्शन

"उच्च विश्वसनीयता, कम विचरण" डिजाइन दर्शन

स्वयं-निर्माण क्षमता (स्वयं को बनाने में मदद की)

पहला "उच्च क्षमता" साइबर सुरक्षा वर्गीकरण

Claude Opus 4.6 ताकत

1 मिलियन टोकन संदर्भ विंडो (काफी बड़ा)

एजेंट टीम सहयोगात्मक कार्यक्षमता

व्यापक बहुमुखी प्रतिभा ज्ञान कार्य परिदृश्यों में

उच्च रचनात्मकता तापमान (अधिक व्यक्तित्व)

डिजाइन दर्शन अंतर

बड़ी तस्वीर

सामान्य-उद्देश्यीय एजेंटों की ओर एक कदम परिवर्तन है जो तर्क कर सकते हैं, निर्माण कर सकते हैं और निष्पादित कर सकते हैं सिर्फ एक वृद्धिशील उन्नयन से कहीं अधिक का प्रतिनिधित्व करता है—यह वास्तविक दुनिया के तकनीकी कार्य के पूरे स्पेक्ट्रम में सामान्य-उद्देश्यीय एजेंटों की ओर एक कदम परिवर्तन है जो तर्क कर सकते हैं, निर्माण कर सकते हैं और निष्पादित कर सकते हैं।

कोड एजेंट से कंप्यूटर एजेंट तक

OpenAI स्पष्ट रूप से इस विकास को तैयार करता है: "Codex कोड लिखने से आगे बढ़कर कंप्यूटर को संचालित करने और काम को अंत तक पूरा करने के लिए एक उपकरण के रूप में उपयोग करने की ओर बढ़ रहा है।"

यह एक गहरा बदलाव है। "सर्वश्रेष्ठ कोडिंग एजेंट" होने पर जो ध्यान केंद्रित करना शुरू हुआ, वह कंप्यूटर पर अधिक सामान्य सहयोगी के लिए आधार बन गया है—दोनों का विस्तार जो बना सकते हैं और AI के साथ क्या संभव है।

AI विकास को गति देना

तथ्य यह है कि ने स्वयं को बनाने में मदद की, वह आने वाले समय का पूर्वावलोकन है। जैसा कि OpenAI के शोधकर्ता बताते हैं, "OpenAI के कई शोधकर्ता और इंजीनियर आज अपनी नौकरी को मौलिक रूप से अलग बताते हैं कि यह सिर्फ दो महीने पहले क्या थी।"

यह सुझाव देता है कि हम AI विकास में तेजी से बढ़ते रिटर्न की अवधि में प्रवेश कर रहे हैं, जहां मॉडलों की प्रत्येक पीढ़ी अगली पीढ़ी के निर्माण में मदद करती है—संभावित रूप से समयसीमा को वर्षों से महीनों तक संपीड़ित करती है।

डेवलपर्स के लिए निहितार्थ

सॉफ्टवेयर डेवलपर्स के लिए, निहितार्थ महत्वपूर्ण हैं:

तेज़ विकास चक्र - AI अधिक नियमित काम को संभालता है

उच्च-स्तरीय अमूर्तता - डेवलपर आर्किटेक्चर और डिज़ाइन पर ध्यान केंद्रित कर सकते हैं

इंटरैक्टिव सहयोग - एक उपकरण का उपयोग करने जैसा कम, एक टीम के साथी के साथ काम करने जैसा अधिक

नई क्षमताएं - ऐसे कार्य जिनके लिए पहले विशिष्ट ज्ञान की आवश्यकता होती थी, अब सुलभ हैं

व्यवसायों के लिए निहितार्थ

व्यवसायों के लिए, का प्रतिनिधित्व करता है:

बढ़ी हुई उत्पादकता - कम समय में अधिक काम हो जाता है

कम बाधाएं - कुछ कार्यों के लिए कम विशिष्ट कौशल की आवश्यकता होती है

नई सुरक्षा संबंधी विचार - "उच्च क्षमता" साइबर सुरक्षा वर्गीकरण के लिए सावधानीपूर्वक शासन की आवश्यकता होती है

प्रतिस्पर्धी लाभ - शक्तिशाली एजेंटिक AI का शीघ्र अपनाना

निष्कर्ष

कृत्रिम बुद्धिमत्ता में एक ऐतिहासिक उपलब्धि है। यह जोड़ती है:

अत्याधुनिक कोडिंग प्रदर्शन

उन्नत एजेंटिक क्षमताएं

इंटरैक्टिव सहयोग

स्व-सुधार (इसने स्वयं को बनाने में मदद की)

वास्तविक दुनिया का कंप्यूटर उपयोग

तथ्य यह है कि यह अपने स्वयं के निर्माण में सहायक था, एक तकनीकी उपलब्धि और एक रूपक दोनों के रूप में कार्य करता है कि AI कहां जा रहा है। जैसे-जैसे मॉडल अधिक सक्षम होते जाते हैं, वे केवल ऐसे उपकरण नहीं हैं जिनका हम उपयोग करते हैं—वे रचनात्मक और विकास प्रक्रिया में स्वयं भागीदार बनते जा रहे हैं।

क्लाउड ओपस 4.6 के साथ एक साथ रिलीज़, सिर्फ कुछ मिनटों की दूरी पर, AI क्षेत्र में प्रतिस्पर्धा की तीव्रता को रेखांकित करता है। लेकिन इससे भी महत्वपूर्ण बात यह है कि यह संकेत देता है कि हमने AI क्षमता के एक नए चरण में प्रवेश कर लिया है—एक ऐसा चरण जहां एजेंट पेशेवर कंप्यूटर कार्य के पूरे स्पेक्ट्रम में जटिल, लंबी अवधि के कार्यों को मज़बूती से संभाल सकते हैं।

जैसा कि OpenAI कहता है: "सर्वश्रेष्ठ कोडिंग एजेंट होने पर जो ध्यान केंद्रित करना शुरू हुआ, वह कंप्यूटर पर अधिक सामान्य सहयोगी के लिए आधार बन गया है।"

अब सवाल यह नहीं है कि ये मॉडल क्या कर सकते हैं—यह सवाल है कि हम उनके साथ क्या बनाने का विकल्प चुनेंगे।

स्रोत

Introducing GPT-5.3-Codex - OpenAI Official Announcement

GPT-5.3-Codex System Card - OpenAI

GPT 5.3 Codex pricing, benchmarks, and features explained - eesel AI

OpenAI: New coding model GPT-5.3-Codex helped build itself - Mashable

With GPT-5.3-Codex, OpenAI pitches Codex for more than just writing code - Ars Technica

OpenAI launches new agentic coding model only minutes after Anthropic drops its own - TechCrunch

Opus 4.6 vs CODEX 5.3, first real comparison - Reddit

GPT 5.3 Codex vs. Opus 4.6: The Great Convergence - Every

OpenAI Platform Pricing

Codex Pricing

SWE-Bench Official Leaderboard

अस्वीकरण: यह लेख 6 फरवरी, 2026 तक उपलब्ध जानकारी पर आधारित है। विशिष्टताओं, मूल्य निर्धारण और उपलब्धता में परिवर्तन हो सकता है। सबसे वर्तमान जानकारी के लिए कृपया आधिकारिक OpenAI प्रलेखन देखें।

GPT-5.3-Codex: OpenAI का सबसे सक्षम एजेंटिक कोडिंग मॉडल