परिचय
5 फ़रवरी, 2026 को, OpenAI ने GPT-5.3-Codex की घोषणा की, जो अब तक का सबसे उन्नत एजेंटिक कोडिंग मॉडल है। यह रिलीज़ कृत्रिम बुद्धिमत्ता में एक महत्वपूर्ण मील का पत्थर है—न केवल इसकी प्रभावशाली तकनीकी क्षमताओं के लिए, बल्कि इसलिए भी क्योंकि यह पहला मॉडल है जो स्वयं को बनाने में सहायक था।
एक कोड-लेखन उपकरण से एक इंटरैक्टिव AI सहयोगी में एक मौलिक बदलाव का प्रतिनिधित्व करता है जो पेशेवर कंप्यूटिंग कार्यों के पूरे स्पेक्ट्रम में लंबी अवधि के, वास्तविक दुनिया के तकनीकी कार्य को संभालने में सक्षम है।
को क्या अलग बनाता है?
एक सच्चा एजेंटिक मॉडल
पारंपरिक कोडिंग सहायकों के विपरीत जो केवल कोड स्निपेट उत्पन्न करते हैं, को एक "एजेंटिक" मॉडल के रूप में डिज़ाइन किया गया है। इसका मतलब है कि यह कर सकता है:
- संदर्भ बनाए रखें लंबे समय तक चलने वाले कार्यों पर जो घंटों या दिनों तक भी फैले हों
- स्वायत्त रूप से उपकरणों का उपयोग करें, जिसमें कमांड-लाइन इंटरफेस, फ़ाइल सिस्टम और विकास वातावरण शामिल हैं
- अनुकूलन और पुनरावृति करें वास्तविक समय की प्रतिक्रिया के आधार पर अपनी जगह खोए बिना
- जटिल बहु-चरणीय वर्कफ़्लो को संभालें जिसके लिए अनुसंधान, योजना और निष्पादन की आवश्यकता होती है
स्वयं-निर्माण उपलब्धि
शायद का सबसे उल्लेखनीय पहलू यह है कि Codex टीम ने मॉडल के शुरुआती संस्करणों का उपयोग निम्न के लिए किया:
- अपनी प्रशिक्षण प्रक्रिया को डिबग करें
- अपने स्वयं के परिनियोजन का प्रबंधन करें
- परीक्षण परिणामों और मूल्यांकनों का निदान करें
- अंतिम रिलीज़ के लिए बुनियादी ढांचे को अनुकूलित करें
यह स्व-संदर्भित विकास चक्र दर्शाता है कि AI अपने स्वयं के सुधार को कैसे तेज करना शुरू कर रहा है—एक मील का पत्थर जिसे OpenAI के शोधकर्ताओं ने उन्हें "यह देखकर दंग रह जाना बताया कि Codex अपने स्वयं के विकास को कितनी तेजी से बढ़ाने में सक्षम था।"
प्रदर्शन में सुधार
25% तेज अपने पूर्ववर्ती (GPT-5.2-Codex) की तुलना में 25% तेज है, OpenAI के बुनियादी ढांचे और अनुमान स्टैक में सुधार के लिए धन्यवाद। यह गति सुधार अधिक उत्तरदायी वास्तविक समय सहयोग और तेज़ पुनरावृत्ति चक्रों को सक्षम बनाता है।
बेंचमार्क प्रदर्शन: डेटा
कई प्रमुख बेंचमार्क में अत्याधुनिक प्रदर्शन प्राप्त करता है जो कोडिंग, एजेंटिक क्षमताओं और वास्तविक दुनिया के कंप्यूटर उपयोग को मापते हैं।
SWE-Bench Pro
SWE-Bench Pro वास्तविक दुनिया के सॉफ्टवेयर इंजीनियरिंग का एक कठोर मूल्यांकन है जो चार प्रोग्रामिंग भाषाओं (Python, JavaScript, TypeScript और Go) में फैला है। अपने पूर्ववर्ती (SWE-Bench Verified) के विपरीत, जिसने केवल Python का परीक्षण किया, SWE-Bench Pro को अधिक संदूषण-प्रतिरोधी और उद्योग-प्रासंगिक बनाने के लिए डिज़ाइन किया गया है।
टर्मिनल-बेंच 2.0
टर्मिनल-बेंच 2.0 पर GPT-5.3-Codex विशेष रूप से महत्वपूर्ण है। यह बेंचमार्क टर्मिनल कौशल को मापता है जिसकी एक कोडिंग एजेंट को आवश्यकता होती है—फ़ाइल सिस्टम को नेविगेट करना, कमांड निष्पादित करना और विकास वर्कफ़्लो का प्रबंधन करना। विशेष रूप से, GPT-5.3-Codex इसे किसी भी पूर्व मॉडल की तुलना में कम टोकन के साथ प्राप्त करता है, जिससे यह अधिक कुशल हो जाता है।
OSWorld-Verified
OSWorld-Verified पर GPT-5.3-Codex नाटकीय रूप से बेहतर कंप्यूटर-उपयोग क्षमताओं को दर्शाती है। OSWorld एक एजेंटिक कंप्यूटर-उपयोग बेंचमार्क है जहां एजेंटों को एक दृश्य डेस्कटॉप वातावरण में उत्पादकता कार्यों को पूरा करना होता है। यह भारी सुधार दर्शाता है कि GPT-5.3-Codex पिछले मॉडलों की तुलना में वास्तविक दुनिया के इंटरफेस को नेविगेट करने में कहीं बेहतर है।
कोड से परे: एक सामान्य-उद्देश्यीय एजेंट
जबकि प्रोग्रामिंग में उत्कृष्ट है, इसकी क्षमताएं कोड पीढ़ी से कहीं आगे तक फैली हुई हैं। OpenAI इसे एक ऐसे एजेंट के रूप में रखता है जो "लगभग वह सब कुछ कर सकता है जो डेवलपर और पेशेवर कंप्यूटर पर कर सकते हैं।"
सॉफ्टवेयर जीवनचक्र समर्थन
मॉडल पूरे सॉफ्टवेयर विकास जीवनचक्र का समर्थन करने के लिए बनाया गया है:
- डिबगिंग - बग की पहचान करना और ठीक करना
- परिनियोजन - रिलीज़ और बुनियादी ढांचे का प्रबंधन
- निगरानी - प्रदर्शन और मेट्रिक्स को ट्रैक करना
- PRD लिखना - उत्पाद आवश्यकता दस्तावेज़
- प्रतिलिपि संपादित करना - प्रलेखन और विपणन पाठ
- उपयोगकर्ता अनुसंधान - उपयोगकर्ता प्रतिक्रिया का विश्लेषण करना
- परीक्षण - परीक्षण सूट लिखना और चलाना
- मेट्रिक्स विश्लेषण - डेटा-संचालित निर्णय लेना
ज्ञान कार्य क्षमताएं
GPT-5.3-Codex (OpenAI का 2025 का मूल्यांकन जो 44 व्यवसायों में ज्ञान-कार्य कार्यों पर प्रदर्शन को मापता है) पर, GPT-5.3-Codex GPT-5.2 के प्रदर्शन से मेल खाता है। इसमें जैसे कार्य शामिल हैं:
- स्लाइड डेक और प्रस्तुतियां बनाना
- स्प्रेडशीट में डेटा का विश्लेषण करना
- दस्तावेज़ प्रबंधन और संगठन
वेब विकास उदाहरण
मॉडल की क्षमताओं को प्रदर्शित करने के लिए, OpenAI ने को शुरू से ही दो पूर्ण गेम बनाने के लिए कहा:
- एक रेसिंग गेम (Codex ऐप लॉन्च गेम का संस्करण 2)
केवल एक "वेब गेम विकसित करें" कौशल और "बग ठीक करें" या "गेम को बेहतर बनाएं" जैसे सामान्य अनुवर्ती संकेतों का उपयोग करके, ने लाखों टोकन पर स्वायत्त रूप से पुनरावृति की, जिससे अत्यधिक कार्यात्मक, पॉलिश गेम का निर्माण हुआ।
बेहतर इरादे को समझना
की तुलना में, नया मॉडल वेबसाइट बनाते समय उपयोगकर्ता के इरादे को बेहतर ढंग से समझता है। सरल या अपर्याप्त रूप से निर्दिष्ट संकेत अब साइटों के लिए डिफ़ॉल्ट हैं:
उदाहरण के लिए, जब एक मूल्य निर्धारण लैंडिंग पृष्ठ बनाने के लिए कहा गया, तो ने स्वचालित रूप से वार्षिक योजना को छूट वाली मासिक कीमत के रूप में प्रदर्शित किया (छूट को स्पष्ट करते हुए) और तीन अलग-अलग उपयोगकर्ता उद्धरणों के साथ एक स्वचालित रूप से संक्रमणकारी प्रशंसापत्र कैरोसेल बनाया—जिसके परिणामस्वरूप अधिक पूर्ण और पॉलिश डिज़ाइन हुआ।
इंटरैक्टिव सहयोग
सबसे महत्वपूर्ण उपयोगकर्ता अनुभव सुधारों में से एक मॉडल को काम करते समय मार्गदर्शन करने की क्षमता है।
वास्तविक समय की बातचीत
अंतिम आउटपुट की प्रतीक्षा करने के बजाय, उपयोगकर्ता अब यह कर सकते हैं:
- निष्पादन के दौरान प्रश्न पूछें
- विभिन्न दृष्टिकोणों पर चर्चा करें
- विशिष्ट समाधानों की ओर मार्गदर्शन करें
- मध्य-कार्य प्रतिक्रिया प्रदान करें
सेटिंग्स > सामान्य > अनुवर्ती व्यवहार बताता है कि यह क्या कर रहा है, प्रतिक्रिया का जवाब देता है और उपयोगकर्ताओं को शुरू से अंत तक लूप में रखता है। इसे सेटिंग्स > सामान्य > अनुवर्ती व्यवहार के माध्यम से Codex ऐप में सक्षम किया जा सकता है।
यह अनुभव को मशीन को कमांड देने से बदलकर एक टीम के साथी के साथ सहयोग करने में बदल देता है—यह इस बात में एक मौलिक बदलाव है कि मनुष्य AI सिस्टम के साथ कैसे इंटरैक्ट करते हैं।
साइबर सुरक्षा क्षमताएं और सुरक्षा
पहला मॉडल है जिसे OpenAI अपनी तत्परता फ्रेमवर्क के तहत साइबर सुरक्षा से संबंधित कार्यों के लिए "उच्च क्षमता" के रूप में वर्गीकृत करता है पहला मॉडल है जिसे OpenAI अपनी तत्परता फ्रेमवर्क के तहत साइबर सुरक्षा से संबंधित कार्यों के लिए "उच्च क्षमता" के रूप में वर्गीकृत करता है। यह सॉफ्टवेयर कमजोरियों की पहचान करने के लिए सीधे प्रशिक्षित किया गया पहला मॉडल भी है।
दोहरे उपयोग की प्रकृति
क्योंकि साइबर सुरक्षा स्वाभाविक रूप से दोहरे उपयोग वाली है (रक्षा और अपराध दोनों के लिए उपयोगी), OpenAI एक निवारक दृष्टिकोण अपना रहा है:
- कोई निश्चित प्रमाण नहीं कि यह साइबर हमलों को शुरू से अंत तक स्वचालित कर सकता है
- व्यापक साइबर सुरक्षा सुरक्षा स्टैक का परिनियोजन
- सुरक्षा प्रशिक्षण और स्वचालित निगरानी का कार्यान्वयन
- उन्नत क्षमताओं के लिए विश्वसनीय पहुंच की आवश्यकता
साइबर के लिए विश्वसनीय पहुंच
OpenAI साइबर के लिए विश्वसनीय पहुंच लॉन्च कर रहा है, एक पायलट कार्यक्रम:
- साइबर रक्षा अनुसंधान को तेज करें
- सबसे पहले बचावकर्ताओं को उपकरण प्राप्त कराएं
- पारिस्थितिकी तंत्र लचीलापन का समर्थन करें
$10M प्रतिबद्धता
2023 से $1M साइबर सुरक्षा अनुदान कार्यक्रम पर निर्माण करते हुए, OpenAI साइबर रक्षा को गति देने के लिए $10 मिलियन API क्रेडिट देने के लिए प्रतिबद्ध है, खासकर:
- महत्वपूर्ण बुनियादी ढांचा प्रणाली
- सद्भावना सुरक्षा अनुसंधान
आर्डवार्क सुरक्षा एजेंट
OpenAI आर्डवार्क के निजी बीटा का विस्तार कर रहा है, जो Codex सुरक्षा उत्पादों और उपकरणों के अपने सूट में पहली पेशकश है, जो इसकी सुरक्षा अनुसंधान एजेंट है। वे व्यापक रूप से उपयोग की जाने वाली परियोजनाओं जैसे Next.js के लिए मुफ्त कोडबेस स्कैनिंग प्रदान करने के लिए ओपन-सोर्स अनुरक्षकों के साथ भी साझेदारी कर रहे हैं।
OpenAI ने Codex का उपयोग करके Codex का निर्माण कैसे किया
का विकास AI-त्वरित अनुसंधान में एक आकर्षक केस स्टडी प्रदान करता है।
अनुसंधान टीम उपयोग के मामले
अनुसंधान टीम ने के शुरुआती संस्करणों का उपयोग निम्न के लिए किया:
- निगरानी और डिबग रिलीज़ के लिए प्रशिक्षण रन
- पैटर्न ट्रैक करें प्रशिक्षण के दौरान
- गहरा विश्लेषण प्रदान करें बातचीत की गुणवत्ता पर
- सुझाव ठीक करें और मानव शोधकर्ताओं के लिए समृद्ध अनुप्रयोग बनाएं
- ठीक से समझें कि मॉडल का व्यवहार पिछले मॉडलों से कैसे अलग था
इंजीनियरिंग टीम उपयोग के मामले
इंजीनियरिंग टीम ने Codex का उपयोग निम्न के लिए किया:
- अनुकूलित और अनुकूलित करें GPT-5.3-Codex के लिए हार्नेस
- संदर्भ प्रतिपादन बग की पहचान करें उपयोगकर्ताओं को प्रभावित करना
- कम कैश हिट दरों का मूल कारण
- GPU क्लस्टर को गतिशील रूप से स्केल करें ट्रैफिक बढ़ने के लिए समायोजित करने के लिए
- लॉन्च के दौरान विलंबता को स्थिर रखें
डेटा विज्ञान उपयोग के मामले
अल्फा परीक्षण के दौरान, एक डेटा वैज्ञानिक ने के साथ काम किया:
- स्पष्टीकरण, उपयोगकर्ता प्रतिक्रियाओं और कार्य प्रगति की आवृत्ति का अनुमान लगाने के लिए Regex वर्गीकरणकर्ता बनाएं
- इन वर्गीकरणकर्ताओं को सभी सत्र लॉग पर स्केलेबल रूप से चलाएं
- नए डेटा पाइपलाइन बनाएं और मानक डैशबोर्डिंग टूल की तुलना में परिणामों को अधिक समृद्ध रूप से विज़ुअलाइज़ करें
- परिणामों का सह-विश्लेषण करें, Codex तीन मिनट से कम समय में हजारों डेटा बिंदुओं पर प्रमुख अंतर्दृष्टि का सारांश देता है
उत्पादकता लाभ
परिणाम? Codex के साथ निर्माण करने वाले लोग खुश थे क्योंकि एजेंट:
- उनके इरादे को बेहतर ढंग से समझा
- प्रति बारी में अधिक प्रगति की
- कम स्पष्टीकरण प्रश्न पूछे
उपलब्धता और मूल्य निर्धारण
कैसे एक्सेस करें
तत्काल उपलब्ध है सभी Codex सतहों पर सशुल्क ChatGPT उपयोगकर्ताओं के लिए तत्काल उपलब्ध है:
- डेस्कटॉप ऐप (macOS और Windows)
- IDE एक्सटेंशन (VS Code, JetBrains, आदि)
सदस्यता योजनाएं
सीमित समय के लिए, सशुल्क योजनाओं को सामान्य दर सीमाओं से दोगुना प्राप्त होगा।
API मूल्य निर्धारण
लॉन्च के अनुसार, OpenAI ने <a2>GPT-5.3-Codex के लिए आधिकारिक API मूल्य निर्धारण जारी नहीं किया है</a2>। API एक्सेस को "जल्द ही रोल आउट" और "निम्नलिखित सप्ताहों में आ रहा है" के रूप में वर्णित किया गया है।
संदर्भ के लिए, पिछले मॉडल (GPT-5.2-Codex) के लिए वर्तमान API मूल्य निर्धारण है:
बुनियादी ढांचा
GPT-5.3-Codex को AI क्षमता की सीमाओं को आगे बढ़ाने में OpenAI और NVIDIA के बीच घनिष्ठ सहयोग के प्रमाण के रूप में NVIDIA GB200 NVL72 सिस्टम</a2> पर सह-डिज़ाइन, प्रशिक्षित और परोसा गया था।
प्रतियोगियों के साथ तुलना
Claude Opus 4.6 की रिलीज़ Anthropic द्वारा Claude Opus 4.6 की घोषणा के कुछ मिनट बाद हुई, जिससे दोनों मॉडलों के बीच तत्काल तुलना स्थापित हुई।
ताकत
- टर्मिनल-बेंच 2.0: 77.3 बनाम Opus 4.6 का 65.4 (+18.6% लाभ)
- "उच्च विश्वसनीयता, कम विचरण" डिजाइन दर्शन
- स्वयं-निर्माण क्षमता (स्वयं को बनाने में मदद की)
- पहला "उच्च क्षमता" साइबर सुरक्षा वर्गीकरण
Claude Opus 4.6 ताकत
- 1 मिलियन टोकन संदर्भ विंडो (काफी बड़ा)
- एजेंट टीम सहयोगात्मक कार्यक्षमता
- व्यापक बहुमुखी प्रतिभा ज्ञान कार्य परिदृश्यों में
- उच्च रचनात्मकता तापमान (अधिक व्यक्तित्व)
डिजाइन दर्शन अंतर
बड़ी तस्वीर
सामान्य-उद्देश्यीय एजेंटों की ओर एक कदम परिवर्तन है जो तर्क कर सकते हैं, निर्माण कर सकते हैं और निष्पादित कर सकते हैं सिर्फ एक वृद्धिशील उन्नयन से कहीं अधिक का प्रतिनिधित्व करता है—यह वास्तविक दुनिया के तकनीकी कार्य के पूरे स्पेक्ट्रम में सामान्य-उद्देश्यीय एजेंटों की ओर एक कदम परिवर्तन है जो तर्क कर सकते हैं, निर्माण कर सकते हैं और निष्पादित कर सकते हैं।
कोड एजेंट से कंप्यूटर एजेंट तक
OpenAI स्पष्ट रूप से इस विकास को तैयार करता है: "Codex कोड लिखने से आगे बढ़कर कंप्यूटर को संचालित करने और काम को अंत तक पूरा करने के लिए एक उपकरण के रूप में उपयोग करने की ओर बढ़ रहा है।"
यह एक गहरा बदलाव है। "सर्वश्रेष्ठ कोडिंग एजेंट" होने पर जो ध्यान केंद्रित करना शुरू हुआ, वह कंप्यूटर पर अधिक सामान्य सहयोगी के लिए आधार बन गया है—दोनों का विस्तार जो बना सकते हैं और AI के साथ क्या संभव है।
AI विकास को गति देना
तथ्य यह है कि ने स्वयं को बनाने में मदद की, वह आने वाले समय का पूर्वावलोकन है। जैसा कि OpenAI के शोधकर्ता बताते हैं, "OpenAI के कई शोधकर्ता और इंजीनियर आज अपनी नौकरी को मौलिक रूप से अलग बताते हैं कि यह सिर्फ दो महीने पहले क्या थी।"
यह सुझाव देता है कि हम AI विकास में तेजी से बढ़ते रिटर्न की अवधि में प्रवेश कर रहे हैं, जहां मॉडलों की प्रत्येक पीढ़ी अगली पीढ़ी के निर्माण में मदद करती है—संभावित रूप से समयसीमा को वर्षों से महीनों तक संपीड़ित करती है।
डेवलपर्स के लिए निहितार्थ
सॉफ्टवेयर डेवलपर्स के लिए, निहितार्थ महत्वपूर्ण हैं:
- तेज़ विकास चक्र - AI अधिक नियमित काम को संभालता है
- उच्च-स्तरीय अमूर्तता - डेवलपर आर्किटेक्चर और डिज़ाइन पर ध्यान केंद्रित कर सकते हैं
- इंटरैक्टिव सहयोग - एक उपकरण का उपयोग करने जैसा कम, एक टीम के साथी के साथ काम करने जैसा अधिक
- नई क्षमताएं - ऐसे कार्य जिनके लिए पहले विशिष्ट ज्ञान की आवश्यकता होती थी, अब सुलभ हैं
व्यवसायों के लिए निहितार्थ
व्यवसायों के लिए, का प्रतिनिधित्व करता है:
- बढ़ी हुई उत्पादकता - कम समय में अधिक काम हो जाता है
- कम बाधाएं - कुछ कार्यों के लिए कम विशिष्ट कौशल की आवश्यकता होती है
- नई सुरक्षा संबंधी विचार - "उच्च क्षमता" साइबर सुरक्षा वर्गीकरण के लिए सावधानीपूर्वक शासन की आवश्यकता होती है
- प्रतिस्पर्धी लाभ - शक्तिशाली एजेंटिक AI का शीघ्र अपनाना
निष्कर्ष
कृत्रिम बुद्धिमत्ता में एक ऐतिहासिक उपलब्धि है। यह जोड़ती है:
- अत्याधुनिक कोडिंग प्रदर्शन
- स्व-सुधार (इसने स्वयं को बनाने में मदद की)
- वास्तविक दुनिया का कंप्यूटर उपयोग
तथ्य यह है कि यह अपने स्वयं के निर्माण में सहायक था, एक तकनीकी उपलब्धि और एक रूपक दोनों के रूप में कार्य करता है कि AI कहां जा रहा है। जैसे-जैसे मॉडल अधिक सक्षम होते जाते हैं, वे केवल ऐसे उपकरण नहीं हैं जिनका हम उपयोग करते हैं—वे रचनात्मक और विकास प्रक्रिया में स्वयं भागीदार बनते जा रहे हैं।
क्लाउड ओपस 4.6 के साथ एक साथ रिलीज़, सिर्फ कुछ मिनटों की दूरी पर, AI क्षेत्र में प्रतिस्पर्धा की तीव्रता को रेखांकित करता है। लेकिन इससे भी महत्वपूर्ण बात यह है कि यह संकेत देता है कि हमने AI क्षमता के एक नए चरण में प्रवेश कर लिया है—एक ऐसा चरण जहां एजेंट पेशेवर कंप्यूटर कार्य के पूरे स्पेक्ट्रम में जटिल, लंबी अवधि के कार्यों को मज़बूती से संभाल सकते हैं।
जैसा कि OpenAI कहता है: "सर्वश्रेष्ठ कोडिंग एजेंट होने पर जो ध्यान केंद्रित करना शुरू हुआ, वह कंप्यूटर पर अधिक सामान्य सहयोगी के लिए आधार बन गया है।"
अब सवाल यह नहीं है कि ये मॉडल क्या कर सकते हैं—यह सवाल है कि हम उनके साथ क्या बनाने का विकल्प चुनेंगे।
स्रोत
अस्वीकरण: यह लेख 6 फरवरी, 2026 तक उपलब्ध जानकारी पर आधारित है। विशिष्टताओं, मूल्य निर्धारण और उपलब्धता में परिवर्तन हो सकता है। सबसे वर्तमान जानकारी के लिए कृपया आधिकारिक OpenAI प्रलेखन देखें।