DeepSeek v3 आणि R1 कसे वापरावे: युक्तिवाद आणि चॅट कार्यांसाठी प्रॉम्प्टिंग
जर तुम्ही कधी एखाद्या प्रॉम्प्टला जास्त महत्व दिले आणि त्यातून वाईट उत्तर मिळाले, तर तुम्ही एकटे नाही आहात. DeepSeek R1 सारखे 'reasoning-first' मॉडेल आणि DeepSeek v3 सारखे उच्च-थ्रुपुट चॅट मॉडेल वापरताना, जुनी पद्धत (लांब प्रॉम्प्ट, 'chain-of-thought' समजावण्याचा प्रयत्न) अनेकदा अयशस्वी ठरते. DeepSeek v3 आणि R1 ला युक्तिवाद (reasoning) आणि चॅट कार्यांसाठी कसे प्रॉम्प्ट करायचे हे हा गाइड तुम्हाला दर्शवितो—काय सोपे ठेवायचे, केव्हा मार्गदर्शन करायचे आणि स्थिर, अचूक परिणामांसाठी सेटिंग्ज कशा ट्यून करायच्या.
शैली सूचना: व्यावहारिक आणि समाधान-आधारित. आम्ही 'cut-and-paste' पॅटर्न आणि संरक्षणासह काय कार्य करते यावर लक्ष केंद्रित करू.
- जेव्हा तुम्हाला मजबूत मल्टी-स्टेप युक्तिवाद, पुरावे आणि जटिल नियोजनाची आवश्यकता असते तेव्हा DeepSeek R1 वापरा.
- जलद, अचूक चॅट, कोडिंग सहाय्य, मसुदा तयार करणे आणि मोठ्या प्रमाणावर सामान्य प्रश्नोत्तरे (Q&A) साठी DeepSeek v3 वापरा.
- 'Chain-of-thought' ला सक्ती करू नका. त्याऐवजी “अंतिम उत्तरे”, “संक्षिप्त तर्क” किंवा संरचित आउटपुट मागा.
- प्रॉम्प्ट लहान आणि स्पष्ट ठेवा; आवश्यक असेल तेव्हाच मर्यादा आणि मूल्यांकन निकष जोडा.
- शून्यापासून सुरुवात करा; सातत्याने अपयश येत असल्याचे दिसल्यास काही उदाहरणे (few-shot examples) जोडा.
DeepSeek R1 आणि v3 मध्ये काय फरक आहे
- DeepSeek R1: हे 'reasoning'साठी अनुकूल केलेले मॉडेल आहे, जे “उत्तर देण्यापूर्वी विचार” करण्यासाठी डिझाइन केलेले आहे, ज्यामुळे स्पष्ट 'step-by-step' प्रॉम्प्टिंगची आवश्यकता कमी होते. अनेक प्लॅटफॉर्म आणि डॉक्स 'chain-of-thought' टाळण्याचा सल्ला देतात; R1 साठी शून्य-शॉट (zero-shot) अनेकदा सर्वोत्तम काम करते.
- DeepSeek v3: हे जलद, मजबूत MoE चॅट मॉडेल आहे (एकूण ६७१B पॅरामीटर्स; प्रति टोकन ३७B सक्रिय) ज्याचा उद्देश उत्कृष्ट खर्च-कार्यक्षमतेसह सामान्य-उद्देशीय भाषिक कार्ये करणे, परिचित API एर्गोनॉमिक्स आणि आधुनिक मॉडेल गुणवत्ता आहे. अधिकृत डॉक्स OpenAI-शैलीतील API वापर दर्शवतात.
व्यवहारात:
- R1 ची निवड कधी करावी: गणितातील शब्द समस्या, धोरणात्मक विश्लेषण, अनेक मर्यादांचे नियोजन, सुप्त पायऱ्यांसह अवघड युक्तिवाद.
- v3 ची निवड कधी करावी: ग्राहक चॅट, कोडिंग रिव्ह्यू, पुनर्लेखन, सारांश आणि जलद पुनरावृत्ती लूप.
सुवर्ण नियम: 'Reasoning' मॉडेलला जास्त प्रॉम्प्ट करू नका
R1 सारखी 'Reasoning' मॉडेल आधीच अंतर्गत विचार करतात. 'Chain-of-thought' ला सक्ती केल्याने (“step by step विचार करा आणि तुमचे 'reasoning' दाखवा”) अनेकदा शब्दांचा अनावश्यक वापर होतो, मॉडेलचे लक्ष विचलित होऊ शकते आणि काही सेटिंग्जमध्ये ते निरुत्साहित केले जाऊ शकते. त्याऐवजी, हे वापरा:
- “अंतिम उत्तर आणि एक संक्षिप्त स्पष्टीकरण द्या.”
- “उत्तर द्या, मग तुम्हाला ते उत्तर मिळवण्यास मदत करणारे ३ महत्त्वाचे घटक सांगा.”
- “फक्त निकाल आणि २ वाक्यांचे समर्थन (justification) परत करा.”
हे मार्गदर्शनानुसार आहे की साधे, शून्य-शॉट प्रॉम्प्ट R1 साठी गुंतागुंतीच्या 'stepwise' सूचनांपेक्षा प्रभावी किंवा चांगले असू शकतात.
प्रॉम्प्टिंग पॅटर्न जे काम करतात
1) शून्य-शॉट, किमान (R1 साठी पहिला प्रयत्न सर्वोत्तम; v3 साठी देखील उत्तम)
उद्देश: किमान मर्यादांसह एक महत्त्वाचे (nontrivial) समस्येचे निराकरण करा.
प्रॉम्प्ट टेम्पलेट:
तुम्ही एक काळजीपूर्वक समस्या सोडवणारे आहात.
प्रश्न: {task}
सूचना: अंतिम उत्तर आणि संक्षिप्त तर्क (जास्तीत जास्त ३ वाक्ये) द्या.
हे का काम करते: हे आउटपुट केंद्रित आणि लहान ठेवून अंतर्गत 'reasoning'ला प्रोत्साहन देते.
2) मर्यादित आउटपुट (API, विश्वसनीयता किंवा ऑटोमेशनसाठी)
जेव्हा तुम्हाला अंदाजे (predictable) फॉरमॅटची आवश्यकता असते तेव्हा वापरा.
प्रॉम्प्ट टेम्पलेट:
सिस्टम: तुम्ही फक्त वैध JSON परत करणे आवश्यक आहे.
वापरकर्ता: या डॉक्युमेंटचा ५ बुलेट पॉईंटमध्ये सारांश लिहा, ज्यात एक धोका आणि एक संधी असावी.
JSON परत करा: {
"bullets": . न्यूज/मॉडेल नोट्स v3 ची कार्यक्षमता आणि स्केल हायलाइट करतात, तर मॉडेल कार्ड्स अतिरिक्त संदर्भ प्रदान करतात.
उपयोगानुसार DeepSeek v3 आणि R1 मध्ये निवड करणे
- ग्राहक समर्थन चॅट: गती आणि खर्चासाठी v3; टोन आणि धोरणाचे पालन करण्यासाठी काही उदाहरणे (few-shot examples) जोडा.
- विश्लेषक माहिती (briefings) आणि निर्णय मेमो: उच्च-अखंडतेच्या 'reasoning'साठी R1; “संक्षिप्त तर्क” मर्यादा सेट करा.
- कोडिंग पुनरावलोकन (review) आणि 'refactor' योजना: जलद पुनरावृत्तीसाठी v3 उत्कृष्ट आहे; जेव्हा तुम्हाला 'tradeoffs'बद्दल सखोल 'reasoning'ची आवश्यकता असते तेव्हा R1.
- मर्यादांसह गणित, तर्कशास्त्र, शेड्युलिंग: R1 सहसा उत्कृष्ट ठरते.
- मोठ्या प्रमाणावर सारांश किंवा पुनर्लेखन पाइपलाइन: थ्रुपुटसाठी v3.
RAG सहाय्यकामध्ये R1 सह ट्युटोरियल बिल्डिंगसाठी, सामुदायिक आणि ट्युटोरियल लेखन पहा जे एंड-टू-एंड पॅटर्न, v3 साठी कोडिंग-आधारित उदाहरणे आणि सामुदायिक स्टॅकद्वारे स्थानिक प्रयोग दर्शवतात.
'Reasoning' सामग्रीचे सुरक्षित हाताळणी
- संपूर्ण 'chain-of-thought' मागू नका. जर तुम्हाला पारदर्शकता हवी असेल, तर लहान समर्थन (justification) किंवा महत्त्वाच्या घटकांची यादी मागा.
- संवेदनशील डोमेनसाठी, एक धोरण ओळ (policy line) समाविष्ट करा: “जर तुम्हाला खात्री नसेल किंवा कार्यामुळे नुकसान होऊ शकत असेल, तर स्पष्ट करणारे प्रश्न विचारा किंवा नकार द्या.”
- संख्यात्मक कार्यांसाठी प्रमाणीकरण प्रॉम्प्ट जोडा: “उत्तर देण्यापूर्वी गणिताचीdouble-check करा.”
हे R1-शैलीतील मॉडेलसाठी सामान्य सर्वोत्तम पद्धतीचे मार्गदर्शन प्रतिबिंबित करते: किमान प्रॉम्प्टिंग, 'chain-of-thought' टाळा आणि मॉडेलच्या अंतर्गत 'reasoning'वर अवलंबून रहा.
प्रॉम्प्ट लायब्ररी: कॉपी-रेडी स्निपेट्स
A) जटिल नियोजन (R1)
उद्देश: 1,000 वापरकर्त्यांसाठी किमान 'churn' सह 6-आठवड्यांचे उत्पादन बीटा प्लॅन करा.
परत करा:
- महत्वाचे धोके (जास्तीत जास्त ५)
- कमी करणारे उपाय (प्रत्येक धोक्यासाठी एक)
मर्यादा: एकूण 200 शब्दांपेक्षा कमी ठेवा.
### B) धोरण-संवेदनशील चॅट (v3)
सिस्टम: तुम्ही एक उपयुक्त, धोरण-अनुरूप सहाय्यक आहात. जर विनंती धोरणाशी विसंगत असेल, तर स्पष्ट करणारा प्रश्न विचारा किंवा सुरक्षित पर्याय द्या.
वापरकर्ता: उशीर झालेल्या ऑर्डरसाठी 'refund' प्रतिसादाचा मसुदा तयार करा. सहानुभूतीपूर्ण टोन ठेवा आणि दोन पर्याय द्या.
### C) गणित/तर्कशास्त्र (R1)
खालील सोडवा. अंतिम उत्तर आणि 2-वाक्यांचे चेकिंग (check) प्रदान करा.
समस्या: {word problem}
### D) कोड पुनरावलोकन (v3)
तुम्ही एक वरिष्ठ पायथन समीक्षक आहात. कार्यप्रदर्शन आणि वाचनीयतेसाठी स्निपेटचे विश्लेषण करा.
परत करा:
- उदाहरण 'refactor' (<=30 ओळी)
### E) JSON मध्ये डेटा काढणे (v3)
सिस्टम: फक्त वैध JSON परत करा.
वापरकर्ता: टेक्स्टमधून कंपनी, महसूल आणि मुख्यालय काढा. गहाळ असल्यास, 'null' वापरा.
स्कीमा: {"company":"string","revenue":"string|null","hq":"string|null"}
टेक्स्ट: {paste}
समस्यानिवारण: जेव्हा आउटपुट भरकटतात किंवा चुकीची माहिती देतात
- खूप विस्तृत? 'Max tokens' कमी करा किंवा “कमाल १२० शब्द” जोडा.
- असंगत फॉरमॅट? 'JSON-only' सिस्टम प्रॉम्प्ट आणि 'stop sequence' जोडा.
- चुकीचे गृहितक? एक-ओळ मर्यादा जोडा: “जर अनिश्चित असाल, तर 1 स्पष्ट करणारा प्रश्न विचारा.”
- गणिताच्या चुका? “अंतिम उत्तर देण्यापूर्वी गणिताची double-check करा” जोडा.
- कमकुवत 'chain' कार्ये? दोन कॉल्समध्ये विभाजित करा: योजना → अंमलबजावणी.
API Quick Start (संकल्पनात्मक)
- एंडपॉइंट आणि की व्यवस्थापन OpenAI-शैलीतील इंटरफेसचे अनुसरण करतात.
model, messages, temperature, max_tokens आणि स्ट्रीमिंग पर्यायांसारख्या मानक फील्डची अपेक्षा करा.
- DeepSeek v3 ची वैशिष्ट्ये आणि कार्यप्रदर्शन दावे अधिकृत बातम्या/मॉडेल अपडेट आणि मॉडेल कार्ड्समध्ये सारांशित केले आहेत.
लक्षात घेण्यासारखे: प्रॉम्प्ट पुनरावृत्तीसाठी Sider.AI वापरणे
जर तुम्ही जलदगतीने पॅटर्न शोधत असाल—शून्य-शॉट वि. few-शॉट टेस्टिंग, फॉरमॅट टॉगल करणे किंवा R1 वि. v3 प्रतिसादांची तुलना करणे—तर एक ओव्हरले सहाय्यक लूपला गती देऊ शकतो. तसे, Sider.AI एकाच वर्कफ्लोमध्ये पेजेस आणि टूल्समध्ये मसुदा तयार करणे, पुनरावृत्ती करणे आणि A/B प्रॉम्प्ट करणे सोपे करते, ज्यामुळे तुम्ही तुमच्या कार्यासाठी सर्वोत्तम काम करणाऱ्या किमान प्रॉम्प्टवर लक्ष केंद्रित करू शकता. महत्वाचे मुद्दे
- DeepSeek R1 साठी किमान, शून्य-शॉट प्रॉम्प्टला प्राधान्य द्या; स्पष्ट 'chain-of-thought' विनंत्या टाळा.
- जलद, स्केलेबल चॅट आणि संरचित कार्यांसाठी DeepSeek v3 वापरा; विश्वासार्हतेसाठी मर्यादित फॉरमॅटवर भर द्या.
- केवळ सातत्याने अपयश येत असल्यास काही उदाहरणे (few-shot examples) जोडा.
- JSON स्कीमा, लहान सिस्टम प्रॉम्प्ट आणि 'stop sequences' सह संरचनेची अंमलबजावणी करा.
- जटिल 'reasoning'साठी, संपूर्ण 'reasoning' लॉगऐवजी अंतिम उत्तरे आणि संक्षिप्त समर्थन (justifications) मागा.
FAQ
Q1: DeepSeek v3 पेक्षा DeepSeek R1 कधी निवडावा?
मल्टी-स्टेप 'reasoning', जटिल नियोजन आणि गणित/तर्कशास्त्र कार्यांसाठी DeepSeek R1 निवडा. जलद, सामान्य चॅट, मसुदा तयार करणे, कोडिंग सहाय्य आणि उच्च-थ्रुपुट पाइपलाइनसाठी v3 निवडा.
Q2: मी DeepSeek R1 सह 'chain-of-thought' प्रॉम्प्टिंग वापरावे का?
नाही. मार्गदर्शन असे सूचित करते की स्पष्ट 'chain-of-thought' टाळा आणि मॉडेलच्या अंगभूत 'reasoning'वर अवलंबून रहा. त्याऐवजी संक्षिप्त समर्थनासह अंतिम उत्तरे मागा.
Q3: मला DeepSeek v3 कडून सातत्यपूर्ण JSON कसे मिळेल?
केवळ JSON अनिवार्य करणारा एक लहान सिस्टम प्रॉम्प्ट वापरा, एक tight स्कीमा परिभाषित करा आणि वैकल्पिकरित्या 'stop sequences' सेट करा. भरकटणे (drift) मर्यादित करण्यासाठी 'temperature' कमी करा आणि 'max tokens' कॅप करा.
Q4: 'Reasoning' कार्यांसाठी मी कोणते 'temperature' वापरावे?
निश्चितता आणि मूल्यांकनासाठी कमी (0.0–0.3) पासून सुरुवात करा. मसुदा तयार करणे किंवा कोडिंगमध्ये संतुलित सर्जनशीलतेसाठी 0.4–0.7 पर्यंत वाढवा; 'brainstorming'साठी उच्च मूल्ये वापरा.
Q5: मी DeepSeek मॉडेल स्थानिक पातळीवर चालवू शकतो का?
प्रयोगासाठी सामुदायिक सेटअप अस्तित्वात आहेत, परंतु उत्पादन (production) अनेकदा स्थिरता आणि कार्यक्षमतेसाठी होस्ट केलेले API वापरते. स्थानिक सूचनांसाठी मॉडेल कार्ड आणि सामुदायिक मार्गदर्शिका तपासा.