DeepSeek v3 এবং R1 কিভাবে ব্যবহার করবেন: যুক্তিতর্ক এবং চ্যাট কাজের জন্য প্রম্পটিং
আপনি যদি কখনও খারাপ উত্তর পাওয়ার জন্য একটি প্রম্পটকে অতিরিক্ত জটিল করে থাকেন, তবে আপনি একা নন। DeepSeek R1-এর মতো রিজনিং-ফার্স্ট মডেল এবং DeepSeek v3-এর মতো উচ্চ-থ্রুপুট চ্যাট মডেলগুলির সাথে, পুরোনো নিয়ম (দীর্ঘ প্রম্পট, চেইন-অফ-থট বোঝানো) প্রায়শই ব্যর্থ হয়। এই নির্দেশিকা আপনাকে যুক্তিতর্ক এবং চ্যাট কাজের জন্য DeepSeek v3 এবং R1-কে কীভাবে প্রম্পট করতে হয় তা দেখায়—কী সহজ রাখতে হবে, কখন ধাপে ধাপে করতে হবে এবং স্থিতিশীল, নির্ভুল ফলাফলের জন্য কীভাবে সেটিংস টিউন করতে হবে।
শৈলী বিষয়ক নোট: ব্যবহারিক এবং সমাধান-ভিত্তিক। আমরা কী কাজ করে তার উপর মনোযোগ দেব, কাট-এন্ড-পেস্ট প্যাটার্ন এবং সুরক্ষা সহ।
- যখন আপনার শক্তিশালী মাল্টি-স্টেপ যুক্তিতর্ক, প্রমাণ এবং জটিল পরিকল্পনার প্রয়োজন হবে তখন DeepSeek R1 ব্যবহার করুন।
- দ্রুত, নির্ভুল চ্যাট, কোডিং সহায়তা, ড্রাফটিং এবং স্কেলে সাধারণ প্রশ্নোত্তর এর জন্য DeepSeek v3 ব্যবহার করুন।
- চেইন-অফ-থট জোর করবেন না। পরিবর্তে "চূড়ান্ত উত্তর", "সংক্ষিপ্ত যুক্তি" অথবা স্ট্রাকচার্ড আউটপুট দেওয়ার কথা বলুন।
- প্রম্পটগুলি সংক্ষিপ্ত এবং স্পষ্ট রাখুন; শুধুমাত্র যখন প্রয়োজন তখনই সীমাবদ্ধতা এবং মূল্যায়নের মানদণ্ড যোগ করুন।
- জিরো-শট দিয়ে শুরু করুন; শুধুমাত্র যদি আপনি সামঞ্জস্যপূর্ণ ব্যর্থতা দেখতে পান তবে ফিউ-শট উদাহরণ যোগ করুন।
DeepSeek R1 বনাম v3 এর মধ্যে পার্থক্য কী
- DeepSeek R1: একটি যুক্তিতর্ক-অপ্টিমাইজড মডেল যা উত্তর দেওয়ার আগে "চিন্তা" করার জন্য ডিজাইন করা হয়েছে, যা সুস্পষ্টভাবে ধাপে ধাপে প্রম্পটিংয়ের প্রয়োজনীয়তা হ্রাস করে। অনেক প্ল্যাটফর্ম এবং ডকুমেন্ট চেইন-অফ-থট চাহিদা এড়িয়ে চলার পরামর্শ দেয়; জিরো-শট প্রায়শই R1 এর জন্য সবচেয়ে ভালো কাজ করে।
- DeepSeek v3: একটি দ্রুত, শক্তিশালী MoE চ্যাট মডেল (মোট ৬৭১B প্যারামিটার; প্রতি টোকেনে ৩৭B সক্রিয়) যা চমৎকার খরচ-কার্যকারিতা, পরিচিত API এরগোনোমিক্স এবং আধুনিক মডেল গুণমান সহ সাধারণ-উদ্দেশ্যের ভাষা বিষয়ক কাজের জন্য তৈরি করা হয়েছে। অফিসিয়াল ডকুমেন্ট OpenAI-স্টাইল API ব্যবহারের নিয়মাবলী দেখায়।
বাস্তবে:
- R1 নির্বাচন করুন: গণিতের শব্দ সমস্যা, কৌশলগত বিশ্লেষণ, মাল্টি-কনস্ট্রেইন্ট পরিকল্পনা, সুপ্ত পদক্ষেপের সঙ্গে জটিল যুক্তিতর্কের জন্য।
- v3 নির্বাচন করুন: গ্রাহক চ্যাট, কোডিং রিভিউ, পুনর্লিখন, সারসংক্ষেপ এবং দ্রুত পুনরাবৃত্তি লুপের জন্য।
সোনালী নিয়ম: রিজনিং মডেলগুলিতে অতিরিক্ত প্রম্পট করবেন না
R1-এর মতো রিজনিং মডেলগুলি ইতিমধ্যেই অভ্যন্তরীণভাবে চিন্তা করে। চেইন-অফ-থট ("ধাপে ধাপে চিন্তা করুন এবং আপনার যুক্তি দেখান") প্রায়শই শব্দবহুলতা যোগ করে, মডেলকে বিভ্রান্ত করতে পারে এবং কিছু ক্ষেত্রে নিরুৎসাহিত করা হতে পারে। পরিবর্তে, ব্যবহার করুন:
- "চূড়ান্ত উত্তর এবং একটি সংক্ষিপ্ত ব্যাখ্যা দিন।"
- "উত্তর দিন, তারপর ৩টি মূল কারণ তালিকাভুক্ত করুন যা আপনাকে সেখানে নিয়ে গেছে।"
- "শুধুমাত্র ফলাফল এবং ২-বাক্যের ন্যায্যতা দিন।"
এটি সেই নির্দেশনার সাথে সামঞ্জস্যপূর্ণ যে, R1-এর জন্য জটিল ধাপে ধাপে নির্দেশের চেয়ে সহজ, জিরো-শট প্রম্পটগুলি বেশি কার্যকর হতে পারে।
প্রম্পটিং প্যাটার্ন যা কাজ করে
১) জিরো-শট, মিনিমালিস্ট (R1-এর জন্য প্রথম চেষ্টা হিসাবে সেরা; v3-এর জন্যও দারুণ)
লক্ষ্য: ন্যূনতম সীমাবদ্ধতা সহ একটি অ-তুচ্ছ সমস্যার সমাধান করুন।
প্রম্পট টেমপ্লেট:
আপনি একজন সতর্ক সমস্যা সমাধানকারী।
প্রশ্ন: {task}
নির্দেশাবলী: চূড়ান্ত উত্তর এবং একটি সংক্ষিপ্ত যুক্তি (সর্বোচ্চ ৩টি বাক্য) দিন।
কেন এটি কাজ করে: এটি আউটপুটকে ফোকাসড এবং সংক্ষিপ্ত রাখার সময় অভ্যন্তরীণ যুক্তিতর্ককে উৎসাহিত করে।
২) সীমাবদ্ধ আউটপুট (API, নির্ভরযোগ্যতা বা অটোমেশনের জন্য)
যখন আপনার অনুমানযোগ্য ফরম্যাটের প্রয়োজন হয় তখন এটি ব্যবহার করুন।
প্রম্পট টেমপ্লেট:
সিস্টেম: আপনাকে শুধুমাত্র বৈধ JSON ফেরত দিতে হবে।
ব্যবহারকারী: একটি ঝুঁকি এবং একটি সুযোগ সহ ৫টি বুলেট পয়েন্টে এই ডকুমেন্টটির সারসংক্ষেপ করুন।
JSON ফেরত দিন: {
"bullets": . News/model notes v3-এর দক্ষতা এবং স্কেল তুলে ধরে, যেখানে মডেল কার্ড অতিরিক্ত প্রসঙ্গ সরবরাহ করে।
ব্যবহারের ক্ষেত্র অনুসারে DeepSeek v3 এবং R1 এর মধ্যে নির্বাচন করা
- গ্রাহক সহায়তা চ্যাট: গতির এবং খরচের জন্য v3; সুর এবং নীতি মেনে চলার জন্য ফিউ-শট উদাহরণ যোগ করুন।
- বিশ্লেষক ব্রিফিং এবং সিদ্ধান্ত মেমো: উচ্চ-সততার যুক্তিতর্কের জন্য R1; "সংক্ষিপ্ত যুক্তি" সীমাবদ্ধতা সেট করুন।
- কোডিং রিভিউ এবং রিফ্যাক্টর পরিকল্পনা: দ্রুত পুনরাবৃত্তির জন্য v3 চমৎকার; ট্রেডঅফ সম্পর্কে আপনার গভীর যুক্তিতর্কের প্রয়োজন হলে R1।
- সীমাবদ্ধতা সহ গণিত, যুক্তি, সময়সূচী: R1 সাধারণত ভালো।
- বৃহৎ আকারের সারসংক্ষেপ বা পুনর্লিখনের পাইপলাইন: থ্রুপুটের জন্য v3।
RAG সহকারীর মধ্যে R1 দিয়ে তৈরি একটি টিউটোরিয়ালের জন্য, কমিউনিটি এবং টিউটোরিয়াল রাইট-আপগুলি দেখুন যা এন্ড-টু-এন্ড প্যাটার্ন, v3-এর জন্য কোডিং-ভিত্তিক উদাহরণ এবং কমিউনিটি স্ট্যাকের মাধ্যমে স্থানীয় পরীক্ষা দেখায়।
রিজনিং কন্টেন্টের নিরাপদ পরিচালনা
- পুরো চেইন-অফ-থট চাইবেন না। যদি আপনার স্বচ্ছতার প্রয়োজন হয়, তাহলে একটি সংক্ষিপ্ত ন্যায্যতা বা মূল কারণগুলির একটি তালিকা চেয়ে নিন।
- সংবেদনশীল ডোমেইনগুলির জন্য, একটি নীতি লাইন অন্তর্ভুক্ত করুন: "যদি আপনি অনিশ্চিত হন বা কাজটি ক্ষতির কারণ হতে পারে, তাহলে স্পষ্টীকরণমূলক প্রশ্ন জিজ্ঞাসা করুন বা প্রত্যাখ্যান করুন।"
- সংখ্যাসূচক কাজের জন্য বৈধতা প্রম্পট যোগ করুন: "উত্তর দেওয়ার আগে পাটিগণিত দুবার পরীক্ষা করুন।"
এটি R1-স্টাইল মডেলগুলির জন্য সাধারণ সেরা অনুশীলন নির্দেশিকার প্রতিফলন করে: ন্যূনতম প্রম্পটিং, চেইন-অফ-থট উত্তোলনের এড়িয়ে যাওয়া এবং মডেলের অভ্যন্তরীণ যুক্তির উপর নির্ভর করা।
প্রম্পট লাইব্রেরি: কপি করার জন্য প্রস্তুত স্নিপেট
A) জটিল পরিকল্পনা (R1)
লক্ষ্য: ন্যূনতম চূর্ণন সহ ১,০০০ জন ব্যবহারকারীর জন্য ৬ সপ্তাহের একটি প্রোডাক্ট বিটা পরিকল্পনা করুন।
ফেরত দিন:
- মাইলস্টোন (সপ্তাহ-অনুসারে)
- প্রশমন (ঝুঁকি প্রতি একটি করে)
সীমাবদ্ধতা: মোট ২০০ শব্দের নিচে রাখুন।
### B) নীতি-সংবেদনশীল চ্যাট (v3)
সিস্টেম: আপনি একজন সহায়ক, নীতি-অনুগত সহকারী। যদি কোনো অনুরোধ নীতির সাথে সাংঘর্ষিক হয়, তাহলে একটি স্পষ্টীকরণমূলক প্রশ্ন জিজ্ঞাসা করুন বা একটি নিরাপদ বিকল্প দিন।
ব্যবহারকারী: বিলম্বিত অর্ডারের জন্য একটি রিফান্ড প্রতিক্রিয়া ড্রাফট করুন। সহানুভূতিশীল সুর বজায় রাখুন এবং দুটি বিকল্প দিন।
নিম্নলিখিতগুলি সমাধান করুন। চূড়ান্ত উত্তর এবং একটি ২-বাক্যের চেক দিন।
সমস্যা: {word problem}
আপনি একজন সিনিয়র পাইথন পর্যালোচক। কর্মক্ষমতা এবং পাঠযোগ্যতার জন্য স্নিপেটটি বিশ্লেষণ করুন।
ফেরত দিন:
- উদাহরণ রিফ্যাক্টর (<=৩০ লাইন)
### E) JSON-এ ডেটা নিষ্কাশন (v3)
সিস্টেম: শুধুমাত্র বৈধ JSON ফেরত দিন।
ব্যবহারকারী: টেক্সট থেকে কোম্পানি, রাজস্ব এবং সদর দফতর নিষ্কাশন করুন। অনুপস্থিত থাকলে, null ব্যবহার করুন।
স্কিমা: {"company":"string","revenue":"string|null","hq":"string|null"}
টেক্সট: {paste}
সমস্যা সমাধান: যখন আউটপুটগুলি সরে যায় বা হ্যালুসিনেট করে
- অতিরিক্ত শব্দবহুল? সর্বাধিক টোকেন কম করুন বা "সর্বোচ্চ ১২০ শব্দ" যোগ করুন।
- অसंगতিপূর্ণ ফরম্যাট? JSON-only সিস্টেম প্রম্পট এবং একটি স্টপ সিকোয়েন্স যোগ করুন।
- ভুল অনুমান? একটি লাইন সীমাবদ্ধতা যোগ করুন: "যদি অনিশ্চিত হন, তাহলে ১টি স্পষ্টীকরণমূলক প্রশ্ন জিজ্ঞাসা করুন।"
- গণিতের ভুল? "চূড়ান্ত উত্তরের আগে পাটিগণিত দুবার পরীক্ষা করুন" যোগ করুন।
- দুর্বল চেইন টাস্ক? দুটি কলে বিভক্ত করুন: পরিকল্পনা → সম্পাদন।
API কুইক স্টার্ট (ধারণাগত)
- এন্ডপয়েন্ট এবং কী ম্যানেজমেন্ট একটি OpenAI-স্টাইল ইন্টারফেস অনুসরণ করে।
model, messages, temperature, max_tokens, এবং স্ট্রিমিং বিকল্পগুলির মতো স্ট্যান্ডার্ড ক্ষেত্র আশা করুন।
- DeepSeek v3 এর নির্দিষ্টতা এবং কর্মক্ষমতা সম্পর্কিত দাবিগুলি অফিসিয়াল খবর/মডেল আপডেট এবং মডেল কার্ডগুলিতে সংক্ষিপ্ত করা হয়েছে।
লক্ষ্য করার মতো: প্রম্পট পুনরাবৃত্তির জন্য Sider.AI ব্যবহার করা
আপনি যদি দ্রুত প্যাটার্নগুলি অন্বেষণ করেন—জিরো-শট বনাম ফিউ-শট পরীক্ষা করা, ফরম্যাট টগল করা, অথবা R1 বনাম v3 প্রতিক্রিয়া তুলনা করা—একটি ওভারলে সহকারী লুপটিকে দ্রুত করতে পারে। যাইহোক, Sider.AI একটি একক কর্মপ্রবাহে পেজ এবং সরঞ্জাম জুড়ে প্রম্পট ড্রাফট, পুনরাবৃত্তি এবং A/B পরীক্ষা করা সহজ করে তোলে, যাতে আপনি আপনার কাজের জন্য সবচেয়ে ভালো কাজ করে এমন ন্যূনতম প্রম্পটে মনোযোগ দিতে পারেন। মূল বিষয়গুলো
- DeepSeek R1-এর জন্য ন্যূনতম, জিরো-শট প্রম্পট পছন্দ করুন; সুস্পষ্ট চেইন-অফ-থট অনুরোধগুলি এড়িয়ে চলুন।
- দ্রুত, স্কেলেবল চ্যাট এবং স্ট্রাকচার্ড কাজের জন্য DeepSeek v3 ব্যবহার করুন; নির্ভরযোগ্যতার জন্য সীমাবদ্ধ ফরম্যাটের উপর নির্ভর করুন।
- শুধুমাত্র সামঞ্জস্যপূর্ণ ব্যর্থতা সংশোধন করার জন্য ফিউ-শট উদাহরণ যোগ করুন।
- JSON স্কিমা, সংক্ষিপ্ত সিস্টেম প্রম্পট এবং স্টপ সিকোয়েন্স দিয়ে গঠন প্রয়োগ করুন।
- জটিল যুক্তির জন্য, সম্পূর্ণ যুক্তির লগ নয়, চূড়ান্ত উত্তরের সাথে সংক্ষিপ্ত ন্যায্যতা দেওয়ার কথা বলুন।
সাধারণ জিজ্ঞাসা
প্রশ্ন ১: কখন আমার DeepSeek v3 এর চেয়ে DeepSeek R1 বেছে নেওয়া উচিত?
মাল্টি-স্টেপ যুক্তি, জটিল পরিকল্পনা এবং গণিত/যুক্তি বিষয়ক কাজের জন্য DeepSeek R1 বেছে নিন। দ্রুত, সাধারণ চ্যাট, ড্রাফটিং, কোডিং সহায়তা এবং উচ্চ-থ্রুপুট পাইপলাইনের জন্য v3 বেছে নিন।
প্রশ্ন ২: DeepSeek R1 এর সাথে আমার কি চেইন-অফ-থট প্রম্পটিং ব্যবহার করা উচিত?
না। নির্দেশিকা সুস্পষ্ট চেইন-অফ-থট এড়িয়ে চলতে এবং মডেলের অন্তর্নির্মিত যুক্তির উপর নির্ভর করতে পরামর্শ দেয়। পরিবর্তে সংক্ষিপ্ত ন্যায্যতা সহ চূড়ান্ত উত্তরের জন্য জিজ্ঞাসা করুন।
প্রশ্ন ৩: আমি কিভাবে DeepSeek v3 থেকে সামঞ্জস্যপূর্ণ JSON পাব?
একটি সংক্ষিপ্ত সিস্টেম প্রম্পট ব্যবহার করুন যা শুধুমাত্র JSON বাধ্যতামূলক করে, একটি টাইট স্কিমা সংজ্ঞায়িত করুন এবং ঐচ্ছিকভাবে স্টপ সিকোয়েন্স সেট করুন। সরে যাওয়া সীমিত করতে তাপমাত্রা কম করুন এবং সর্বাধিক টোকেন ক্যাপ করুন।
প্রশ্ন ৪: যুক্তিতর্ক বিষয়ক কাজের জন্য আমার কী তাপমাত্রা ব্যবহার করা উচিত?
দৃঢ়তা এবং মূল্যায়নের জন্য প্রথমে কম (0.0–0.3) দিয়ে শুরু করুন। ড্রাফটিং বা কোডিংয়ে সুষম সৃজনশীলতার জন্য 0.4–0.7 এ বাড়ান; ব্রেইনস্টর্মিংয়ের জন্য উচ্চতর মান ব্যবহার করুন।
প্রশ্ন ৫: আমি কি স্থানীয়ভাবে DeepSeek মডেল চালাতে পারি?
পরীক্ষার জন্য কমিউনিটি সেটআপ বিদ্যমান, তবে উৎপাদন স্থিতিশীলতা এবং কর্মক্ষমতার জন্য প্রায়শই হোস্ট করা API ব্যবহার করে। স্থানীয় নির্দেশের জন্য মডেল কার্ড এবং কমিউনিটি গাইড দেখুন।