نحوه استفاده از DeepSeek v3 و R1: درخواستهای راهنمایی (Prompting) برای استدلال و وظایف چت
اگر تا به حال یک درخواست راهنمایی (prompt) را بیش از حد مهندسی کردهاید و پاسخ بدتری دریافت کردهاید، تنها نیستید. با مدلهای استدلالمحور مانند DeepSeek R1 و مدلهای چت با توان عملیاتی بالا مانند DeepSeek v3، روشهای قدیمی (درخواستهای طولانی، ترغیب سنگین زنجیره تفکر) اغلب نتیجه معکوس میدهند. این راهنما دقیقاً به شما نشان میدهد که چگونه DeepSeek v3 و R1 را برای وظایف استدلال و چت هدایت کنید—چه چیزهایی را ساده نگه دارید، چه زمانی داربستبندی (scaffold) کنید، و چگونه تنظیمات را برای نتایج پایدار و دقیق تنظیم کنید.
نکته سبک: عملی و راهحلمحور. ما بر روی چیزهایی که کار میکنند تمرکز خواهیم کرد، با الگوهای برش و چسباندن و محافظها.
- هنگامی که به استدلال چند مرحلهای قوی، اثباتها و برنامهریزی پیچیده نیاز دارید، از DeepSeek R1 استفاده کنید.
- از DeepSeek v3 برای چت سریع و دقیق، کمک کدنویسی، پیشنویسنویسی و پرسش و پاسخ عمومی در مقیاس بزرگ استفاده کنید.
- زنجیره تفکر را اجبار نکنید. در عوض، «پاسخهای نهایی»، «منطق مختصر» یا خروجیهای ساختاریافته را درخواست کنید.
- درخواستهای راهنمایی (prompt) را کوتاه و واضح نگه دارید؛ محدودیتها و معیارهای ارزیابی را فقط در صورت لزوم اضافه کنید.
- با رویکرد Zero-shot شروع کنید؛ مثالهای Few-shot را فقط در صورتی اضافه کنید که حالتهای شکست مداوم را مشاهده کنید.
تفاوت DeepSeek R1 و v3 در چیست
- DeepSeek R1: یک مدل بهینهسازیشده برای استدلال که برای «فکر کردن قبل از پاسخ دادن» طراحی شده است، و نیاز به درخواستهای گام به گام صریح را کاهش میدهد. بسیاری از پلتفرمها و اسناد توصیه میکنند از درخواستهای زنجیره تفکر اجتناب شود؛ رویکرد Zero-shot اغلب برای R1 بهترین کارایی را دارد.
- DeepSeek v3: یک مدل چت MoE سریع و قوی (در مجموع 671B پارامتر؛ 37B فعال در هر توکن) که هدف آن وظایف زبانی با هدف کلی با عملکرد هزینه عالی، ارگونومی API آشنا و کیفیت مدل مدرن است. اسناد رسمی استفاده از API به سبک OpenAI را نشان میدهند.
در عمل:
- R1 را برای موارد زیر انتخاب کنید: مسائل کلامی ریاضی، تجزیه و تحلیل استراتژی، برنامهریزی چند محدودیتی، استدلال دشوار با مراحل پنهان.
- v3 را برای موارد زیر انتخاب کنید: چت مشتری، بررسی کد، بازنویسی، خلاصهسازی و حلقههای تکرار سریع.
قانون طلایی: مدلهای استدلال را بیش از حد هدایت نکنید (Over-Prompt).
مدلهای استدلال مانند R1 از قبل بررسیهای داخلی را انجام میدهند. اجبار زنجیره تفکر («گام به گام فکر کنید و استدلال خود را نشان دهید») اغلب باعث اضافه شدن حاشیه میشود، میتواند مدل را منحرف کند و در برخی تنظیمات ممکن است دلسرد کننده باشد. در عوض، از این موارد استفاده کنید:
- «پاسخ نهایی و یک توضیح مختصر ارائه دهید.»
- «پاسخ را بدهید، سپس 3 عامل کلیدی که شما را به آنجا رساندند فهرست کنید.»
- «فقط نتیجه را به همراه یک توجیه 2 جملهای برگردانید.»
این با راهنماییهایی همسو است که درخواستهای ساده و Zero-shot میتوانند به اندازه دستورالعملهای گام به گام پیچیده برای R1 مؤثر—یا بهتر—باشند.
الگوهای درخواست راهنمایی (Prompting) که کار میکنند
1) Zero-Shot، مینیمالیستی (بهترین تلاش اول برای R1؛ عالی برای v3 نیز هست)
هدف: حل یک مسئله غیر بدیهی با حداقل محدودیتها.
الگوی درخواست راهنمایی (Prompt):
شما یک حلکننده مسئله دقیق هستید.
سوال: {task}
دستورالعملها: پاسخ نهایی و یک منطق مختصر (حداکثر 3 جمله) ارائه دهید.
چرا این کار میکند: این کار استدلال داخلی را تشویق میکند در حالی که خروجی را متمرکز و کوتاه نگه میدارد.
2) خروجی محدود (برای APIها، قابلیت اطمینان یا اتوماسیون)
زمانی استفاده کنید که به فرمتهای قابل پیشبینی نیاز دارید.
الگوی درخواست راهنمایی (Prompt):
سیستم: شما فقط باید JSON معتبر برگردانید.
کاربر: این سند را در 5 نکته خلاصه کنید با یک ریسک و یک فرصت.
JSON را برگردانید: {
"bullets": . یادداشتهای خبری/مدل، کارایی و مقیاس v3 را برجسته میکنند، در حالی که کارتهای مدل زمینه اضافی را ارائه میدهند.
انتخاب بین DeepSeek v3 و R1 بر اساس مورد استفاده
- چت پشتیبانی مشتری: v3 برای سرعت و هزینه؛ مثالهای Few-shot را برای لحن و رعایت سیاست اضافه کنید.
- جلسات توجیهی تحلیلگران و یادداشتهای تصمیمگیری: R1 برای استدلال با یکپارچگی بالاتر؛ محدودیت «منطق مختصر» را تنظیم کنید.
- بررسی کد و برنامههای بازسازی: v3 برای تکرار سریع عالی است؛ R1 زمانی که به استدلال عمیق در مورد مبادلات نیاز دارید.
- ریاضی، منطق، زمانبندی با محدودیتها: R1 معمولاً برتری دارد.
- خلاصهسازی در مقیاس بزرگ یا خطوط لوله بازنویسی: v3 برای توان عملیاتی.
برای آموزش ساخت با R1 در یک دستیار RAG، نوشتههای انجمن و آموزش را ببینید که الگوهای سرتاسری، مثالهای کدنویسیمحور برای v3 و آزمایشهای محلی از طریق پشتههای انجمن را نشان میدهند.
رسیدگی ایمن به محتوای استدلال
- درخواست زنجیره تفکر کامل را نکنید. اگر به شفافیت نیاز دارید، یک توجیه کوتاه یا لیستی از عوامل کلیدی را درخواست کنید.
- برای دامنههای حساس، یک خط مشی را درج کنید: «اگر مطمئن نیستید یا این وظیفه میتواند باعث آسیب شود، سؤالات توضیحی بپرسید یا از انجام آن خودداری کنید.»
- درخواستهای اعتبارسنجی را برای وظایف عددی اضافه کنید: «قبل از پاسخ دادن، محاسبات را دوباره بررسی کنید.»
این بازتابدهنده راهنماییهای رایج بهترین شیوه برای مدلهای سبک R1 است: درخواست راهنمایی (prompting) حداقلی، اجتناب از استخراج زنجیره تفکر و تکیه بر استدلال داخلی مدل.
کتابخانه درخواست راهنمایی (Prompt): قطعههای آماده کپی
الف) برنامهریزی پیچیده (R1)
هدف: برنامهریزی یک نسخه بتا محصول 6 هفتهای برای 1000 کاربر با حداقل ریزش.
بازگشت:
- ریسکهای کلیدی (حداکثر 5)
- کاهشها (یکی برای هر ریسک)
محدودیتها: مجموع را زیر 200 کلمه نگه دارید.
### ب) چت حساس به سیاست (v3)
سیستم: شما یک دستیار مفید و سازگار با سیاست هستید. اگر درخواستی با سیاست مغایرت دارد، یک سوال توضیحی بپرسید یا یک جایگزین ایمن ارائه دهید.
کاربر: یک پاسخ بازپرداخت برای یک سفارش تاخیری تهیه کنید. لحن همدلانه را حفظ کنید و دو گزینه ارائه دهید.
موارد زیر را حل کنید. پاسخ نهایی و یک بررسی 2 جملهای ارائه دهید.
مسئله: {word problem}
شما یک بازبین ارشد پایتون هستید. این قطعه کد را برای عملکرد و خوانایی تجزیه و تحلیل کنید.
بازگشت:
- اصلاحات (به صورت گلولهای)
### ه) استخراج داده به JSON (v3)
سیستم: فقط JSON معتبر را برگردانید.
کاربر: شرکت، درآمد و دفتر مرکزی را از متن استخراج کنید. اگر گم شده است، از null استفاده کنید.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
عیبیابی: چه زمانی خروجیها منحرف میشوند یا توهم میزنند
- بیش از حد پرحرف؟ حداکثر توکنها را کاهش دهید یا «حداکثر 120 کلمه» را اضافه کنید.
- فرمت ناسازگار؟ یک درخواست راهنمایی (prompt) سیستم فقط JSON و یک توالی توقف اضافه کنید.
- فرضیات اشتباه؟ یک محدودیت یک خطی اضافه کنید: «اگر مطمئن نیستید، 1 سوال توضیحی بپرسید.»
- خطاهای ریاضی؟ «قبل از پاسخ نهایی، محاسبات را دوباره بررسی کنید» را اضافه کنید.
- وظایف زنجیرهای شکننده؟ به دو تماس تقسیم کنید: برنامهریزی ← اجرا.
شروع سریع API (مفهومی)
- مدیریت نقطه پایانی و کلید از یک رابط به سبک OpenAI پیروی میکند. انتظار فیلدهای استاندارد مانند
model، messages، temperature، max_tokens و گزینههای پخش جریانی را داشته باشید.
- ویژگیها و ادعاهای عملکرد خاص DeepSeek v3 در اخبار/بهروزرسانی مدل رسمی و کارتهای مدل خلاصه شدهاند.
ارزش توجه: استفاده از Sider.AI برای تکرار درخواست راهنمایی (Prompt)
اگر به سرعت در حال بررسی الگوها هستید—آزمایش Zero-shot در مقابل Few-shot، تغییر فرمتها یا مقایسه پاسخهای R1 در مقابل v3—یک دستیار پوششی میتواند حلقه را سرعت بخشد. به هر حال، Sider.AI پیشنویسنویسی، تکرار و A/B درخواستهای راهنمایی (prompt) را در صفحات و ابزارها در یک گردش کار آسان میکند، بنابراین میتوانید روی حداقل درخواست راهنمایی (prompt) که بهترین کار را برای کار شما انجام میدهد، تمرکز کنید. نکات کلیدی
- درخواستهای راهنمایی (prompt) حداقلی و Zero-shot را برای DeepSeek R1 ترجیح دهید؛ از درخواستهای صریح زنجیره تفکر اجتناب کنید.
- از DeepSeek v3 برای چت سریع و مقیاسپذیر و وظایف ساختاریافته استفاده کنید؛ برای قابلیت اطمینان به فرمتهای محدود تکیه کنید.
- مثالهای Few-shot را فقط برای تصحیح حالتهای شکست مداوم اضافه کنید.
- ساختار را با طرحوارههای JSON، درخواستهای راهنمایی (prompt) سیستم کوتاه و توالیهای توقف اعمال کنید.
- برای استدلال پیچیده، پاسخهای نهایی به همراه توجیهات مختصر—نه گزارشهای استدلال کامل—درخواست کنید.
سوالات متداول
سوال 1: چه زمانی باید DeepSeek R1 را به DeepSeek v3 ترجیح دهم؟
DeepSeek R1 را برای استدلال چند مرحلهای، برنامهریزی پیچیده و وظایف ریاضی/منطقی انتخاب کنید. v3 را برای چت سریع و عمومی، پیشنویسنویسی، کمک کدنویسی و خطوط لوله با توان عملیاتی بالا انتخاب کنید.
سوال 2: آیا باید از درخواست راهنمایی (prompting) زنجیره تفکر با DeepSeek R1 استفاده کنم؟
نه. راهنماییها نشان میدهد که از زنجیره تفکر صریح اجتناب کنید و به استدلال داخلی مدل تکیه کنید. در عوض، پاسخهای نهایی را با توجیهات مختصر درخواست کنید.
سوال 3: چگونه JSON سازگار را از DeepSeek v3 دریافت کنم؟
از یک درخواست راهنمایی (prompt) سیستم کوتاه استفاده کنید که فقط JSON را اجباری میکند، یک طرحواره (schema) محکم تعریف کنید و به صورت اختیاری توالیهای توقف را تنظیم کنید. دما را کاهش دهید و حداکثر توکنها را برای محدود کردن انحراف محدود کنید.
سوال 4: از چه دمایی باید برای وظایف استدلال استفاده کنم؟
برای قطعیت و ارزیابی، از کم شروع کنید (0.0–0.3). برای خلاقیت متعادل در پیشنویسنویسی یا کدنویسی، آن را به 0.4–0.7 افزایش دهید؛ از مقادیر بالاتر برای طوفان فکری استفاده کنید.
سوال 5: آیا میتوانم مدلهای DeepSeek را به صورت محلی اجرا کنم؟
تنظیمات انجمن برای آزمایش وجود دارد، اما تولید اغلب از APIهای میزبانی شده برای ثبات و عملکرد استفاده میکند. کارتهای مدل و راهنماهای انجمن را برای دستورالعملهای محلی بررسی کنید.