When should I choose DeepSeek R1 over DeepSeek v3?

Pick DeepSeek R1 for multi‑step reasoning, complex planning, and math/logic tasks. Choose v3 for fast, general chat, drafting, coding assistance, and high‑throughput pipelines.

Should I use chain‑of‑thought prompting with DeepSeek R1?

No. Guidance suggests avoiding explicit chain‑of‑thought and relying on the model’s built‑in reasoning. Ask for final answers with brief justifications instead.

How do I get consistent JSON from DeepSeek v3?

Use a short system prompt that mandates JSON only, define a tight schema, and optionally set stop sequences. Lower temperature and cap max tokens to limit drift.

What temperature should I use for reasoning tasks?

Start low (0.0–0.3) for determinism and evaluation. Raise to 0.4–0.7 for balanced creativity in drafting or coding; use higher values for brainstorming.

Can I run DeepSeek models locally?

Community setups exist for experimentation, but production often uses hosted APIs for stability and performance. Check model cards and community guides for local instructions.

نحوه استفاده از DeepSeek v3 و R1: درخواست‌های راهنمایی (Prompting) برای استدلال و وظایف چت

اگر تا به حال یک درخواست راهنمایی (prompt) را بیش از حد مهندسی کرده‌اید و پاسخ بدتری دریافت کرده‌اید، تنها نیستید. با مدل‌های استدلال‌محور مانند DeepSeek R1 و مدل‌های چت با توان عملیاتی بالا مانند DeepSeek v3، روش‌های قدیمی (درخواست‌های طولانی، ترغیب سنگین زنجیره تفکر) اغلب نتیجه معکوس می‌دهند. این راهنما دقیقاً به شما نشان می‌دهد که چگونه DeepSeek v3 و R1 را برای وظایف استدلال و چت هدایت کنید—چه چیزهایی را ساده نگه دارید، چه زمانی داربست‌بندی (scaffold) کنید، و چگونه تنظیمات را برای نتایج پایدار و دقیق تنظیم کنید.

نکته سبک: عملی و راه‌حل‌محور. ما بر روی چیزهایی که کار می‌کنند تمرکز خواهیم کرد، با الگوهای برش و چسباندن و محافظ‌ها.

هنگامی که به استدلال چند مرحله‌ای قوی، اثبات‌ها و برنامه‌ریزی پیچیده نیاز دارید، از DeepSeek R1 استفاده کنید.

از DeepSeek v3 برای چت سریع و دقیق، کمک کدنویسی، پیش‌نویس‌نویسی و پرسش و پاسخ عمومی در مقیاس بزرگ استفاده کنید.

زنجیره تفکر را اجبار نکنید. در عوض، «پاسخ‌های نهایی»، «منطق مختصر» یا خروجی‌های ساختاریافته را درخواست کنید.

درخواست‌های راهنمایی (prompt) را کوتاه و واضح نگه دارید؛ محدودیت‌ها و معیارهای ارزیابی را فقط در صورت لزوم اضافه کنید.

با رویکرد Zero-shot شروع کنید؛ مثال‌های Few-shot را فقط در صورتی اضافه کنید که حالت‌های شکست مداوم را مشاهده کنید.

تفاوت DeepSeek R1 و v3 در چیست

DeepSeek R1: یک مدل بهینه‌سازی‌شده برای استدلال که برای «فکر کردن قبل از پاسخ دادن» طراحی شده است، و نیاز به درخواست‌های گام به گام صریح را کاهش می‌دهد. بسیاری از پلتفرم‌ها و اسناد توصیه می‌کنند از درخواست‌های زنجیره تفکر اجتناب شود؛ رویکرد Zero-shot اغلب برای R1 بهترین کارایی را دارد.

DeepSeek v3: یک مدل چت MoE سریع و قوی (در مجموع 671B پارامتر؛ 37B فعال در هر توکن) که هدف آن وظایف زبانی با هدف کلی با عملکرد هزینه عالی، ارگونومی API آشنا و کیفیت مدل مدرن است. اسناد رسمی استفاده از API به سبک OpenAI را نشان می‌دهند.

در عمل:

R1 را برای موارد زیر انتخاب کنید: مسائل کلامی ریاضی، تجزیه و تحلیل استراتژی، برنامه‌ریزی چند محدودیتی، استدلال دشوار با مراحل پنهان.

v3 را برای موارد زیر انتخاب کنید: چت مشتری، بررسی کد، بازنویسی، خلاصه‌سازی و حلقه‌های تکرار سریع.

قانون طلایی: مدل‌های استدلال را بیش از حد هدایت نکنید (Over-Prompt).

مدل‌های استدلال مانند R1 از قبل بررسی‌های داخلی را انجام می‌دهند. اجبار زنجیره تفکر («گام به گام فکر کنید و استدلال خود را نشان دهید») اغلب باعث اضافه شدن حاشیه می‌شود، می‌تواند مدل را منحرف کند و در برخی تنظیمات ممکن است دلسرد کننده باشد. در عوض، از این موارد استفاده کنید:

«پاسخ نهایی و یک توضیح مختصر ارائه دهید.»

«پاسخ را بدهید، سپس 3 عامل کلیدی که شما را به آنجا رساندند فهرست کنید.»

«فقط نتیجه را به همراه یک توجیه 2 جمله‌ای برگردانید.»

این با راهنمایی‌هایی همسو است که درخواست‌های ساده و Zero-shot می‌توانند به اندازه دستورالعمل‌های گام به گام پیچیده برای R1 مؤثر—یا بهتر—باشند.

الگوهای درخواست راهنمایی (Prompting) که کار می‌کنند

1) Zero-Shot، مینیمالیستی (بهترین تلاش اول برای R1؛ عالی برای v3 نیز هست)

هدف: حل یک مسئله غیر بدیهی با حداقل محدودیت‌ها.

الگوی درخواست راهنمایی (Prompt):

شما یک حل‌کننده مسئله دقیق هستید.
سوال: {task}
دستورالعمل‌ها: پاسخ نهایی و یک منطق مختصر (حداکثر 3 جمله) ارائه دهید.

چرا این کار می‌کند: این کار استدلال داخلی را تشویق می‌کند در حالی که خروجی را متمرکز و کوتاه نگه می‌دارد.

2) خروجی محدود (برای APIها، قابلیت اطمینان یا اتوماسیون)

زمانی استفاده کنید که به فرمت‌های قابل پیش‌بینی نیاز دارید.

الگوی درخواست راهنمایی (Prompt):

سیستم: شما فقط باید JSON معتبر برگردانید.
کاربر: این سند را در 5 نکته خلاصه کنید با یک ریسک و یک فرصت.
JSON را برگردانید: {
"bullets": . یادداشت‌های خبری/مدل، کارایی و مقیاس v3 را برجسته می‌کنند، در حالی که کارت‌های مدل زمینه اضافی را ارائه می‌دهند.

انتخاب بین DeepSeek v3 و R1 بر اساس مورد استفاده

چت پشتیبانی مشتری: v3 برای سرعت و هزینه؛ مثال‌های Few-shot را برای لحن و رعایت سیاست اضافه کنید.

جلسات توجیهی تحلیلگران و یادداشت‌های تصمیم‌گیری: R1 برای استدلال با یکپارچگی بالاتر؛ محدودیت «منطق مختصر» را تنظیم کنید.

بررسی کد و برنامه‌های بازسازی: v3 برای تکرار سریع عالی است؛ R1 زمانی که به استدلال عمیق در مورد مبادلات نیاز دارید.

ریاضی، منطق، زمان‌بندی با محدودیت‌ها: R1 معمولاً برتری دارد.

خلاصه‌سازی در مقیاس بزرگ یا خطوط لوله بازنویسی: v3 برای توان عملیاتی.

برای آموزش ساخت با R1 در یک دستیار RAG، نوشته‌های انجمن و آموزش را ببینید که الگوهای سرتاسری، مثال‌های کدنویسی‌محور برای v3 و آزمایش‌های محلی از طریق پشته‌های انجمن را نشان می‌دهند.

رسیدگی ایمن به محتوای استدلال

درخواست زنجیره تفکر کامل را نکنید. اگر به شفافیت نیاز دارید، یک توجیه کوتاه یا لیستی از عوامل کلیدی را درخواست کنید.

برای دامنه‌های حساس، یک خط مشی را درج کنید: «اگر مطمئن نیستید یا این وظیفه می‌تواند باعث آسیب شود، سؤالات توضیحی بپرسید یا از انجام آن خودداری کنید.»

درخواست‌های اعتبارسنجی را برای وظایف عددی اضافه کنید: «قبل از پاسخ دادن، محاسبات را دوباره بررسی کنید.»

این بازتاب‌دهنده راهنمایی‌های رایج بهترین شیوه برای مدل‌های سبک R1 است: درخواست راهنمایی (prompting) حداقلی، اجتناب از استخراج زنجیره تفکر و تکیه بر استدلال داخلی مدل.

کتابخانه درخواست راهنمایی (Prompt): قطعه‌های آماده کپی

الف) برنامه‌ریزی پیچیده (R1)

هدف: برنامه‌ریزی یک نسخه بتا محصول 6 هفته‌ای برای 1000 کاربر با حداقل ریزش. بازگشت:

نقاط عطف (هفته به هفته)

ریسک‌های کلیدی (حداکثر 5)

کاهش‌ها (یکی برای هر ریسک) محدودیت‌ها: مجموع را زیر 200 کلمه نگه دارید.


### ب) چت حساس به سیاست (v3)

سیستم: شما یک دستیار مفید و سازگار با سیاست هستید. اگر درخواستی با سیاست مغایرت دارد، یک سوال توضیحی بپرسید یا یک جایگزین ایمن ارائه دهید. کاربر: یک پاسخ بازپرداخت برای یک سفارش تاخیری تهیه کنید. لحن همدلانه را حفظ کنید و دو گزینه ارائه دهید.


### ج) ریاضی/منطق (R1)

موارد زیر را حل کنید. پاسخ نهایی و یک بررسی 2 جمله‌ای ارائه دهید. مسئله: {word problem}


### د) بررسی کد (v3)

شما یک بازبین ارشد پایتون هستید. این قطعه کد را برای عملکرد و خوانایی تجزیه و تحلیل کنید. بازگشت:

مسائل (به صورت گلوله‌ای)

اصلاحات (به صورت گلوله‌ای)

مثال بازسازی (<=30 خط)


### ه) استخراج داده به JSON (v3)

سیستم: فقط JSON معتبر را برگردانید. کاربر: شرکت، درآمد و دفتر مرکزی را از متن استخراج کنید. اگر گم شده است، از null استفاده کنید. Schema: {"company":"string","revenue":"string|null","hq":"string|null"} Text: {paste}

عیب‌یابی: چه زمانی خروجی‌ها منحرف می‌شوند یا توهم می‌زنند

بیش از حد پرحرف؟ حداکثر توکن‌ها را کاهش دهید یا «حداکثر 120 کلمه» را اضافه کنید.

فرمت ناسازگار؟ یک درخواست راهنمایی (prompt) سیستم فقط JSON و یک توالی توقف اضافه کنید.

فرضیات اشتباه؟ یک محدودیت یک خطی اضافه کنید: «اگر مطمئن نیستید، 1 سوال توضیحی بپرسید.»

خطاهای ریاضی؟ «قبل از پاسخ نهایی، محاسبات را دوباره بررسی کنید» را اضافه کنید.

وظایف زنجیره‌ای شکننده؟ به دو تماس تقسیم کنید: برنامه‌ریزی ← اجرا.

شروع سریع API (مفهومی)

مدیریت نقطه پایانی و کلید از یک رابط به سبک OpenAI پیروی می‌کند. انتظار فیلدهای استاندارد مانند model، messages، temperature، max_tokens و گزینه‌های پخش جریانی را داشته باشید.

ویژگی‌ها و ادعاهای عملکرد خاص DeepSeek v3 در اخبار/به‌روزرسانی مدل رسمی و کارت‌های مدل خلاصه شده‌اند.

ارزش توجه: استفاده از Sider.AI برای تکرار درخواست راهنمایی (Prompt)

اگر به سرعت در حال بررسی الگوها هستید—آزمایش Zero-shot در مقابل Few-shot، تغییر فرمت‌ها یا مقایسه پاسخ‌های R1 در مقابل v3—یک دستیار پوششی می‌تواند حلقه را سرعت بخشد. به هر حال، Sider.AI پیش‌نویس‌نویسی، تکرار و A/B درخواست‌های راهنمایی (prompt) را در صفحات و ابزارها در یک گردش کار آسان می‌کند، بنابراین می‌توانید روی حداقل درخواست راهنمایی (prompt) که بهترین کار را برای کار شما انجام می‌دهد، تمرکز کنید.

نکات کلیدی

درخواست‌های راهنمایی (prompt) حداقلی و Zero-shot را برای DeepSeek R1 ترجیح دهید؛ از درخواست‌های صریح زنجیره تفکر اجتناب کنید.

از DeepSeek v3 برای چت سریع و مقیاس‌پذیر و وظایف ساختاریافته استفاده کنید؛ برای قابلیت اطمینان به فرمت‌های محدود تکیه کنید.

مثال‌های Few-shot را فقط برای تصحیح حالت‌های شکست مداوم اضافه کنید.

ساختار را با طرحواره‌های JSON، درخواست‌های راهنمایی (prompt) سیستم کوتاه و توالی‌های توقف اعمال کنید.

برای استدلال پیچیده، پاسخ‌های نهایی به همراه توجیهات مختصر—نه گزارش‌های استدلال کامل—درخواست کنید.

سوالات متداول

سوال 1: چه زمانی باید DeepSeek R1 را به DeepSeek v3 ترجیح دهم؟ DeepSeek R1 را برای استدلال چند مرحله‌ای، برنامه‌ریزی پیچیده و وظایف ریاضی/منطقی انتخاب کنید. v3 را برای چت سریع و عمومی، پیش‌نویس‌نویسی، کمک کدنویسی و خطوط لوله با توان عملیاتی بالا انتخاب کنید.

سوال 2: آیا باید از درخواست راهنمایی (prompting) زنجیره تفکر با DeepSeek R1 استفاده کنم؟ نه. راهنمایی‌ها نشان می‌دهد که از زنجیره تفکر صریح اجتناب کنید و به استدلال داخلی مدل تکیه کنید. در عوض، پاسخ‌های نهایی را با توجیهات مختصر درخواست کنید.

سوال 3: چگونه JSON سازگار را از DeepSeek v3 دریافت کنم؟ از یک درخواست راهنمایی (prompt) سیستم کوتاه استفاده کنید که فقط JSON را اجباری می‌کند، یک طرحواره (schema) محکم تعریف کنید و به صورت اختیاری توالی‌های توقف را تنظیم کنید. دما را کاهش دهید و حداکثر توکن‌ها را برای محدود کردن انحراف محدود کنید.

سوال 4: از چه دمایی باید برای وظایف استدلال استفاده کنم؟ برای قطعیت و ارزیابی، از کم شروع کنید (0.0–0.3). برای خلاقیت متعادل در پیش‌نویس‌نویسی یا کدنویسی، آن را به 0.4–0.7 افزایش دهید؛ از مقادیر بالاتر برای طوفان فکری استفاده کنید.

سوال 5: آیا می‌توانم مدل‌های DeepSeek را به صورت محلی اجرا کنم؟ تنظیمات انجمن برای آزمایش وجود دارد، اما تولید اغلب از APIهای میزبانی شده برای ثبات و عملکرد استفاده می‌کند. کارت‌های مدل و راهنماهای انجمن را برای دستورالعمل‌های محلی بررسی کنید.