When should I choose DeepSeek R1 over DeepSeek v3?

Pick DeepSeek R1 for multi‑step reasoning, complex planning, and math/logic tasks. Choose v3 for fast, general chat, drafting, coding assistance, and high‑throughput pipelines.

Should I use chain‑of‑thought prompting with DeepSeek R1?

No. Guidance suggests avoiding explicit chain‑of‑thought and relying on the model’s built‑in reasoning. Ask for final answers with brief justifications instead.

How do I get consistent JSON from DeepSeek v3?

Use a short system prompt that mandates JSON only, define a tight schema, and optionally set stop sequences. Lower temperature and cap max tokens to limit drift.

What temperature should I use for reasoning tasks?

Start low (0.0–0.3) for determinism and evaluation. Raise to 0.4–0.7 for balanced creativity in drafting or coding; use higher values for brainstorming.

Can I run DeepSeek models locally?

Community setups exist for experimentation, but production often uses hosted APIs for stability and performance. Check model cards and community guides for local instructions.

如何使用 DeepSeek v3 和 R1：用于推理和聊天任务的提示工程

如果您曾经过度设计提示，结果却得到了更糟糕的答案，那么您并不孤单。对于像 DeepSeek R1 这样以推理为主的模型，以及像 DeepSeek v3 这样高吞吐量的聊天模型，旧的套路（长提示、大量的思维链引导）往往会适得其反。本指南将准确地向您展示如何提示 DeepSeek v3 和 R1 来完成推理和聊天任务——哪些应该保持简单，何时应该搭建框架，以及如何调整设置以获得稳定、准确的结果。

风格说明：实用且以解决方案为导向。我们将专注于有效的方法，提供可剪切粘贴的模式和保障措施。

当您需要强大的多步骤推理、证明和复杂的规划时，请使用 DeepSeek R1。

对于快速、准确的聊天、编码辅助、起草和大规模的通用问答，请使用 DeepSeek v3。

不要强迫思维链。而是要求“最终答案”、“简要理由”或结构化输出。

保持提示简短明了；仅在必要时添加约束和评估标准。

从零样本开始；仅当您看到一致的失败模式时才添加少量样本示例。

DeepSeek R1 与 v3 的区别

DeepSeek R1：一种针对推理优化的模型，旨在“先思考再回答”，从而减少了对显式逐步提示的需求。许多平台和文档建议避免思维链的要求；零样本通常最适合 R1,,。

DeepSeek v3：一种快速、强大的 MoE 聊天模型（总共 671B 参数；每个 token 激活 37B），旨在以出色的成本效益、熟悉的 API 人体工程学和现代模型质量来完成通用语言任务,。官方文档显示了 OpenAI 风格的 API 用法。

在实践中：

选择 R1 用于：数学应用题、策略分解、多约束规划、具有潜在步骤的棘手推理。

选择 v3 用于：客户聊天、代码审查、重写、摘要和快速迭代循环。

黄金法则：不要过度提示推理模型

像 R1 这样的推理模型已经执行内部审议。强迫思维链（“逐步思考并展示您的推理”）通常会增加冗长性，可能会分散模型的注意力，并且在某些设置中可能不鼓励这样做。相反，请使用：

“提供最终答案和一个简短的解释。”

“给出答案，然后列出导致您得出该答案的 3 个关键因素。”

“仅返回结果以及 2 句话的理由。”

这与简单的零样本提示与 R1 的复杂逐步指令一样有效（甚至更好）的指导一致,,。

有效的提示模式

1) 零样本，极简主义（R1 的最佳首次尝试；也适用于 v3）

目标：以最小的约束解决一个重要的难题。

提示模板：

你是一个细心的解决问题者。
问题：{task}
说明：提供最终答案和简洁的理由（最多 3 句话）。

为什么有效：它鼓励内部推理，同时保持输出集中和简短。

2) 约束输出（用于 API、可靠性或自动化）

当您需要可预测的格式时使用。

提示模板：

系统：您必须仅返回有效的 JSON。
用户：用 5 个要点概括本文档，并包含一个风险和一个机会。
返回 JSON：{
"bullets": . News/model notes highlight v3’s efficiency and scale, while model cards provide additional context.

根据用例选择 DeepSeek v3 和 R1

客户支持聊天：v3 用于速度和成本；添加少量示例以符合语气和策略。

分析师简报和决策备忘录：R1 用于更高完整性的推理；设置“简要理由”约束。

代码审查和重构计划：v3 非常适合快速迭代；当您需要对权衡进行深入推理时，选择 R1。

具有约束的数学、逻辑、调度：R1 通常表现出色。

大规模摘要或重写管道：v3 用于吞吐量。

有关在 RAG 助手中使用 R1 构建的教程，请参阅社区和教程文章，其中展示了端到端模式、面向编码的 v3 示例以及通过社区堆栈进行的本地实验。

安全处理推理内容

不要要求完整的思维链。如果您需要透明度，请请求简短的理由或关键因素列表。

对于敏感领域，请包含策略行：“如果您不确定或任务可能造成危害，请提出澄清问题或拒绝。”

为数值任务添加验证提示：“在回答之前仔细检查算术。”

这反映了 R1 风格模型的常见最佳实践指导：最小提示、避免引发思维链，并依赖于模型的内部推理,,。

提示库：可复制的片段

A) 复杂规划 (R1)

目标：为 1,000 名用户规划一个为期 6 周的产品 beta 版，并尽量减少流失。返回：

里程碑（按周）

主要风险（最多 5 个）

缓解措施（每个风险一项）约束：总字数控制在 200 字以内。


### B) 策略敏感型聊天 (v3)

系统：你是一个有帮助的、符合策略的助手。如果请求与策略冲突，请提出澄清问题或提供安全的替代方案。用户：为延迟的订单起草退款回复。保持同情语气并提供两个选项。


### C) 数学/逻辑 (R1)

解决以下问题。提供最终答案和 2 句话的检查。问题：{word problem}


### D) 代码审查 (v3)

你是一位资深的 Python 审查员。分析代码片段的性能和可读性。返回：

问题（要点）

修复（要点）

示例重构（<=30 行）


### E) 数据提取到 JSON (v3)

系统：仅返回有效的 JSON。用户：从文本中提取公司、收入和总部。如果缺少，请使用 null。 Schema: {"company":"string","revenue":"string|null","hq":"string|null"} Text: {paste}

故障排除：当输出漂移或产生幻觉时

过于冗长？降低最大 token 数或添加“最多 120 个字”。

格式不一致？添加仅 JSON 系统提示和停止序列。

错误的假设？添加一行约束：“如果不确定，请提出 1 个澄清问题。”

数学错误？添加“在最终回答之前仔细检查算术。”

脆弱的链式任务？分成两个调用：计划 → 执行。

API 快速入门（概念）

端点和密钥管理遵循 OpenAI 风格的界面。期望有标准字段，如 model、messages、temperature、max_tokens 和流式传输选项。

DeepSeek v3 的具体细节和性能声明在官方新闻/模型更新和模型卡中进行了总结。

值得注意的是：使用 Sider.AI 进行提示迭代

如果您正在快速探索模式——测试零样本与少量样本、切换格式或比较 R1 与 v3 响应——叠加助手可以加快循环。顺便说一句，Sider.AI 可以轻松地在单个工作流程中跨页面和工具起草、迭代和 A/B 提示，因此您可以专注于最适合您任务的最小提示。

主要收获

对于 DeepSeek R1，首选最小的零样本提示；避免明确的思维链请求,,。

使用 DeepSeek v3 进行快速、可扩展的聊天和结构化任务；依靠约束格式来提高可靠性,,。

仅添加少量示例以纠正一致的失败模式。

使用 JSON 模式、简短的系统提示和停止序列来强制执行结构。

对于复杂的推理，要求提供最终答案加上简要理由，而不是完整的推理日志。

常见问题解答

Q1：我应该何时选择 DeepSeek R1 而不是 DeepSeek v3？对于多步骤推理、复杂规划和数学/逻辑任务，请选择 DeepSeek R1。对于快速、通用的聊天、起草、编码辅助和高吞吐量管道，请选择 v3。

Q2：我应该将思维链提示与 DeepSeek R1 一起使用吗？不。指南建议避免明确的思维链，而依赖于模型内置的推理。而是要求提供最终答案和简要理由。

Q3：如何从 DeepSeek v3 获得一致的 JSON？使用强制仅使用 JSON 的简短系统提示，定义严格的模式，并可选择设置停止序列。降低温度并限制最大 token 数以限制漂移。

Q4：推理任务应该使用什么温度？对于确定性和评估，从低值 (0.0–0.3) 开始。对于起草或编码中的平衡创造力，提高到 0.4–0.7；对于头脑风暴，使用更高的值。

Q5：我可以在本地运行 DeepSeek 模型吗？社区设置可用于实验，但生产通常使用托管 API 来实现稳定性和性能。查看模型卡和社区指南以获取本地说明。

如何使用 DeepSeek v3 和 R1：推理和聊天任务的 Prompt 技巧