如何使用 DeepSeek v3 和 R1:用于推理和聊天任务的提示工程
如果您曾经过度设计提示,结果却得到了更糟糕的答案,那么您并不孤单。对于像 DeepSeek R1 这样以推理为主的模型,以及像 DeepSeek v3 这样高吞吐量的聊天模型,旧的套路(长提示、大量的思维链引导)往往会适得其反。本指南将准确地向您展示如何提示 DeepSeek v3 和 R1 来完成推理和聊天任务——哪些应该保持简单,何时应该搭建框架,以及如何调整设置以获得稳定、准确的结果。
风格说明:实用且以解决方案为导向。我们将专注于有效的方法,提供可剪切粘贴的模式和保障措施。
- 当您需要强大的多步骤推理、证明和复杂的规划时,请使用 DeepSeek R1。
- 对于快速、准确的聊天、编码辅助、起草和大规模的通用问答,请使用 DeepSeek v3。
- 不要强迫思维链。而是要求“最终答案”、“简要理由”或结构化输出。
- 从零样本开始;仅当您看到一致的失败模式时才添加少量样本示例。
DeepSeek R1 与 v3 的区别
- DeepSeek R1:一种针对推理优化的模型,旨在“先思考再回答”,从而减少了对显式逐步提示的需求。许多平台和文档建议避免思维链的要求;零样本通常最适合 R1,,。
- DeepSeek v3:一种快速、强大的 MoE 聊天模型(总共 671B 参数;每个 token 激活 37B),旨在以出色的成本效益、熟悉的 API 人体工程学和现代模型质量来完成通用语言任务,。官方文档显示了 OpenAI 风格的 API 用法。
在实践中:
- 选择 R1 用于:数学应用题、策略分解、多约束规划、具有潜在步骤的棘手推理。
- 选择 v3 用于:客户聊天、代码审查、重写、摘要和快速迭代循环。
黄金法则:不要过度提示推理模型
像 R1 这样的推理模型已经执行内部审议。强迫思维链(“逐步思考并展示您的推理”)通常会增加冗长性,可能会分散模型的注意力,并且在某些设置中可能不鼓励这样做。相反,请使用:
- “给出答案,然后列出导致您得出该答案的 3 个关键因素。”
这与简单的零样本提示与 R1 的复杂逐步指令一样有效(甚至更好)的指导一致,,。
有效的提示模式
1) 零样本,极简主义(R1 的最佳首次尝试;也适用于 v3)
目标:以最小的约束解决一个重要的难题。
提示模板:
你是一个细心的解决问题者。
问题:{task}
说明:提供最终答案和简洁的理由(最多 3 句话)。
为什么有效:它鼓励内部推理,同时保持输出集中和简短。
2) 约束输出(用于 API、可靠性或自动化)
当您需要可预测的格式时使用。
提示模板:
系统:您必须仅返回有效的 JSON。
用户:用 5 个要点概括本文档,并包含一个风险和一个机会。
返回 JSON:{
"bullets": . News/model notes highlight v3’s efficiency and scale, while model cards provide additional context.
根据用例选择 DeepSeek v3 和 R1
- 客户支持聊天:v3 用于速度和成本;添加少量示例以符合语气和策略。
- 分析师简报和决策备忘录:R1 用于更高完整性的推理;设置“简要理由”约束。
- 代码审查和重构计划:v3 非常适合快速迭代;当您需要对权衡进行深入推理时,选择 R1。
有关在 RAG 助手中使用 R1 构建的教程,请参阅社区和教程文章,其中展示了端到端模式、面向编码的 v3 示例以及通过社区堆栈进行的本地实验。
安全处理推理内容
- 不要要求完整的思维链。如果您需要透明度,请请求简短的理由或关键因素列表。
- 对于敏感领域,请包含策略行:“如果您不确定或任务可能造成危害,请提出澄清问题或拒绝。”
- 为数值任务添加验证提示:“在回答之前仔细检查算术。”
这反映了 R1 风格模型的常见最佳实践指导:最小提示、避免引发思维链,并依赖于模型的内部推理,,。
提示库:可复制的片段
A) 复杂规划 (R1)
目标:为 1,000 名用户规划一个为期 6 周的产品 beta 版,并尽量减少流失。
返回:
- 缓解措施(每个风险一项)
约束:总字数控制在 200 字以内。
系统:你是一个有帮助的、符合策略的助手。如果请求与策略冲突,请提出澄清问题或提供安全的替代方案。
用户:为延迟的订单起草退款回复。保持同情语气并提供两个选项。
解决以下问题。提供最终答案和 2 句话的检查。
问题:{word problem}
你是一位资深的 Python 审查员。分析代码片段的性能和可读性。
返回:
系统:仅返回有效的 JSON。
用户:从文本中提取公司、收入和总部。如果缺少,请使用 null。
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
故障排除:当输出漂移或产生幻觉时
- 过于冗长?降低最大 token 数或添加“最多 120 个字”。
- 格式不一致?添加仅 JSON 系统提示和停止序列。
- 错误的假设?添加一行约束:“如果不确定,请提出 1 个澄清问题。”
API 快速入门(概念)
- 端点和密钥管理遵循 OpenAI 风格的界面。期望有标准字段,如
model、messages、temperature、max_tokens 和流式传输选项。
- DeepSeek v3 的具体细节和性能声明在官方新闻/模型更新和模型卡中进行了总结。
值得注意的是:使用 Sider.AI 进行提示迭代
如果您正在快速探索模式——测试零样本与少量样本、切换格式或比较 R1 与 v3 响应——叠加助手可以加快循环。顺便说一句,Sider.AI 可以轻松地在单个工作流程中跨页面和工具起草、迭代和 A/B 提示,因此您可以专注于最适合您任务的最小提示。 主要收获
- 对于 DeepSeek R1,首选最小的零样本提示;避免明确的思维链请求,,。
- 使用 DeepSeek v3 进行快速、可扩展的聊天和结构化任务;依靠约束格式来提高可靠性,,。
- 使用 JSON 模式、简短的系统提示和停止序列来强制执行结构。
- 对于复杂的推理,要求提供最终答案加上简要理由,而不是完整的推理日志。
常见问题解答
Q1:我应该何时选择 DeepSeek R1 而不是 DeepSeek v3?
对于多步骤推理、复杂规划和数学/逻辑任务,请选择 DeepSeek R1。对于快速、通用的聊天、起草、编码辅助和高吞吐量管道,请选择 v3。
Q2:我应该将思维链提示与 DeepSeek R1 一起使用吗?
不。指南建议避免明确的思维链,而依赖于模型内置的推理。而是要求提供最终答案和简要理由。
Q3:如何从 DeepSeek v3 获得一致的 JSON?
使用强制仅使用 JSON 的简短系统提示,定义严格的模式,并可选择设置停止序列。降低温度并限制最大 token 数以限制漂移。
Q4:推理任务应该使用什么温度?
对于确定性和评估,从低值 (0.0–0.3) 开始。对于起草或编码中的平衡创造力,提高到 0.4–0.7;对于头脑风暴,使用更高的值。
Q5:我可以在本地运行 DeepSeek 模型吗?
社区设置可用于实验,但生产通常使用托管 API 来实现稳定性和性能。查看模型卡和社区指南以获取本地说明。