What prompt style works best for DeepSeek v3.1 Terminus on complex reasoning?

Use a Chain-of-Checks prompt: request a final answer, a short justification, and a single verification step. It improves accuracy without exposing internal reasoning and reduces subtle logic errors.

How can I force DeepSeek v3.1 Terminus to return clean JSON?

Adopt a Schema-First prompt with an explicit JSON template, validation rules, and examples. Instruct the model to output JSON only and omit unknown fields to avoid placeholders.

How do I prevent hallucinations with DeepSeek v3.1 Terminus?

Use an Evidence-Bound Answer style that limits the model to provided sources and requires citations like [S1]. If evidence is missing, instruct the model to state “Insufficient evidence.”

What’s the fastest way to get concise, high-quality answers?

Use a Constraint-Compressed prompt: cap word count, define a strict structure, and prioritize data over adjectives. This keeps responses informative and compact.

Which prompt style should I use for code generation?

Use an I/O Spec + Tests prompt. Define the function signature, constraints, and include acceptance tests; models optimize to pass those tests, yielding more reliable code.

哪些 Prompt 风格能够解锁 DeepSeek v3.1 Terminus 的更佳结果？

大胆声明：大多数 prompt 调整无关紧要——直到它们变得重要。对于 DeepSeek v3.1 Terminus 来说，prompt 风格中的一些精确更改可以使输出质量翻倍并减少推理周期。

本指南探讨了始终能够解锁 DeepSeek v3.1 Terminus 更佳结果的 prompt 风格。我们将超越“具体说明”等一般性建议，而是分解结构化模板、示例和经过压力测试的策略，这些策略可以优化推理深度、准确性和速度。无论您是构建 agents、编写复杂查询还是生成可用于生产的内容，正确的 prompt 风格都感觉像是拨动了一个隐藏的开关。

我们将采用一种实用且以解决方案为导向的方法，提供您可以复制、改编和 A/B 测试的示例。期待清单、紧凑的框架以及何时使用每种风格的明确提示。

为什么 Prompt 风格在 DeepSeek v3.1 Terminus 中至关重要

风格引导行为：Terminus 对结构反应强烈。一个框架约束、角色和评估标准的 prompt 可以引导模型的推理轨迹。

延迟与深度之间的权衡：您提问的方式可以鼓励简洁的输出或多步骤链。受控的冗长可以减少 token 浪费。

可重复性：一致的模板可以提高确定性，并使调试更容易。

Prompt 风格剧本（问题引导型）

我们将以您可能提出的问题以及效果最佳的精确模式来构建它。

1) 如何提高复杂任务的推理准确性？

使用“链式检查”风格。不要仅仅要求一个思维链（您不应该逐字逐句地要求），而是引导模型静默地推理，然后呈现一个可验证的结果，并进行明确的检查。

何时使用：数学/逻辑、政策合规、多约束规划。

为什么有效：鼓励内部规划和外部验证，而不泄露内部推理。

示例 prompt：

你是一位细心的分析师。解决问题并展示：
1) 仅最终答案
2) 简短的理由：列出假设和关键步骤
3) 验证：一个可以发现错误的快速检查
问题：一个移动套餐收取 29 美元的基本费用，外加超过 100 分钟后每分钟 0.12 美元。如果使用了 245 分钟，账单是多少？
约束条件：理由保持在 60 个字以内。

在输出中寻找什么：

明确的假设，最少的冗余

实际上可能失败的验证步骤

提示：添加如果不确定，请说明不确定性以及哪些额外信息会有所帮助以减少幻觉。

2) 如何每次都获得结构化输出？

使用带有内联 JSON 或 YAML 模板的“Schema-First”风格。提供示例形状和规则。

何时使用：集成、自动化、函数调用、下游解析。

为什么有效：Terminus 与显式模式紧密对齐。

Prompt 模式：

仅返回 JSON。没有评论。
模式：
{
"title": "string",
<a5>"summary": "string",</a4>"priority": "low|medium|high",
"tags": ["string"],
"next_actions": [
{"task": "string", "owner": "string", "eta_days": number}
]
}
任务：总结以下会议记录并提出后续步骤。
Notes: "..."
验证规则：
- 标签使用小写
- 没有 null 值
- 总结保持在 ≤ 80 个字

强化技巧：

添加如果某个字段未知，则省略它以防止占位符。

提供一个正面和一个负面示例。

3) 如何减少幻觉？

使用“证据约束答案”风格，该风格强制引用，并在证据缺失时拒绝回答。

何时使用：事实问答、合规性、受监管内容。

为什么有效：将模型从生成性猜测转变为带引用的综合。

Prompt 模板：

仅在提供的来源支持的情况下才回答。像 [S1], [S2] 这样引用。如果不支持，请说“证据不足”。
问题：主要发现是什么？
来源：
[S1] ...
[S2] ...
输出格式：
- 关键点（项目符号）
- 一句话结论

添加防护措施：

不要使用外部知识。

如果来源冲突，请明确指出。

4) 如何在不降低质量的情况下获得更快、更短的答案？

使用“约束压缩”风格，该风格限制 token 并指示信息层次结构。

何时使用：聊天 UI、移动设备、工具提示、摘要。

为什么有效：鼓励优先排序。

Prompt 模式：

仅提供前 20% 最有用的信息。最多 120 个字。
结构：
- 一行答案
- 3 个要点：证据、风险、后续步骤

添加：首选数字、日期和命名实体，而不是形容词。

5) 如何提高内容和构思的创造力？

使用具有模式和过滤器的“发散 → 收敛”风格。

何时使用：头脑风暴、营销文案、产品创意。

为什么有效：将想法生成与选择分开，减少过早的收敛。

Prompt 配方：

阶段 1 — 发散（不评判）：
- 围绕 4 个不同的角度生成 12 个想法
- 创造 1 个逆向思维的想法和 1 个有趣的想法
阶段 2 — 收敛：
- 根据新颖性 (1–5) 和可行性 (1–5) 对每个想法进行评分
- 根据产品与市场的契合度选择前 3 名
- 对于获胜者：生成一个 50 字的宣传语和一个标题

添加品牌/风格指南片段以对齐语气。

6) 如何使用工具或 API 协调多步骤任务？

使用具有角色分离和显式工具使用策略的“计划者-执行者”风格。

何时使用：Agents、自动化、检索 + 生成。

为什么有效：防止过度使用和循环工具；阐明停止条件。

Prompt 框架：

角色：计划者
目标：预订一张从纽约到西雅图，11 月 12 日至 15 日，价格低于 450 美元的机票。
政策：
- 仅使用搜索工具检索价格
- 当 2 个选项满足约束条件时停止
- 如果没有选项，则提出 2 个替代日期
输出：带有步骤的计划
角色：执行者（完全按照计划执行）
- 执行步骤 1，然后停止并总结结果。

添加：如果某个步骤失败，请提出修复方案，并在重试前请求许可。

7) 如何强制执行语气、风格和品牌声音？

使用带有明确的“做/不做”列表和一个简短示例的“风格锁定”。

何时使用：大规模内容、支持回复、产品文档。

为什么有效：具体的约束胜过模糊的形容词。

Prompt 骨架：

受众：中端市场 CTO
语气：简洁、具体、自信
做：使用数字、比较权衡、显示成本
不做：炒作、陈词滥调、反问句
示例（2 句话）：“...”
任务：重写下面的电子邮件以匹配指南。

8) 如何获得更好的代码生成和重构？

使用“I/O 规范 + 测试”风格：定义输入、输出、约束，并将测试作为验收标准。

何时使用：函数、脚本、迁移。

为什么有效：模型优化以通过可见的测试。

Prompt 模式：

编写一个 Python 函数 `normalize_name(s: str) -> str`。
约束：
- 修剪空格，折叠多个空格，首字母大写单词
- 保留连字符和撇号
- 仅 ASCII；用最接近的替换非 ASCII
测试：
- " mary ann o'brien " -> "Mary Ann O'Brien"
- "JOSE-LUIS" -> "Jose-Luis"
- "Zoë" -> "Zoe"

添加：用 2 句话解释时间/空间复杂度。

9) 如何使模型仅在需要时才提出澄清问题？

使用带有显式阈值的“条件澄清”。

何时使用：销售助理、支持、表格填写。

为什么有效：避免过度询问，同时防止错误的假设。

Prompt 片段：

如果置信度 ≥ 0.8，则继续。如果 < 0.8，则提出 1 个有针对性的问题。
显示：推断的假设和置信度 (0–1)。
任务：起草一个 30 分钟入职电话会议的议程。

10) 如何从混乱的文本中可靠地提取信息？

使用带有锚点提示和严格范围的“跨度精确提取”风格。

何时使用：合同、日志、电子邮件、收据。

为什么有效：锚点减少漂移；跨度复制避免释义错误。

Prompt 格式：

提取以下内容的精确跨度：vendor_name, invoice_total, due_date。
规则：逐字复制；如果缺失，则返回 ""。
文本：
"""
...
"""
仅输出 JSON。

Prompt 风格矩阵：何时使用什么

推理任务 → 链式检查

结构化输出 → Schema-First

带有引用的事实 → 证据约束

简短形式的清晰度 → 约束压缩

构思 → 发散 → 收敛

工具使用/agents → 计划者-执行者

品牌声音 → 风格锁定

代码任务 → I/O 规范 + 测试

澄清 → 条件澄清

提取 → 跨度精确

保留一个这些模式的小型库并进行 A/B 测试。

实用升级，可带来复合效应

上下文窗口：仅提供相关的上下文。将目标和约束放在顶部；将参考放在底部。

指令优先级：顺序很重要。使用像目标、约束、输出这样的标题来建立层次结构。

停止条件：使用当…时停止和 token 预算来防止漫谈。

自我检查：添加一个针对任务量身定制的验证步骤。

温度控制：降低以提高精度 (0.1–0.3)，提高以提高创造力 (0.6–0.9)。与 prompt 风格匹配。

确定性：如果您的堆栈支持，则修复种子或增加 n-best 采样。

真实世界的迷你场景

分析简报（约束压缩 + 证据约束）：

“使用以下数据总结 Q3 渠道流失情况。最多 120 个字。引用表 ID [T1], [T2]。如果缺少指标，请说‘数据不足’。”

法律条款检查（链式检查）：

“识别歧义术语并提出简明的语言替代方案。提供最终列表、3 个关键风险和一个验证检查。”

内容重写（风格锁定）：

“以友好、直接的语气重写此 FAQ。做：缩写、短句；不做：流行语。”

故障排除：如果结果没有改善

太模糊？收紧约束并添加一个迷你示例。

太冗长？添加 token 上限和以项目符号开头的结构。

产生幻觉？切换到证据约束并限制为提供的来源。

JSON 不一致？包括一个模式和一个失败的示例以避免。

过度使用工具？设置明确的工具使用规则和停止标准。

高级：没有泄漏的 Prompt 链接

阶段 1：问题框架（收集约束和成功指标）

阶段 2：计划提案（2-3 个选项，选择一个）

阶段 3：执行（完全按照计划执行）

阶段 4：审查（自我检查 + 验收标准）

阶段 5：包装（最终格式、长度、声音）

仅在阶段之间传递最少必要的数据，以避免 prompt 膨胀。为每个阶段使用唯一的定界符（<<<STAGE2>>>）。

顺便说一句：一种更快的迭代方式

值得注意的是：如果您正在试验大量的 prompt 风格，那么拥有一个可以保存 prompt 模板、运行快速 A/B 测试和解析结构化输出的并排副驾驶员是一个真正的加速器。像 Sider.AI 这样的工具可以固定可重用的 prompt 模式，将输出捕获为 JSON，并帮助您比较运行情况，以便您可以为给定的任务选择性能最佳的风格。

主要收获

选择与任务匹配的 prompt 风格——不要一次混合太多模式。

使用明确的结构：目标、约束、输出和停止条件。

偏爱模式、示例和验证，而不是形容词。

A/B 测试风格（例如，链式检查与约束压缩）并衡量结果。

保留一个您可以根据上下文进行调整的模板库。

快速参考：复制/粘贴模板

链式检查

角色：细心的分析师
任务：[任务]
输出：
1) 最终答案
2) 简短的理由（≤60 个字）
3) 一个验证检查
如果不确定，请说明缺少什么信息。

Schema-First JSON

仅返回 JSON。
模式：{...}
验证规则：[...]
任务：[...]

证据约束

仅使用来源 [S1..Sn] 回答。如果不支持：“证据不足”。
提供像 [S1] 这样的引用。

约束压缩

最多 120 个字。
- 一行答案
- 3 个要点：证据、风险、后续步骤

发散 → 收敛

阶段 1：围绕 4 个角度的 12 个想法（包括 1 个逆向思维，1 个有趣的）
阶段 2：评分、选择前 3 名、扩展获胜者

计划者-执行者

角色：计划者 → 步骤，当满足约束时停止
角色：执行者 → 完全按照步骤操作，停止并总结

风格锁定

受众、语气、做/不做、示例、任务

I/O 规范 + 测试

函数规范 + 约束 + 验收测试

条件澄清

如果置信度 ≥ 0.8 则继续；否则提出 1 个问题。显示置信度。

跨度精确提取

提取精确跨度；逐字复制；仅返回 JSON。

FAQ

Q1: 对于 DeepSeek v3.1 Terminus 上复杂的推理，哪种 prompt 风格效果最好？使用链式检查 prompt：请求最终答案、简短的理由和一个验证步骤。它可以提高准确性，而不会暴露内部推理，并减少细微的逻辑错误。

Q2: 如何强制 DeepSeek v3.1 Terminus 返回干净的 JSON？采用带有显式 JSON 模板、验证规则和示例的 Schema-First prompt。指示模型仅输出 JSON 并省略未知字段以避免占位符。

Q3: 如何使用 DeepSeek v3.1 Terminus 防止幻觉？使用证据约束答案风格，该风格将模型限制为提供的来源，并需要像 [S1] 这样的引用。如果缺少证据，请指示模型说明“证据不足”。

Q4: 获得简洁、高质量答案的最快方法是什么？使用约束压缩 prompt：限制字数、定义严格的结构并优先考虑数据而不是形容词。这使响应信息丰富且紧凑。

Q5: 我应该使用哪种 prompt 风格进行代码生成？使用 I/O 规范 + 测试 prompt。定义函数签名、约束并包括验收测试；模型优化以通过这些测试，从而产生更可靠的代码。

哪些 Prompt 风格能更好地发挥 DeepSeek v3.1 Terminus 的性能？

哪些 Prompt 风格能够解锁 DeepSeek v3.1 Terminus 的更佳结果？

为什么 Prompt 风格在 DeepSeek v3.1 Terminus 中至关重要

Prompt 风格剧本（问题引导型）

1) 如何提高复杂任务的推理准确性？

2) 如何每次都获得结构化输出？

3) 如何减少幻觉？

4) 如何在不降低质量的情况下获得更快、更短的答案？

5) 如何提高内容和构思的创造力？

6) 如何使用工具或 API 协调多步骤任务？

7) 如何强制执行语气、风格和品牌声音？

8) 如何获得更好的代码生成和重构？

9) 如何使模型仅在需要时才提出澄清问题？

10) 如何从混乱的文本中可靠地提取信息？

Prompt 风格矩阵：何时使用什么

实用升级，可带来复合效应

真实世界的迷你场景

故障排除：如果结果没有改善

高级：没有泄漏的 Prompt 链接

顺便说一句：一种更快的迭代方式

主要收获

快速参考：复制/粘贴模板

FAQ