Como Usar o DeepSeek v3 e R1: Prompting para Tarefas de Raciocínio e Chat
Se você já superdimensionou um prompt apenas para obter uma resposta pior, não está sozinho. Com modelos de raciocínio prioritário como o DeepSeek R1 e modelos de chat de alto rendimento como o DeepSeek v3, o antigo manual (prompts longos, forte persuasão de cadeia de pensamento) geralmente sai pela culatra. Este guia mostra exatamente como fazer prompting do DeepSeek v3 e R1 para tarefas de raciocínio e chat – o que manter simples, quando estruturar e como ajustar as configurações para resultados estáveis e precisos.
Nota de estilo: Prático e orientado para soluções. Vamos nos concentrar no que funciona, com padrões de recortar e colar e proteções.
- Use o DeepSeek R1 quando precisar de raciocínio robusto de várias etapas, provas e planejamento complexo.
- Use o DeepSeek v3 para chat rápido e preciso, assistência de codificação, redação e perguntas e respostas gerais em escala.
- Não force a cadeia de pensamento. Peça “respostas finais”, “justificativa breve” ou saídas estruturadas.
- Mantenha os prompts curtos e claros; adicione restrições e critérios de avaliação apenas quando necessário.
- Comece com zero‑shot; adicione exemplos de few‑shot apenas se observar modos de falha consistentes.
O Que Há de Diferente no DeepSeek R1 vs v3
- DeepSeek R1: Um modelo otimizado para raciocínio, projetado para “pensar antes de responder”, reduzindo a necessidade de prompting explícito passo a passo. Muitas plataformas e documentos aconselham evitar demandas de cadeia de pensamento; zero‑shot geralmente funciona melhor para R1.
- DeepSeek v3: Um modelo de chat MoE rápido e forte (671B de parâmetros totais; 37B ativos por token) voltado para tarefas de linguagem de propósito geral com excelente custo-benefício, ergonomia de API familiar e qualidade de modelo moderna. Os documentos oficiais mostram o uso da API no estilo OpenAI.
Na prática:
- Escolha o R1 para: problemas de palavras matemáticas, detalhamento de estratégias, planejamento de múltiplas restrições, raciocínio complicado com etapas latentes.
- Escolha o v3 para: chat com clientes, revisões de código, reescrita, resumo e loops de iteração rápidos.
A Regra de Ouro: Não Faça Over‑Prompting em Modelos de Raciocínio
Modelos de raciocínio como o R1 já realizam deliberação interna. Forçar a cadeia de pensamento (“pense passo a passo e mostre seu raciocínio”) geralmente adiciona verbosidade, pode distrair o modelo e, em algumas configurações, pode ser desencorajado. Em vez disso, use:
- “Forneça a resposta final e uma breve explicação.”
- “Dê a resposta e, em seguida, liste os 3 principais fatores que o levaram até ela.”
- “Retorne apenas o resultado mais uma justificativa de 2 frases.”
Isso se alinha com a orientação de que prompts simples de zero‑shot podem ser tão eficazes – ou melhores – do que instruções passo a passo complicadas para R1.
Padrões de Prompting Que Funcionam
1) Zero‑Shot, Minimalista (Melhor primeira tentativa para R1; ótimo para v3 também)
Objetivo: Resolver um problema não trivial com restrições mínimas.
Modelo de prompt:
Você é um solucionador de problemas cuidadoso.
Pergunta: {task}
Instruções: Forneça a resposta final e uma justificativa concisa (máximo de 3 frases).
Por que isso funciona: Incentiva o raciocínio interno, mantendo a saída focada e curta.
2) Saída Restrita (Para APIs, confiabilidade ou automação)
Use quando precisar de formatos previsíveis.
Modelo de prompt:
Sistema: Você deve retornar apenas JSON válido.
Usuário: Resuma este documento em 5 tópicos com um risco e uma oportunidade.
Retornar JSON: {
"bullets": . Notas de notícias/modelos destacam a eficiência e a escala do v3, enquanto os cartões de modelo fornecem contexto adicional.
Escolhendo Entre DeepSeek v3 e R1 por Caso de Uso
- Chat de suporte ao cliente: v3 para velocidade e custo; adicione exemplos de few‑shot para tom e adesão à política.
- Briefings de analistas e memorandos de decisão: R1 para raciocínio de maior integridade; defina a restrição de “justificativa breve”.
- Revisão de código e planos de refatoração: v3 é excelente para iteração rápida; R1 quando você precisa de raciocínio profundo sobre tradeoffs.
- Matemática, lógica, agendamento com restrições: R1 normalmente se destaca.
- Resumo em larga escala ou pipelines de reescrita: v3 para throughput.
Para um tutorial de construção com R1 em um assistente RAG, consulte as redações da comunidade e do tutorial que mostram padrões de ponta a ponta, exemplos orientados a codificação para v3 e experimentos locais por meio de pilhas da comunidade.
Manuseio Seguro de Conteúdo de Raciocínio
- Não peça a cadeia de pensamento completa. Se precisar de transparência, solicite uma justificativa curta ou uma lista de fatores-chave.
- Para domínios sensíveis, inclua uma linha de política: “Se você não tiver certeza ou a tarefa puder causar danos, faça perguntas esclarecedoras ou recuse.”
- Adicione prompts de validação para tarefas numéricas: “Verifique a aritmética antes de responder.”
Isso espelha a orientação comum de melhores práticas para modelos de estilo R1: prompting mínimo, evite a elicitação de cadeia de pensamento e confie no raciocínio interno do modelo.
Biblioteca de Prompts: Snippets Prontos para Copiar
A) Planejamento Complexo (R1)
Objetivo: Planejar um beta de produto de 6 semanas para 1.000 usuários com churn mínimo.
Retornar:
- Principais riscos (máximo de 5)
- Mitigações (uma por risco)
Restrições: Mantenha o total abaixo de 200 palavras.
### B) Chat Sensível à Política (v3)
Sistema: Você é um assistente útil e compatível com a política. Se uma solicitação entrar em conflito com a política, faça uma pergunta esclarecedora ou forneça uma alternativa segura.
Usuário: Elabore uma resposta de reembolso para um pedido atrasado. Mantenha o tom empático e ofereça duas opções.
### C) Matemática/Lógica (R1)
Resolva o seguinte. Forneça a resposta final e uma verificação de 2 frases.
Problema: {word problem}
### D) Revisão de Código (v3)
Você é um revisor sênior de Python. Analise o snippet quanto ao desempenho e legibilidade.
Retornar:
- Problemas (com marcadores)
- Correções (com marcadores)
- Refatoração de exemplo (<=30 linhas)
### E) Extração de Dados para JSON (v3)
Sistema: Retorne apenas JSON válido.
Usuário: Extraia empresa, receita e sede do texto. Se estiver faltando, use null.
Esquema: {"company":"string","revenue":"string|null","hq":"string|null"}
Texto: {paste}
Solução de Problemas: Quando as Saídas Desviam ou Alucinam
- Muito detalhado? Diminua o número máximo de tokens ou adicione “Máximo de 120 palavras”.
- Formato inconsistente? Adicione um prompt de sistema somente JSON e uma sequência de parada.
- Suposições erradas? Adicione uma restrição de uma linha: “Se não tiver certeza, faça 1 pergunta esclarecedora.”
- Erros de matemática? Adicione “Verifique a aritmética antes da resposta final.”
- Tarefas de cadeia frágeis? Divida em duas chamadas: planejar → executar.
Início Rápido da API (Conceitual)
- O gerenciamento de endpoint e chave segue uma interface no estilo OpenAI. Espere campos padrão como
model, messages, temperature, max_tokens e opções de streaming.
- Os detalhes específicos e as alegações de desempenho do DeepSeek v3 são resumidos nas notícias/atualizações de modelo e nos cartões de modelo oficiais.
Vale a Pena Notar: Usando Sider.AI para Iteração de Prompt
Se você estiver explorando padrões rapidamente – testando zero‑shot vs. few‑shot, alternando formatos ou comparando respostas R1 vs v3 – um assistente de sobreposição pode acelerar o loop. A propósito, Sider.AI torna mais fácil criar, iterar e fazer A/B prompts em páginas e ferramentas em um único fluxo de trabalho, para que você possa se concentrar no prompt mínimo que funciona melhor para sua tarefa. Principais Conclusões
- Prefira prompts mínimos de zero‑shot para DeepSeek R1; evite solicitações explícitas de cadeia de pensamento.
- Use o DeepSeek v3 para chat rápido e escalável e tarefas estruturadas; confie em formatos restritos para confiabilidade.
- Adicione exemplos de few‑shot apenas para corrigir modos de falha consistentes.
- Imponha a estrutura com esquemas JSON, prompts de sistema curtos e sequências de parada.
- Para raciocínio complexo, peça respostas finais mais justificativas breves – não logs de raciocínio completos.
FAQ
Q1: Quando devo escolher o DeepSeek R1 em vez do DeepSeek v3?
Escolha o DeepSeek R1 para raciocínio de várias etapas, planejamento complexo e tarefas de matemática/lógica. Escolha o v3 para chat geral rápido, redação, assistência de codificação e pipelines de alto throughput.
Q2: Devo usar o prompting de cadeia de pensamento com o DeepSeek R1?
Não. A orientação sugere evitar a cadeia de pensamento explícita e confiar no raciocínio integrado do modelo. Peça respostas finais com justificativas breves em vez disso.
Q3: Como obtenho JSON consistente do DeepSeek v3?
Use um prompt de sistema curto que exija apenas JSON, defina um esquema rígido e, opcionalmente, defina sequências de parada. Diminua a temperatura e limite o número máximo de tokens para limitar o desvio.
Q4: Qual temperatura devo usar para tarefas de raciocínio?
Comece baixo (0,0–0,3) para determinismo e avaliação. Aumente para 0,4–0,7 para criatividade equilibrada na redação ou codificação; use valores mais altos para brainstorming.
Q5: Posso executar modelos DeepSeek localmente?
Existem configurações da comunidade para experimentação, mas a produção geralmente usa APIs hospedadas para estabilidade e desempenho. Verifique os cartões de modelo e os guias da comunidade para obter instruções locais.