Cómo usar DeepSeek v3 y R1: Indicaciones para tareas de razonamiento y chat
Si alguna vez has sobrecargado una indicación solo para obtener una respuesta peor, no estás solo. Con modelos de razonamiento prioritario como DeepSeek R1 y modelos de chat de alto rendimiento como DeepSeek v3, el antiguo libro de jugadas (indicaciones largas, persuasión pesada de la cadena de pensamiento) a menudo resulta contraproducente. Esta guía te muestra exactamente cómo indicar DeepSeek v3 y R1 para tareas de razonamiento y chat: qué mantener simple, cuándo estructurar y cómo ajustar la configuración para obtener resultados estables y precisos.
Nota de estilo: Práctico y orientado a la solución. Nos centraremos en lo que funciona, con patrones de cortar y pegar y protecciones.
- Usa DeepSeek R1 cuando necesites un razonamiento robusto de varios pasos, pruebas y planificación compleja.
- Usa DeepSeek v3 para chat rápido y preciso, asistencia de codificación, redacción y preguntas y respuestas generales a escala.
- No fuerces la cadena de pensamiento. Pide "respuestas finales", "justificación breve" o salidas estructuradas en su lugar.
- Mantén las indicaciones cortas y claras; agrega restricciones y criterios de evaluación solo cuando sea necesario.
- Comienza con cero ejemplos; agrega ejemplos de pocos disparos solo si ves modos de falla consistentes.
Qué diferencia a DeepSeek R1 de v3
- DeepSeek R1: Un modelo optimizado para el razonamiento diseñado para "pensar antes de responder", lo que reduce la necesidad de indicaciones explícitas paso a paso. Muchas plataformas y documentos aconsejan evitar las demandas de la cadena de pensamiento; cero ejemplos a menudo funciona mejor para R1.
- DeepSeek v3: Un modelo de chat MoE rápido y potente (671B de parámetros totales; 37B activos por token) dirigido a tareas de lenguaje de propósito general con una excelente relación costo-rendimiento, ergonomía de API familiar y calidad de modelo moderna. Los documentos oficiales muestran el uso de la API al estilo de OpenAI.
En la práctica:
- Elige R1 para: problemas de palabras matemáticas, desgloses de estrategias, planificación de múltiples restricciones, razonamiento complicado con pasos latentes.
- Elige v3 para: chat de clientes, revisiones de código, reescritura, resumen y bucles de iteración rápidos.
La regla de oro: No sobrecargues los modelos de razonamiento con indicaciones
Los modelos de razonamiento como R1 ya realizan una deliberación interna. Forzar la cadena de pensamiento ("piensa paso a paso y muestra tu razonamiento") a menudo agrega verbosidad, puede distraer al modelo y, en algunos entornos, puede ser desaconsejado. En su lugar, usa:
- "Proporciona la respuesta final y una breve explicación".
- "Da la respuesta, luego enumera los 3 factores clave que te llevaron allí".
- "Devuelve solo el resultado más una justificación de 2 oraciones".
Esto se alinea con la guía de que las indicaciones simples y de cero ejemplos pueden ser tan efectivas, o mejores, que las instrucciones paso a paso complicadas para R1.
Patrones de indicaciones que funcionan
1) Cero ejemplos, minimalista (Mejor primer intento para R1; genial para v3 también)
Objetivo: Resolver un problema no trivial con restricciones mínimas.
Plantilla de indicación:
Eres un solucionador de problemas cuidadoso.
Pregunta: {task}
Instrucciones: Proporciona la respuesta final y una justificación concisa (máximo 3 oraciones).
Por qué funciona esto: Fomenta el razonamiento interno mientras mantiene la salida enfocada y corta.
2) Salida restringida (Para APIs, fiabilidad o automatización)
Usar cuando necesites formatos predecibles.
Plantilla de indicación:
Sistema: Debes devolver solo JSON válido.
Usuario: Resume este documento en 5 puntos con un riesgo y una oportunidad.
Devuelve JSON: {
"bullets": . Las notas de noticias/modelos destacan la eficiencia y la escala de v3, mientras que las tarjetas de modelo proporcionan contexto adicional.
Elegir entre DeepSeek v3 y R1 por caso de uso
- Chat de atención al cliente: v3 por velocidad y costo; agrega ejemplos de pocos disparos para el tono y el cumplimiento de la política.
- Informes de analistas y memorandos de decisión: R1 para un razonamiento de mayor integridad; establece la restricción de "justificación breve".
- Revisión de código y planes de refactorización: v3 es excelente para la iteración rápida; R1 cuando necesites un razonamiento profundo sobre las compensaciones.
- Matemáticas, lógica, programación con restricciones: R1 normalmente sobresale.
- Resúmenes a gran escala o canalizaciones de reescritura: v3 para el rendimiento.
Para un tutorial de construcción con R1 en un asistente RAG, consulta las reseñas de la comunidad y los tutoriales que muestran patrones de extremo a extremo, ejemplos orientados a la codificación para v3 y experimentos locales a través de pilas de la comunidad.
Manejo seguro del contenido de razonamiento
- No pidas la cadena de pensamiento completa. Si necesitas transparencia, solicita una justificación breve o una lista de factores clave.
- Para dominios sensibles, incluye una línea de política: "Si no estás seguro o la tarea podría causar daño, haz preguntas aclaratorias o rehúsa".
- Agrega indicaciones de validación para tareas numéricas: "Verifica la aritmética antes de responder".
Esto refleja la guía común de mejores prácticas para los modelos de estilo R1: indicaciones mínimas, evita la obtención de la cadena de pensamiento y confía en el razonamiento interno del modelo.
Biblioteca de indicaciones: Fragmentos listos para copiar
A) Planificación compleja (R1)
Objetivo: Planificar una versión beta del producto de 6 semanas para 1000 usuarios con una rotación mínima.
Devolver:
- Mitigaciones (una por riesgo)
Restricciones: Mantener el total por debajo de 200 palabras.
### B) Chat sensible a la política (v3)
Sistema: Eres un asistente útil y que cumple con las políticas. Si una solicitud entra en conflicto con la política, haz una pregunta aclaratoria o proporciona una alternativa segura.
Usuario: Redacta una respuesta de reembolso para un pedido retrasado. Mantén un tono empático y ofrece dos opciones.
### C) Matemáticas/Lógica (R1)
Resuelve lo siguiente. Proporciona la respuesta final y una verificación de 2 oraciones.
Problema: {word problem}
### D) Revisión de código (v3)
Eres un revisor senior de Python. Analiza el fragmento en busca de rendimiento y legibilidad.
Devolver:
- Correcciones (con viñetas)
- Refactorización de ejemplo (<=30 líneas)
### E) Extracción de datos a JSON (v3)
Sistema: Devuelve solo JSON válido.
Usuario: Extrae la empresa, los ingresos y la sede de la empresa del texto. Si falta, usa nulo.
Esquema: {"company":"string","revenue":"string|null","hq":"string|null"}
Texto: {paste}
Solución de problemas: Cuando las salidas se desvían o alucinan
- ¿Demasiado extenso? Reduce los tokens máximos o agrega "Máximo 120 palabras".
- ¿Formato inconsistente? Agrega una indicación del sistema solo JSON y una secuencia de parada.
- ¿Suposiciones incorrectas? Agrega una restricción de una línea: "Si no estás seguro, haz 1 pregunta aclaratoria".
- ¿Errores matemáticos? Agrega "Verifica la aritmética antes de la respuesta final".
- ¿Tareas de cadena frágiles? Divide en dos llamadas: planificar → ejecutar.
Inicio rápido de la API (Conceptual)
- La gestión de puntos finales y claves sigue una interfaz de estilo OpenAI. Espera campos estándar como
model, messages, temperature, max_tokens y opciones de transmisión.
- Los detalles específicos y las afirmaciones de rendimiento de DeepSeek v3 se resumen en las noticias/actualizaciones de modelos oficiales y las tarjetas de modelo.
Vale la pena señalar: Usar Sider.AI para la iteración de indicaciones
Si estás explorando patrones rápidamente (probando cero ejemplos frente a pocos ejemplos, alternando formatos o comparando respuestas de R1 frente a v3), un asistente de superposición puede acelerar el bucle. Por cierto, Sider.AI facilita la redacción, la iteración y las indicaciones A/B en páginas y herramientas en un solo flujo de trabajo, para que puedas concentrarte en la indicación mínima que funciona mejor para tu tarea. Conclusiones clave
- Prefiere indicaciones mínimas y de cero ejemplos para DeepSeek R1; evita las solicitudes explícitas de la cadena de pensamiento.
- Usa DeepSeek v3 para chat rápido y escalable y tareas estructuradas; apóyate en formatos restringidos para la fiabilidad.
- Agrega ejemplos de pocos disparos solo para corregir modos de falla consistentes.
- Aplica la estructura con esquemas JSON, indicaciones breves del sistema y secuencias de parada.
- Para un razonamiento complejo, pide respuestas finales más justificaciones breves, no registros de razonamiento completos.
Preguntas frecuentes
P1: ¿Cuándo debo elegir DeepSeek R1 en lugar de DeepSeek v3?
Elige DeepSeek R1 para el razonamiento de varios pasos, la planificación compleja y las tareas de matemáticas/lógica. Elige v3 para chat general rápido, redacción, asistencia de codificación y canalizaciones de alto rendimiento.
P2: ¿Debo usar indicaciones de la cadena de pensamiento con DeepSeek R1?
No. La guía sugiere evitar la cadena de pensamiento explícita y confiar en el razonamiento integrado del modelo. Pide respuestas finales con justificaciones breves en su lugar.
P3: ¿Cómo obtengo JSON consistente de DeepSeek v3?
Usa una indicación breve del sistema que exija solo JSON, define un esquema estricto y, opcionalmente, establece secuencias de parada. Reduce la temperatura y limita los tokens máximos para limitar la desviación.
P4: ¿Qué temperatura debo usar para las tareas de razonamiento?
Comienza bajo (0.0–0.3) para el determinismo y la evaluación. Aumenta a 0.4–0.7 para una creatividad equilibrada en la redacción o la codificación; usa valores más altos para la lluvia de ideas.
P5: ¿Puedo ejecutar modelos DeepSeek localmente?
Existen configuraciones de la comunidad para la experimentación, pero la producción a menudo usa APIs alojadas para la estabilidad y el rendimiento. Consulta las tarjetas de modelo y las guías de la comunidad para obtener instrucciones locales.