So verwenden Sie DeepSeek v3 und R1: Prompting für Denk- und Chat-Aufgaben
Wenn Sie jemals einen Prompt überentwickelt haben und dadurch eine schlechtere Antwort erhalten haben, sind Sie nicht allein. Bei Modellen, die auf Reasoning-First setzen, wie DeepSeek R1, und Chatmodellen mit hohem Durchsatz wie DeepSeek v3, geht die alte Vorgehensweise (lange Prompts, starkes Chain-of-Thought-Coaxing) oft nach hinten los. Dieser Leitfaden zeigt Ihnen genau, wie Sie DeepSeek v3 und R1 für Denk- und Chat-Aufgaben prompten – was Sie einfach halten sollten, wann Sie strukturieren sollten und wie Sie Einstellungen für stabile, genaue Ergebnisse optimieren.
Stilhinweis: Praktisch & lösungsorientiert. Wir konzentrieren uns auf das, was funktioniert, mit Copy-and-Paste-Mustern und Leitplanken.
- Verwenden Sie DeepSeek R1, wenn Sie robustes, mehrstufiges Denken, Beweise und komplexe Planung benötigen.
- Verwenden Sie DeepSeek v3 für schnellen, genauen Chat, Programmierunterstützung, Entwurfserstellung und allgemeine Fragen und Antworten in großem Maßstab.
- Erzwingen Sie kein Chain-of-Thought. Fragen Sie stattdessen nach „endgültigen Antworten“, „kurzer Begründung“ oder strukturierten Ausgaben.
- Halten Sie die Prompts kurz und klar; fügen Sie Einschränkungen und Bewertungskriterien nur bei Bedarf hinzu.
- Beginnen Sie mit Zero-Shot; fügen Sie Few-Shot-Beispiele nur hinzu, wenn Sie konsistente Fehlermuster feststellen.
Was ist der Unterschied zwischen DeepSeek R1 und v3?
- DeepSeek R1: Ein denkoptimiertes Modell, das entwickelt wurde, um „vor dem Antworten nachzudenken“, wodurch die Notwendigkeit expliziter Schritt-für-Schritt-Prompts reduziert wird. Viele Plattformen und Dokumente raten davon ab, Chain-of-Thought zu fordern; Zero-Shot funktioniert oft am besten für R1.
- DeepSeek v3: Ein schnelles, starkes MoE-Chatmodell (insgesamt 671B Parameter; 37B aktiv pro Token), das auf Allzweck-Sprachaufgaben mit exzellentem Kosten-Leistungs-Verhältnis, vertrauter API-Ergonomie und moderner Modellqualität abzielt. Offizielle Dokumente zeigen die API-Nutzung im OpenAI-Stil.
In der Praxis:
- Wählen Sie R1 für: mathematische Textaufgaben, Strategieaufschlüsselungen, Multi-Constraint-Planung, kniffliges Denken mit latenten Schritten.
- Wählen Sie v3 für: Kundenchat, Code-Reviews, Umschreiben, Zusammenfassen und schnelle Iterationsschleifen.
Die goldene Regel: Überfordern Sie Denkmodelle nicht mit Prompts
Denkmodelle wie R1 führen bereits interne Überlegungen durch. Das Erzwingen von Chain-of-Thought („denken Sie Schritt für Schritt und zeigen Sie Ihre Argumentation“) führt oft zu mehr Ausführlichkeit, kann das Modell ablenken und ist in einigen Umgebungen möglicherweise unerwünscht. Verwenden Sie stattdessen:
- „Geben Sie die endgültige Antwort und eine kurze Erklärung an.“
- „Geben Sie die Antwort und listen Sie dann die 3 wichtigsten Faktoren auf, die Sie dorthin geführt haben.“
- „Geben Sie nur das Ergebnis plus eine 2-Satz-Begründung zurück.“
Dies stimmt mit der Richtlinie überein, dass einfache Zero-Shot-Prompts genauso effektiv – oder besser – sein können als komplizierte schrittweise Anweisungen für R1.
Prompting-Muster, die funktionieren
1) Zero-Shot, minimalistisch (Bester erster Versuch für R1; auch großartig für v3)
Ziel: Lösen Sie ein nicht-triviales Problem mit minimalen Einschränkungen.
Prompt-Vorlage:
Sie sind ein sorgfältiger Problemlöser.
Frage: {task}
Anweisungen: Geben Sie die endgültige Antwort und eine prägnante Begründung (max. 3 Sätze) an.
Warum das funktioniert: Es fördert das interne Denken und hält die Ausgabe fokussiert und kurz.
2) Beschränkte Ausgabe (Für APIs, Zuverlässigkeit oder Automatisierung)
Verwenden Sie dies, wenn Sie vorhersagbare Formate benötigen.
Prompt-Vorlage:
System: Sie dürfen nur gültiges JSON zurückgeben.
Benutzer: Fassen Sie dieses Dokument in 5 Stichpunkten mit einem Risiko und einer Chance zusammen.
JSON zurückgeben: {
"bullets": . News/Modellhinweise heben die Effizienz und Skalierbarkeit von v3 hervor, während Modellkarten zusätzlichen Kontext bieten.
Auswahl zwischen DeepSeek v3 und R1 nach Anwendungsfall
- Kundensupport-Chat: v3 für Geschwindigkeit und Kosten; fügen Sie Few-Shot-Beispiele für Ton und Richtlinienkonformität hinzu.
- Analystenbriefings und Entscheidungsvorlagen: R1 für eine höhere Integrität des Denkens; legen Sie die Einschränkung „kurze Begründung“ fest.
- Code-Review- und Refactoring-Pläne: v3 ist ausgezeichnet für schnelle Iteration; R1, wenn Sie tiefes Denken über Kompromisse benötigen.
- Mathematik, Logik, Terminplanung mit Einschränkungen: R1 zeichnet sich typischerweise aus.
- Groß angelegte Zusammenfassungs- oder Umschreibungs-Pipelines: v3 für Durchsatz.
Für ein Tutorial zum Erstellen mit R1 in einem RAG-Assistenten siehe Community- und Tutorial-Beschreibungen, die End-to-End-Muster, codierungsorientierte Beispiele für v3 und lokale Experimente über Community-Stacks zeigen.
Sicherer Umgang mit Reasoning-Inhalten
- Fordern Sie keine vollständige Chain-of-Thought an. Wenn Sie Transparenz benötigen, fordern Sie eine kurze Begründung oder eine Liste der wichtigsten Faktoren an.
- Fügen Sie für sensible Bereiche eine Richtlinienzeile hinzu: „Wenn Sie unsicher sind oder die Aufgabe Schaden anrichten könnte, stellen Sie klärende Fragen oder lehnen Sie ab.“
- Fügen Sie Validierungs-Prompts für numerische Aufgaben hinzu: „Überprüfen Sie die Arithmetik, bevor Sie antworten.“
Dies spiegelt die gängige Best-Practice-Anleitung für Modelle im R1-Stil wider: minimales Prompting, Vermeidung der Chain-of-Thought-Erläuterung und Verlassen auf das interne Denken des Modells.
Prompt-Bibliothek: Copy-Ready-Snippets
A) Komplexe Planung (R1)
Ziel: Planen Sie eine 6-wöchige Produkt-Beta für 1.000 Benutzer mit minimalem Churn.
Zurückgeben:
- Meilensteine (wochenweise)
- Minderungsmaßnahmen (eine pro Risiko)
Einschränkungen: Halten Sie die Gesamtzahl unter 200 Wörtern.
### B) Richtlinienempfindlicher Chat (v3)
System: Sie sind ein hilfreicher, richtlinienkonformer Assistent. Wenn eine Anfrage mit den Richtlinien in Konflikt steht, stellen Sie eine klärende Frage oder bieten Sie eine sichere Alternative an.
Benutzer: Entwerfen Sie eine Rückerstattungsantwort für eine verspätete Bestellung. Behalten Sie einen einfühlsamen Ton bei und bieten Sie zwei Optionen an.
### C) Mathematik/Logik (R1)
Lösen Sie Folgendes. Geben Sie die endgültige Antwort und eine 2-Satz-Überprüfung an.
Problem: {word problem}
Sie sind ein erfahrener Python-Rezensent. Analysieren Sie das Snippet auf Leistung und Lesbarkeit.
Zurückgeben:
- Beispiel-Refactoring (<=30 Zeilen)
### E) Datenextraktion in JSON (v3)
System: Geben Sie nur gültiges JSON zurück.
Benutzer: Extrahieren Sie Unternehmen, Umsatz und Hauptsitz aus dem Text. Verwenden Sie null, falls dies fehlt.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
Fehlerbehebung: Wenn Ausgaben abdriften oder halluzinieren
- Zu ausführlich? Reduzieren Sie die maximale Anzahl an Token oder fügen Sie „Max. 120 Wörter“ hinzu.
- Inkonsistentes Format? Fügen Sie einen System-Prompt nur für JSON und eine Stoppsequenz hinzu.
- Falsche Annahmen? Fügen Sie eine einzeilige Einschränkung hinzu: „Wenn Sie unsicher sind, stellen Sie 1 klärende Frage.“
- Mathematische Fehler? Fügen Sie hinzu: „Überprüfen Sie die Arithmetik vor der endgültigen Antwort.“
- Fragile Kettenaufgaben? Teilen Sie sie in zwei Aufrufe auf: Planen → Ausführen.
API-Schnellstart (konzeptionell)
- Endpunkt- und Schlüsselverwaltung folgen einer Schnittstelle im OpenAI-Stil. Erwarten Sie Standardfelder wie
model, messages, temperature, max_tokens und Streaming-Optionen.
- DeepSeek v3-Spezifikationen und Leistungsangaben sind in den offiziellen News/Modell-Updates und Modellkarten zusammengefasst.
Erwähnenswert: Verwenden von Sider.AI für die Prompt-Iteration
Wenn Sie Muster schnell erforschen – Zero-Shot vs. Few-Shot testen, Formate umschalten oder R1- vs. v3-Antworten vergleichen – kann ein Overlay-Assistent die Schleife beschleunigen. Übrigens, Sider.AI macht es einfach, Prompts seiten- und toolübergreifend in einem einzigen Workflow zu entwerfen, zu iterieren und A/B-Tests durchzuführen, sodass Sie sich auf den minimalen Prompt konzentrieren können, der für Ihre Aufgabe am besten funktioniert. Wichtige Erkenntnisse
- Bevorzugen Sie minimale Zero-Shot-Prompts für DeepSeek R1; vermeiden Sie explizite Chain-of-Thought-Anfragen.
- Verwenden Sie DeepSeek v3 für schnelle, skalierbare Chat- und strukturierte Aufgaben; verlassen Sie sich auf eingeschränkte Formate für Zuverlässigkeit.
- Fügen Sie Few-Shot-Beispiele nur hinzu, um konsistente Fehlermuster zu korrigieren.
- Erzwingen Sie die Struktur mit JSON-Schemas, kurzen System-Prompts und Stoppsequenzen.
- Fordern Sie für komplexes Denken endgültige Antworten plus kurze Begründungen an – keine vollständigen Reasoning-Protokolle.
FAQ
F1: Wann sollte ich DeepSeek R1 gegenüber DeepSeek v3 wählen?
Wählen Sie DeepSeek R1 für mehrstufiges Denken, komplexe Planung und Mathematik-/Logikaufgaben. Wählen Sie v3 für schnellen, allgemeinen Chat, Entwurfserstellung, Programmierunterstützung und Pipelines mit hohem Durchsatz.
F2: Sollte ich Chain-of-Thought-Prompting mit DeepSeek R1 verwenden?
Nein. Die Anleitung empfiehlt, explizite Chain-of-Thought zu vermeiden und sich auf das integrierte Denken des Modells zu verlassen. Fragen Sie stattdessen nach endgültigen Antworten mit kurzen Begründungen.
F3: Wie erhalte ich konsistentes JSON von DeepSeek v3?
Verwenden Sie einen kurzen System-Prompt, der nur JSON vorschreibt, definieren Sie ein enges Schema und legen Sie optional Stoppsequenzen fest. Senken Sie die Temperatur und begrenzen Sie die maximale Anzahl an Token, um das Abdriften zu begrenzen.
F4: Welche Temperatur sollte ich für Denkaufgaben verwenden?
Beginnen Sie niedrig (0,0–0,3) für Determinismus und Bewertung. Erhöhen Sie auf 0,4–0,7 für ausgewogene Kreativität beim Entwerfen oder Programmieren; verwenden Sie höhere Werte für das Brainstorming.
F5: Kann ich DeepSeek-Modelle lokal ausführen?
Es gibt Community-Setups für Experimente, aber die Produktion verwendet oft gehostete APIs für Stabilität und Leistung. Überprüfen Sie die Modellkarten und Community-Leitfäden auf lokale Anweisungen.