When should I choose DeepSeek R1 over DeepSeek v3?

Pick DeepSeek R1 for multi‑step reasoning, complex planning, and math/logic tasks. Choose v3 for fast, general chat, drafting, coding assistance, and high‑throughput pipelines.

Should I use chain‑of‑thought prompting with DeepSeek R1?

No. Guidance suggests avoiding explicit chain‑of‑thought and relying on the model’s built‑in reasoning. Ask for final answers with brief justifications instead.

How do I get consistent JSON from DeepSeek v3?

Use a short system prompt that mandates JSON only, define a tight schema, and optionally set stop sequences. Lower temperature and cap max tokens to limit drift.

What temperature should I use for reasoning tasks?

Start low (0.0–0.3) for determinism and evaluation. Raise to 0.4–0.7 for balanced creativity in drafting or coding; use higher values for brainstorming.

Can I run DeepSeek models locally?

Community setups exist for experimentation, but production often uses hosted APIs for stability and performance. Check model cards and community guides for local instructions.

Jak používat DeepSeek v3 a R1: Promptování pro úkoly vyžadující uvažování a chatování

Pokud jste někdy příliš složitě navrhli prompt a dostali jste horší odpověď, nejste sami. U modelů, které upřednostňují uvažování, jako je DeepSeek R1, a u chatovacích modelů s vysokou propustností, jako je DeepSeek v3, se staré postupy (dlouhé prompty, silné nucení k řetězci myšlenek) často obracejí proti vám. Tato příručka vám ukáže, jak přesně promptovat DeepSeek v3 a R1 pro úkoly vyžadující uvažování a chatování – co ponechat jednoduché, kdy přidat strukturu a jak vyladit nastavení pro stabilní a přesné výsledky.

Styl: Praktický a zaměřený na řešení. Zaměříme se na to, co funguje, s vzory a ochrannými prvky pro kopírování a vkládání.

Použijte DeepSeek R1, když potřebujete robustní vícestupňové uvažování, důkazy a složité plánování.

Použijte DeepSeek v3 pro rychlý a přesný chat, pomoc s kódováním, návrhy a obecné otázky a odpovědi ve velkém měřítku.

Nenuťte řetězec myšlenek. Místo toho požádejte o „konečné odpovědi“, „stručné zdůvodnění“ nebo strukturované výstupy.

Udržujte prompty krátké a jasné; přidejte omezení a kritéria hodnocení pouze v případě potřeby.

Začněte s nulovým počtem příkladů; přidejte příklady s několika příklady pouze v případě, že vidíte konzistentní režimy selhání.

V čem se DeepSeek R1 liší od v3

DeepSeek R1: Model optimalizovaný pro uvažování, navržený tak, aby „přemýšlel před odpovědí“, čímž se snižuje potřeba explicitního promptování krok za krokem. Mnoho platforem a dokumentů doporučuje vyhýbat se požadavkům na řetězec myšlenek; nulový počet příkladů často funguje nejlépe pro R1.

DeepSeek v3: Rychlý a silný MoE chatovací model (celkem 671B parametrů; 37B aktivních na token) zaměřený na jazykové úkoly pro obecné účely s vynikající cenovou výkonností, známou ergonomií API a moderní kvalitou modelu. Oficiální dokumenty ukazují použití API ve stylu OpenAI.

V praxi:

Zvolte R1 pro: matematické slovní úlohy, rozbory strategií, plánování s více omezeními, složité uvažování se skrytými kroky.

Zvolte v3 pro: zákaznický chat, revize kódu, přepisování, shrnutí a rychlé iterační smyčky.

Zlaté pravidlo: Nepřehánějte to s promptováním modelů pro uvažování

Modely pro uvažování, jako je R1, již provádějí interní úvahy. Nucení k řetězci myšlenek („přemýšlej krok za krokem a ukaž své uvažování“) často přidává zbytečnou popisnost, může model rozptylovat a v některých nastaveních to může být nežádoucí. Místo toho použijte:

„Poskytněte konečnou odpověď a stručné vysvětlení.“

„Uveďte odpověď a poté vypište 3 klíčové faktory, které vás k ní dovedly.“

„Vraťte pouze výsledek plus zdůvodnění ve 2 větách.“

To je v souladu s doporučeními, že jednoduché prompty s nulovým počtem příkladů mohou být stejně účinné – nebo i lepší – než složité postupné instrukce pro R1.

Vzory promptování, které fungují

1) Nulový počet příkladů, minimalistický (Nejlepší první pokus pro R1; skvělé i pro v3)

Cíl: Vyřešit netriviální problém s minimálními omezeními.

Šablona promptu:

Jste pečlivý řešitel problémů.
Otázka: {task}
Instrukce: Poskytněte konečnou odpověď a stručné zdůvodnění (maximálně 3 věty).

Proč to funguje: Podporuje to interní uvažování a zároveň udržuje výstup soustředěný a krátký.

2) Omezený výstup (Pro API, spolehlivost nebo automatizaci)

Použijte, když potřebujete předvídatelné formáty.

Šablona promptu:

Systém: Musíte vracet pouze platný JSON.
Uživatel: Shrňte tento dokument do 5 odrážek s jedním rizikem a jednou příležitostí.
Vrátit JSON: {
"bullets": . Poznámky k novinkám/modelům zdůrazňují efektivitu a škálovatelnost v3, zatímco modelové karty poskytují další kontext.

Výběr mezi DeepSeek v3 a R1 podle případu použití

Chat zákaznické podpory: v3 pro rychlost a cenu; přidejte příklady s několika příklady pro tón a dodržování zásad.

Analytické briefingy a rozhodovací memoranda: R1 pro uvažování s vyšší integritou; nastavte omezení „stručné zdůvodnění“.

Revize kódu a plány refaktoringu: v3 je vynikající pro rychlou iteraci; R1, když potřebujete hluboké uvažování o kompromisech.

Matematika, logika, plánování s omezeními: R1 obvykle vyniká.

Rozsáhlé shrnutí nebo přepisování: v3 pro propustnost.

Pro tutoriál o budování s R1 v RAG asistentovi se podívejte na komunitní a tutoriálové zápisky, které ukazují end-to-end vzory, příklady orientované na kódování pro v3 a místní experimenty prostřednictvím komunitních stacků.

Bezpečné zacházení s obsahem vyžadujícím uvažování

Nežádejte o úplný řetězec myšlenek. Pokud potřebujete transparentnost, požádejte o krátké zdůvodnění nebo seznam klíčových faktorů.

Pro citlivé domény zahrňte řádek zásad: „Pokud si nejste jisti nebo by úkol mohl způsobit újmu, položte objasňující otázky nebo odmítněte.“

Přidejte validační prompty pro numerické úkoly: „Před odpovědí zkontrolujte aritmetiku.“

To odráží běžné osvědčené postupy pro modely ve stylu R1: minimální promptování, vyhýbání se vyvolávání řetězce myšlenek a spoléhání se na interní uvažování modelu.

Knihovna promptů: Úryvky připravené ke kopírování

A) Komplexní plánování (R1)

Cíl: Naplánujte 6týdenní beta verzi produktu pro 1 000 uživatelů s minimálním odlivem. Vrátit:

Milníky (týden po týdnu)

Klíčová rizika (max. 5)

Zmírnění (jedno na riziko) Omezení: Udržujte celkový počet slov pod 200.


### B) Chat citlivý na zásady (v3)

Systém: Jste užitečný asistent, který dodržuje zásady. Pokud požadavek koliduje se zásadami, položte objasňující otázku nebo nabídněte bezpečnou alternativu. Uživatel: Navrhněte odpověď na vrácení peněz za zpožděnou objednávku. Udržujte empatický tón a nabídněte dvě možnosti.


### C) Matematika/Logika (R1)

Vyřešte následující. Uveďte konečnou odpověď a 2větnou kontrolu. Problém: {word problem}


### D) Revize kódu (v3)

Jste zkušený recenzent Pythonu. Analyzujte úryvek z hlediska výkonu a čitelnosti. Vrátit:

Problémy (s odrážkami)

Opravy (s odrážkami)

Příklad refaktoringu (<=30 řádků)


### E) Extrakce dat do JSON (v3)

Systém: Vraťte pouze platný JSON. Uživatel: Extrahujte společnost, příjmy a sídlo z textu. Pokud chybí, použijte null. Schema: {"company":"string","revenue":"string|null","hq":"string|null"} Text: {paste}

Odstraňování problémů: Když se výstupy odchylují nebo halucinují

Příliš podrobné? Snižte maximální počet tokenů nebo přidejte „Max. 120 slov.“

Nekonzistentní formát? Přidejte systémový prompt pouze pro JSON a ukončovací sekvenci.

Nesprávné předpoklady? Přidejte jednořádkové omezení: „Pokud si nejste jisti, položte 1 objasňující otázku.“

Matematické chyby? Přidejte „Před konečnou odpovědí zkontrolujte aritmetiku.“

Křehké úkoly s řetězcem? Rozdělte na dvě volání: plán → provedení.

Rychlý start API (konceptuální)

Správa koncových bodů a klíčů se řídí rozhraním ve stylu OpenAI. Očekávejte standardní pole, jako je model, messages, temperature, max_tokens a možnosti streamování.

Specifika a tvrzení o výkonu DeepSeek v3 jsou shrnuty v oficiálních novinkách/aktualizacích modelu a modelových kartách.

Stojí za zmínku: Použití Sider.AI pro iteraci promptů

Pokud rychle zkoumáte vzory – testujete nulový počet příkladů vs. několik příkladů, přepínáte formáty nebo porovnáváte odpovědi R1 vs. v3 – asistent překrytí může urychlit smyčku. Mimochodem, Sider.AI usnadňuje navrhování, iteraci a A/B testování promptů na různých stránkách a nástrojích v jediném pracovním postupu, takže se můžete zaměřit na minimální prompt, který pro váš úkol funguje nejlépe.

Klíčové poznatky

Upřednostňujte minimální prompty s nulovým počtem příkladů pro DeepSeek R1; vyhýbejte se explicitním požadavkům na řetězec myšlenek.

Používejte DeepSeek v3 pro rychlý, škálovatelný chat a strukturované úkoly; spoléhejte se na omezené formáty pro spolehlivost.

Přidávejte příklady s několika příklady pouze pro opravu konzistentních režimů selhání.

Vynucujte strukturu pomocí schémat JSON, krátkých systémových promptů a ukončovacích sekvencí.

Pro složité uvažování žádejte konečné odpovědi plus stručné zdůvodnění – nikoli úplné protokoly uvažování.

FAQ

Otázka 1: Kdy bych měl zvolit DeepSeek R1 místo DeepSeek v3? Vyberte DeepSeek R1 pro vícestupňové uvažování, složité plánování a matematické/logické úkoly. Zvolte v3 pro rychlý, obecný chat, návrhy, pomoc s kódováním a vysoce propustné pipeline.

Otázka 2: Mám používat promptování s řetězcem myšlenek s DeepSeek R1? Ne. Doporučení naznačují, abyste se vyhýbali explicitnímu řetězci myšlenek a spoléhali se na vestavěné uvažování modelu. Místo toho žádejte konečné odpovědi se stručným zdůvodněním.

Otázka 3: Jak získám konzistentní JSON z DeepSeek v3? Použijte krátký systémový prompt, který vyžaduje pouze JSON, definujte přísné schéma a volitelně nastavte ukončovací sekvence. Snižte teplotu a omezte maximální počet tokenů, abyste omezili odchylky.

Otázka 4: Jakou teplotu bych měl použít pro úkoly vyžadující uvažování? Začněte nízko (0,0–0,3) pro determinismus a hodnocení. Zvyšte na 0,4–0,7 pro vyváženou kreativitu při návrhu nebo kódování; použijte vyšší hodnoty pro brainstorming.

Otázka 5: Mohu spouštět modely DeepSeek lokálně? Existují komunitní nastavení pro experimentování, ale produkce často používá hostovaná API pro stabilitu a výkon. Zkontrolujte modelové karty a komunitní příručky pro místní pokyny.