Jak používat DeepSeek v3 a R1: Promptování pro úkoly vyžadující uvažování a chatování
Pokud jste někdy příliš složitě navrhli prompt a dostali jste horší odpověď, nejste sami. U modelů, které upřednostňují uvažování, jako je DeepSeek R1, a u chatovacích modelů s vysokou propustností, jako je DeepSeek v3, se staré postupy (dlouhé prompty, silné nucení k řetězci myšlenek) často obracejí proti vám. Tato příručka vám ukáže, jak přesně promptovat DeepSeek v3 a R1 pro úkoly vyžadující uvažování a chatování – co ponechat jednoduché, kdy přidat strukturu a jak vyladit nastavení pro stabilní a přesné výsledky.
Styl: Praktický a zaměřený na řešení. Zaměříme se na to, co funguje, s vzory a ochrannými prvky pro kopírování a vkládání.
- Použijte DeepSeek R1, když potřebujete robustní vícestupňové uvažování, důkazy a složité plánování.
- Použijte DeepSeek v3 pro rychlý a přesný chat, pomoc s kódováním, návrhy a obecné otázky a odpovědi ve velkém měřítku.
- Nenuťte řetězec myšlenek. Místo toho požádejte o „konečné odpovědi“, „stručné zdůvodnění“ nebo strukturované výstupy.
- Udržujte prompty krátké a jasné; přidejte omezení a kritéria hodnocení pouze v případě potřeby.
- Začněte s nulovým počtem příkladů; přidejte příklady s několika příklady pouze v případě, že vidíte konzistentní režimy selhání.
V čem se DeepSeek R1 liší od v3
- DeepSeek R1: Model optimalizovaný pro uvažování, navržený tak, aby „přemýšlel před odpovědí“, čímž se snižuje potřeba explicitního promptování krok za krokem. Mnoho platforem a dokumentů doporučuje vyhýbat se požadavkům na řetězec myšlenek; nulový počet příkladů často funguje nejlépe pro R1.
- DeepSeek v3: Rychlý a silný MoE chatovací model (celkem 671B parametrů; 37B aktivních na token) zaměřený na jazykové úkoly pro obecné účely s vynikající cenovou výkonností, známou ergonomií API a moderní kvalitou modelu. Oficiální dokumenty ukazují použití API ve stylu OpenAI.
V praxi:
- Zvolte R1 pro: matematické slovní úlohy, rozbory strategií, plánování s více omezeními, složité uvažování se skrytými kroky.
- Zvolte v3 pro: zákaznický chat, revize kódu, přepisování, shrnutí a rychlé iterační smyčky.
Zlaté pravidlo: Nepřehánějte to s promptováním modelů pro uvažování
Modely pro uvažování, jako je R1, již provádějí interní úvahy. Nucení k řetězci myšlenek („přemýšlej krok za krokem a ukaž své uvažování“) často přidává zbytečnou popisnost, může model rozptylovat a v některých nastaveních to může být nežádoucí. Místo toho použijte:
- „Poskytněte konečnou odpověď a stručné vysvětlení.“
- „Uveďte odpověď a poté vypište 3 klíčové faktory, které vás k ní dovedly.“
- „Vraťte pouze výsledek plus zdůvodnění ve 2 větách.“
To je v souladu s doporučeními, že jednoduché prompty s nulovým počtem příkladů mohou být stejně účinné – nebo i lepší – než složité postupné instrukce pro R1.
Vzory promptování, které fungují
1) Nulový počet příkladů, minimalistický (Nejlepší první pokus pro R1; skvělé i pro v3)
Cíl: Vyřešit netriviální problém s minimálními omezeními.
Šablona promptu:
Jste pečlivý řešitel problémů.
Otázka: {task}
Instrukce: Poskytněte konečnou odpověď a stručné zdůvodnění (maximálně 3 věty).
Proč to funguje: Podporuje to interní uvažování a zároveň udržuje výstup soustředěný a krátký.
2) Omezený výstup (Pro API, spolehlivost nebo automatizaci)
Použijte, když potřebujete předvídatelné formáty.
Šablona promptu:
Systém: Musíte vracet pouze platný JSON.
Uživatel: Shrňte tento dokument do 5 odrážek s jedním rizikem a jednou příležitostí.
Vrátit JSON: {
"bullets": . Poznámky k novinkám/modelům zdůrazňují efektivitu a škálovatelnost v3, zatímco modelové karty poskytují další kontext.
Výběr mezi DeepSeek v3 a R1 podle případu použití
- Chat zákaznické podpory: v3 pro rychlost a cenu; přidejte příklady s několika příklady pro tón a dodržování zásad.
- Analytické briefingy a rozhodovací memoranda: R1 pro uvažování s vyšší integritou; nastavte omezení „stručné zdůvodnění“.
- Revize kódu a plány refaktoringu: v3 je vynikající pro rychlou iteraci; R1, když potřebujete hluboké uvažování o kompromisech.
- Matematika, logika, plánování s omezeními: R1 obvykle vyniká.
- Rozsáhlé shrnutí nebo přepisování: v3 pro propustnost.
Pro tutoriál o budování s R1 v RAG asistentovi se podívejte na komunitní a tutoriálové zápisky, které ukazují end-to-end vzory, příklady orientované na kódování pro v3 a místní experimenty prostřednictvím komunitních stacků.
Bezpečné zacházení s obsahem vyžadujícím uvažování
- Nežádejte o úplný řetězec myšlenek. Pokud potřebujete transparentnost, požádejte o krátké zdůvodnění nebo seznam klíčových faktorů.
- Pro citlivé domény zahrňte řádek zásad: „Pokud si nejste jisti nebo by úkol mohl způsobit újmu, položte objasňující otázky nebo odmítněte.“
- Přidejte validační prompty pro numerické úkoly: „Před odpovědí zkontrolujte aritmetiku.“
To odráží běžné osvědčené postupy pro modely ve stylu R1: minimální promptování, vyhýbání se vyvolávání řetězce myšlenek a spoléhání se na interní uvažování modelu.
Knihovna promptů: Úryvky připravené ke kopírování
A) Komplexní plánování (R1)
Cíl: Naplánujte 6týdenní beta verzi produktu pro 1 000 uživatelů s minimálním odlivem.
Vrátit:
- Zmírnění (jedno na riziko)
Omezení: Udržujte celkový počet slov pod 200.
### B) Chat citlivý na zásady (v3)
Systém: Jste užitečný asistent, který dodržuje zásady. Pokud požadavek koliduje se zásadami, položte objasňující otázku nebo nabídněte bezpečnou alternativu.
Uživatel: Navrhněte odpověď na vrácení peněz za zpožděnou objednávku. Udržujte empatický tón a nabídněte dvě možnosti.
### C) Matematika/Logika (R1)
Vyřešte následující. Uveďte konečnou odpověď a 2větnou kontrolu.
Problém: {word problem}
Jste zkušený recenzent Pythonu. Analyzujte úryvek z hlediska výkonu a čitelnosti.
Vrátit:
- Příklad refaktoringu (<=30 řádků)
### E) Extrakce dat do JSON (v3)
Systém: Vraťte pouze platný JSON.
Uživatel: Extrahujte společnost, příjmy a sídlo z textu. Pokud chybí, použijte null.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
Odstraňování problémů: Když se výstupy odchylují nebo halucinují
- Příliš podrobné? Snižte maximální počet tokenů nebo přidejte „Max. 120 slov.“
- Nekonzistentní formát? Přidejte systémový prompt pouze pro JSON a ukončovací sekvenci.
- Nesprávné předpoklady? Přidejte jednořádkové omezení: „Pokud si nejste jisti, položte 1 objasňující otázku.“
- Matematické chyby? Přidejte „Před konečnou odpovědí zkontrolujte aritmetiku.“
- Křehké úkoly s řetězcem? Rozdělte na dvě volání: plán → provedení.
Rychlý start API (konceptuální)
- Správa koncových bodů a klíčů se řídí rozhraním ve stylu OpenAI. Očekávejte standardní pole, jako je
model, messages, temperature, max_tokens a možnosti streamování.
- Specifika a tvrzení o výkonu DeepSeek v3 jsou shrnuty v oficiálních novinkách/aktualizacích modelu a modelových kartách.
Stojí za zmínku: Použití Sider.AI pro iteraci promptů
Pokud rychle zkoumáte vzory – testujete nulový počet příkladů vs. několik příkladů, přepínáte formáty nebo porovnáváte odpovědi R1 vs. v3 – asistent překrytí může urychlit smyčku. Mimochodem, Sider.AI usnadňuje navrhování, iteraci a A/B testování promptů na různých stránkách a nástrojích v jediném pracovním postupu, takže se můžete zaměřit na minimální prompt, který pro váš úkol funguje nejlépe. Klíčové poznatky
- Upřednostňujte minimální prompty s nulovým počtem příkladů pro DeepSeek R1; vyhýbejte se explicitním požadavkům na řetězec myšlenek.
- Používejte DeepSeek v3 pro rychlý, škálovatelný chat a strukturované úkoly; spoléhejte se na omezené formáty pro spolehlivost.
- Přidávejte příklady s několika příklady pouze pro opravu konzistentních režimů selhání.
- Vynucujte strukturu pomocí schémat JSON, krátkých systémových promptů a ukončovacích sekvencí.
- Pro složité uvažování žádejte konečné odpovědi plus stručné zdůvodnění – nikoli úplné protokoly uvažování.
FAQ
Otázka 1: Kdy bych měl zvolit DeepSeek R1 místo DeepSeek v3?
Vyberte DeepSeek R1 pro vícestupňové uvažování, složité plánování a matematické/logické úkoly. Zvolte v3 pro rychlý, obecný chat, návrhy, pomoc s kódováním a vysoce propustné pipeline.
Otázka 2: Mám používat promptování s řetězcem myšlenek s DeepSeek R1?
Ne. Doporučení naznačují, abyste se vyhýbali explicitnímu řetězci myšlenek a spoléhali se na vestavěné uvažování modelu. Místo toho žádejte konečné odpovědi se stručným zdůvodněním.
Otázka 3: Jak získám konzistentní JSON z DeepSeek v3?
Použijte krátký systémový prompt, který vyžaduje pouze JSON, definujte přísné schéma a volitelně nastavte ukončovací sekvence. Snižte teplotu a omezte maximální počet tokenů, abyste omezili odchylky.
Otázka 4: Jakou teplotu bych měl použít pro úkoly vyžadující uvažování?
Začněte nízko (0,0–0,3) pro determinismus a hodnocení. Zvyšte na 0,4–0,7 pro vyváženou kreativitu při návrhu nebo kódování; použijte vyšší hodnoty pro brainstorming.
Otázka 5: Mohu spouštět modely DeepSeek lokálně?
Existují komunitní nastavení pro experimentování, ale produkce často používá hostovaná API pro stabilitu a výkon. Zkontrolujte modelové karty a komunitní příručky pro místní pokyny.