When should I choose DeepSeek R1 over DeepSeek v3?

Pick DeepSeek R1 for multi‑step reasoning, complex planning, and math/logic tasks. Choose v3 for fast, general chat, drafting, coding assistance, and high‑throughput pipelines.

Should I use chain‑of‑thought prompting with DeepSeek R1?

No. Guidance suggests avoiding explicit chain‑of‑thought and relying on the model’s built‑in reasoning. Ask for final answers with brief justifications instead.

How do I get consistent JSON from DeepSeek v3?

Use a short system prompt that mandates JSON only, define a tight schema, and optionally set stop sequences. Lower temperature and cap max tokens to limit drift.

What temperature should I use for reasoning tasks?

Start low (0.0–0.3) for determinism and evaluation. Raise to 0.4–0.7 for balanced creativity in drafting or coding; use higher values for brainstorming.

Can I run DeepSeek models locally?

Community setups exist for experimentation, but production often uses hosted APIs for stability and performance. Check model cards and community guides for local instructions.

Ako používať DeepSeek v3 a R1: Promptovanie pre úlohy vyžadujúce uvažovanie a chat

Ak ste niekedy prekomplikovali prompt len preto, aby ste dostali horšiu odpoveď, nie ste sami. S modelmi, ktoré kladú dôraz na uvažovanie, ako je DeepSeek R1, a chat modelmi s vysokou priepustnosťou, ako je DeepSeek v3, starý postup (dlhé prompty, silné povzbudzovanie k reťazovému uvažovaniu) sa často obráti proti vám. Táto príručka vám presne ukáže, ako promptovať DeepSeek v3 a R1 pre úlohy vyžadujúce uvažovanie a chat – čo ponechať jednoduché, kedy použiť štruktúru a ako vyladiť nastavenia pre stabilné a presné výsledky.

Poznámka k štýlu: Praktické a orientované na riešenia. Zameriame sa na to, čo funguje, s vzormi na kopírovanie a vkládanie a ochrannými prvkami.

Použite DeepSeek R1, keď potrebujete robustné viacstupňové uvažovanie, dôkazy a komplexné plánovanie.

Použite DeepSeek v3 pre rýchly a presný chat, pomoc pri kódovaní, tvorbu návrhov a všeobecné otázky a odpovede v rozsiahlej miere.

Nenúťte reťazové uvažovanie. Namiesto toho žiadajte „konečné odpovede“, „stručné zdôvodnenie“ alebo štruktúrované výstupy.

Udržujte prompty krátke a jasné; pridávajte obmedzenia a hodnotiace kritériá len vtedy, keď je to nevyhnutné.

Začnite s nulovým počtom príkladov (zero-shot); pridávajte príklady s malým počtom príkladov (few-shot) len vtedy, ak vidíte konzistentné zlyhania.

V čom sa líši DeepSeek R1 od v3

DeepSeek R1: Model optimalizovaný pre uvažovanie, navrhnutý tak, aby „rozmýšľal predtým, ako odpovie“, čím sa znižuje potreba explicitného promptovania krok za krokom. Mnohé platformy a dokumenty odporúčajú vyhýbať sa požiadavkám na reťazové uvažovanie; zero-shot často funguje najlepšie pre R1.

DeepSeek v3: Rýchly a silný MoE chat model (celkovo 671B parametrov; 37B aktívnych na token) zameraný na všeobecné jazykové úlohy s vynikajúcim pomerom nákladov a výkonu, známou ergonómiou API a modernou kvalitou modelu. Oficiálne dokumenty ukazujú použitie API v štýle OpenAI.

V praxi:

Vyberte si R1 pre: matematické slovné úlohy, rozbory stratégií, plánovanie s viacerými obmedzeniami, zložité uvažovanie so skrytými krokmi.

Vyberte si v3 pre: zákaznícky chat, revízie kódu, prepisovanie, sumarizáciu a rýchle iteračné slučky.

Zlaté pravidlo: Nepreplňte modely uvažovania promptami

Modely uvažovania ako R1 už vykonávajú interné uvažovanie. Nútené reťazové uvažovanie („rozmýšľajte krok za krokom a ukážte svoje uvažovanie“) často pridáva zbytočnú verbálnosť, môže model rozptyľovať a v niektorých nastaveniach sa to môže neodporúčať. Namiesto toho použite:

„Poskytnite konečnú odpoveď a stručné vysvetlenie.“

„Uveďte odpoveď a potom vymenujte 3 kľúčové faktory, ktoré vás k nej doviedli.“

„Vráťte iba výsledok plus 2-vetné zdôvodnenie.“

Toto je v súlade s usmernením, že jednoduché, zero-shot prompty môžu byť rovnako účinné – alebo aj lepšie – ako komplikované postupné inštrukcie pre R1.

Vzory promptovania, ktoré fungujú

1) Zero-Shot, Minimalistický (Najlepší prvý pokus pre R1; skvelý aj pre v3)

Cieľ: Vyriešiť netriviálny problém s minimálnymi obmedzeniami.

Šablóna promptu:

Ste dôkladný riešiteľ problémov.
Otázka: {task}
Inštrukcie: Poskytnite konečnú odpoveď a stručné zdôvodnenie (max. 3 vety).

Prečo to funguje: Podporuje to interné uvažovanie a zároveň udržuje výstup zameraný a krátky.

2) Obmedzený výstup (Pre API, spoľahlivosť alebo automatizáciu)

Použite, keď potrebujete predvídateľné formáty.

Šablóna promptu:

Systém: Musíte vrátiť iba platný JSON.
Používateľ: Zosumarizujte tento dokument v 5 bodoch s jedným rizikom a jednou príležitosťou.
Vráťte JSON: {
"bullets": . Poznámky o novinkách/modeloch zdôrazňujú efektívnosť a rozsah v3, zatiaľ čo karty modelu poskytujú ďalší kontext.

Výber medzi DeepSeek v3 a R1 podľa prípadu použitia

Zákaznícka podpora cez chat: v3 pre rýchlosť a náklady; pridajte few-shot príklady pre tón a dodržiavanie zásad.

Analytické briefingy a rozhodovacie memoranda: R1 pre uvažovanie s vyššou integritou; nastavte obmedzenie „stručné zdôvodnenie“.

Revízia kódu a plány refaktorizácie: v3 je vynikajúci pre rýchlu iteráciu; R1, keď potrebujete hlboké uvažovanie o kompromisoch.

Matematika, logika, plánovanie s obmedzeniami: R1 zvyčajne vyniká.

Rozsiahle sumarizačné alebo prepisovacie kanály: v3 pre priepustnosť.

Pre tutoriál o budovaní s R1 v RAG asistentovi si pozrite komunitné a tutoriálové články, ktoré ukazujú end-to-end vzory, príklady orientované na kódovanie pre v3 a lokálne experimenty prostredníctvom komunitných stackov.

Bezpečné zaobchádzanie s obsahom uvažovania

Nepýtajte sa na úplné reťazové uvažovanie. Ak potrebujete transparentnosť, vyžiadajte si krátke zdôvodnenie alebo zoznam kľúčových faktorov.

Pre citlivé domény zahrňte riadok politiky: „Ak si nie ste istí alebo by úloha mohla spôsobiť škodu, položte objasňujúce otázky alebo odmietnite.“

Pridajte validačné prompty pre numerické úlohy: „Pred odpoveďou skontrolujte aritmetiku.“

Toto odráža bežné osvedčené postupy pre modely typu R1: minimálne promptovanie, vyhýbanie sa získavaniu reťazového uvažovania a spoliehanie sa na interné uvažovanie modelu.

Knižnica promptov: Úryvky pripravené na kopírovanie

A) Komplexné plánovanie (R1)

Cieľ: Naplánovať 6-týždňovú beta verziu produktu pre 1 000 používateľov s minimálnym odlivom. Vrátiť:

Medzníky (týždeň po týždni)

Kľúčové riziká (max. 5)

Zmiernenia (jedno na riziko) Obmedzenia: Udržujte celkový počet pod 200 slov.


### B) Chat citlivý na zásady (v3)

Systém: Ste nápomocný asistent, ktorý dodržiava zásady. Ak žiadosť je v rozpore so zásadami, položte objasňujúcu otázku alebo ponúknite bezpečnú alternatívu. Používateľ: Navrhnite odpoveď na vrátenie peňazí za oneskorenú objednávku. Udržujte empatický tón a ponúknite dve možnosti.


### C) Matematika/Logika (R1)

Vyriešte nasledovné. Poskytnite konečnú odpoveď a 2-vetovú kontrolu. Problém: {word problem}


### D) Revízia kódu (v3)

Ste skúsený recenzent kódu v jazyku Python. Analyzujte úryvok z hľadiska výkonu a čitateľnosti. Vrátiť:

Problémy (s odrážkami)

Opravy (s odrážkami)

Príklad refaktorizácie (<=30 riadkov)


### E) Extrakcia dát do JSON (v3)

Systém: Vráťte iba platný JSON. Používateľ: Extrahujte spoločnosť, príjem a sídlo z textu. Ak chýbajú, použite null. Schéma: {"company":"string","revenue":"string|null","hq":"string|null"} Text: {paste}

Riešenie problémov: Keď sa výstupy odchyľujú alebo halucinujú

Príliš rozsiahle? Znížte maximálny počet tokenov alebo pridajte „Max. 120 slov.“

Nekonzistentný formát? Pridajte systémový prompt iba pre JSON a stop sekvenciu.

Nesprávne predpoklady? Pridajte jedno-riadkové obmedzenie: „Ak si nie ste istí, položte 1 objasňujúcu otázku.“

Matematické chyby? Pridajte „Pred konečnou odpoveďou skontrolujte aritmetiku.“

Krehké reťazové úlohy? Rozdeľte na dve volania: plán → vykonanie.

Rýchly štart API (koncepčný)

Správa koncového bodu a kľúčov sa riadi rozhraním v štýle OpenAI. Očakávajte štandardné polia ako model, messages, temperature, max_tokens a možnosti streamovania.

Špecifiká DeepSeek v3 a tvrdenia o výkone sú zhrnuté v oficiálnych novinkách/aktualizácii modelu a kartách modelu.

Stojí za zmienku: Použitie Sider.AI pre iteráciu promptov

Ak rýchlo skúmate vzory – testujete zero-shot vs. few-shot, prepínate formáty alebo porovnávate odpovede R1 vs. v3 – asistent prekrytia môže urýchliť slučku. Mimochodom, Sider.AI uľahčuje navrhovanie, iteráciu a A/B testovanie promptov na stránkach a nástrojoch v rámci jedného pracovného postupu, takže sa môžete zamerať na minimálny prompt, ktorý najlepšie funguje pre vašu úlohu.

Kľúčové poznatky

Preferujte minimálne, zero-shot prompty pre DeepSeek R1; vyhýbajte sa explicitným žiadostiam o reťazové uvažovanie.

Použite DeepSeek v3 pre rýchly a škálovateľný chat a štruktúrované úlohy; spoliehajte sa na obmedzené formáty pre spoľahlivosť.

Pridávajte few-shot príklady iba na opravu konzistentných zlyhaní.

Vynucujte štruktúru pomocou JSON schém, krátkych systémových promptov a stop sekvencií.

Pre komplexné uvažovanie žiadajte konečné odpovede plus stručné zdôvodnenia – nie úplné protokoly uvažovania.

FAQ

Q1: Kedy by som si mal vybrať DeepSeek R1 namiesto DeepSeek v3? Vyberte si DeepSeek R1 pre viacstupňové uvažovanie, komplexné plánovanie a matematické/logické úlohy. Vyberte si v3 pre rýchly, všeobecný chat, tvorbu návrhov, pomoc pri kódovaní a kanály s vysokou priepustnosťou.

Q2: Mám používať promptovanie s reťazovým uvažovaním s DeepSeek R1? Nie. Usmernenia odporúčajú vyhýbať sa explicitnému reťazovému uvažovaniu a spoliehať sa na vstavané uvažovanie modelu. Namiesto toho žiadajte konečné odpovede so stručnými zdôvodneniami.

Q3: Ako získam konzistentný JSON z DeepSeek v3? Použite krátky systémový prompt, ktorý vyžaduje iba JSON, definujte prísnu schému a voliteľne nastavte stop sekvencie. Znížte teplotu a obmedzte maximálny počet tokenov, aby ste obmedzili odchýlky.

Q4: Akú teplotu mám použiť pre úlohy uvažovania? Začnite nízko (0,0 – 0,3) pre determinizmus a hodnotenie. Zvýšte na 0,4 – 0,7 pre vyváženú kreativitu pri tvorbe návrhov alebo kódovaní; použite vyššie hodnoty pre brainstorming.

Q5: Môžem spúšťať modely DeepSeek lokálne? Existujú komunitné nastavenia na experimentovanie, ale produkcia často používa hostované API pre stabilitu a výkon. Skontrolujte karty modelu a komunitné príručky pre lokálne pokyny.