Ako používať DeepSeek v3 a R1: Promptovanie pre úlohy vyžadujúce uvažovanie a chat
Ak ste niekedy prekomplikovali prompt len preto, aby ste dostali horšiu odpoveď, nie ste sami. S modelmi, ktoré kladú dôraz na uvažovanie, ako je DeepSeek R1, a chat modelmi s vysokou priepustnosťou, ako je DeepSeek v3, starý postup (dlhé prompty, silné povzbudzovanie k reťazovému uvažovaniu) sa často obráti proti vám. Táto príručka vám presne ukáže, ako promptovať DeepSeek v3 a R1 pre úlohy vyžadujúce uvažovanie a chat – čo ponechať jednoduché, kedy použiť štruktúru a ako vyladiť nastavenia pre stabilné a presné výsledky.
Poznámka k štýlu: Praktické a orientované na riešenia. Zameriame sa na to, čo funguje, s vzormi na kopírovanie a vkládanie a ochrannými prvkami.
- Použite DeepSeek R1, keď potrebujete robustné viacstupňové uvažovanie, dôkazy a komplexné plánovanie.
- Použite DeepSeek v3 pre rýchly a presný chat, pomoc pri kódovaní, tvorbu návrhov a všeobecné otázky a odpovede v rozsiahlej miere.
- Nenúťte reťazové uvažovanie. Namiesto toho žiadajte „konečné odpovede“, „stručné zdôvodnenie“ alebo štruktúrované výstupy.
- Udržujte prompty krátke a jasné; pridávajte obmedzenia a hodnotiace kritériá len vtedy, keď je to nevyhnutné.
- Začnite s nulovým počtom príkladov (zero-shot); pridávajte príklady s malým počtom príkladov (few-shot) len vtedy, ak vidíte konzistentné zlyhania.
V čom sa líši DeepSeek R1 od v3
- DeepSeek R1: Model optimalizovaný pre uvažovanie, navrhnutý tak, aby „rozmýšľal predtým, ako odpovie“, čím sa znižuje potreba explicitného promptovania krok za krokom. Mnohé platformy a dokumenty odporúčajú vyhýbať sa požiadavkám na reťazové uvažovanie; zero-shot často funguje najlepšie pre R1.
- DeepSeek v3: Rýchly a silný MoE chat model (celkovo 671B parametrov; 37B aktívnych na token) zameraný na všeobecné jazykové úlohy s vynikajúcim pomerom nákladov a výkonu, známou ergonómiou API a modernou kvalitou modelu. Oficiálne dokumenty ukazujú použitie API v štýle OpenAI.
V praxi:
- Vyberte si R1 pre: matematické slovné úlohy, rozbory stratégií, plánovanie s viacerými obmedzeniami, zložité uvažovanie so skrytými krokmi.
- Vyberte si v3 pre: zákaznícky chat, revízie kódu, prepisovanie, sumarizáciu a rýchle iteračné slučky.
Zlaté pravidlo: Nepreplňte modely uvažovania promptami
Modely uvažovania ako R1 už vykonávajú interné uvažovanie. Nútené reťazové uvažovanie („rozmýšľajte krok za krokom a ukážte svoje uvažovanie“) často pridáva zbytočnú verbálnosť, môže model rozptyľovať a v niektorých nastaveniach sa to môže neodporúčať. Namiesto toho použite:
- „Poskytnite konečnú odpoveď a stručné vysvetlenie.“
- „Uveďte odpoveď a potom vymenujte 3 kľúčové faktory, ktoré vás k nej doviedli.“
- „Vráťte iba výsledok plus 2-vetné zdôvodnenie.“
Toto je v súlade s usmernením, že jednoduché, zero-shot prompty môžu byť rovnako účinné – alebo aj lepšie – ako komplikované postupné inštrukcie pre R1.
Vzory promptovania, ktoré fungujú
1) Zero-Shot, Minimalistický (Najlepší prvý pokus pre R1; skvelý aj pre v3)
Cieľ: Vyriešiť netriviálny problém s minimálnymi obmedzeniami.
Šablóna promptu:
Ste dôkladný riešiteľ problémov.
Otázka: {task}
Inštrukcie: Poskytnite konečnú odpoveď a stručné zdôvodnenie (max. 3 vety).
Prečo to funguje: Podporuje to interné uvažovanie a zároveň udržuje výstup zameraný a krátky.
2) Obmedzený výstup (Pre API, spoľahlivosť alebo automatizáciu)
Použite, keď potrebujete predvídateľné formáty.
Šablóna promptu:
Systém: Musíte vrátiť iba platný JSON.
Používateľ: Zosumarizujte tento dokument v 5 bodoch s jedným rizikom a jednou príležitosťou.
Vráťte JSON: {
"bullets": . Poznámky o novinkách/modeloch zdôrazňujú efektívnosť a rozsah v3, zatiaľ čo karty modelu poskytujú ďalší kontext.
Výber medzi DeepSeek v3 a R1 podľa prípadu použitia
- Zákaznícka podpora cez chat: v3 pre rýchlosť a náklady; pridajte few-shot príklady pre tón a dodržiavanie zásad.
- Analytické briefingy a rozhodovacie memoranda: R1 pre uvažovanie s vyššou integritou; nastavte obmedzenie „stručné zdôvodnenie“.
- Revízia kódu a plány refaktorizácie: v3 je vynikajúci pre rýchlu iteráciu; R1, keď potrebujete hlboké uvažovanie o kompromisoch.
- Matematika, logika, plánovanie s obmedzeniami: R1 zvyčajne vyniká.
- Rozsiahle sumarizačné alebo prepisovacie kanály: v3 pre priepustnosť.
Pre tutoriál o budovaní s R1 v RAG asistentovi si pozrite komunitné a tutoriálové články, ktoré ukazujú end-to-end vzory, príklady orientované na kódovanie pre v3 a lokálne experimenty prostredníctvom komunitných stackov.
Bezpečné zaobchádzanie s obsahom uvažovania
- Nepýtajte sa na úplné reťazové uvažovanie. Ak potrebujete transparentnosť, vyžiadajte si krátke zdôvodnenie alebo zoznam kľúčových faktorov.
- Pre citlivé domény zahrňte riadok politiky: „Ak si nie ste istí alebo by úloha mohla spôsobiť škodu, položte objasňujúce otázky alebo odmietnite.“
- Pridajte validačné prompty pre numerické úlohy: „Pred odpoveďou skontrolujte aritmetiku.“
Toto odráža bežné osvedčené postupy pre modely typu R1: minimálne promptovanie, vyhýbanie sa získavaniu reťazového uvažovania a spoliehanie sa na interné uvažovanie modelu.
Knižnica promptov: Úryvky pripravené na kopírovanie
A) Komplexné plánovanie (R1)
Cieľ: Naplánovať 6-týždňovú beta verziu produktu pre 1 000 používateľov s minimálnym odlivom.
Vrátiť:
- Medzníky (týždeň po týždni)
- Zmiernenia (jedno na riziko)
Obmedzenia: Udržujte celkový počet pod 200 slov.
### B) Chat citlivý na zásady (v3)
Systém: Ste nápomocný asistent, ktorý dodržiava zásady. Ak žiadosť je v rozpore so zásadami, položte objasňujúcu otázku alebo ponúknite bezpečnú alternatívu.
Používateľ: Navrhnite odpoveď na vrátenie peňazí za oneskorenú objednávku. Udržujte empatický tón a ponúknite dve možnosti.
### C) Matematika/Logika (R1)
Vyriešte nasledovné. Poskytnite konečnú odpoveď a 2-vetovú kontrolu.
Problém: {word problem}
Ste skúsený recenzent kódu v jazyku Python. Analyzujte úryvok z hľadiska výkonu a čitateľnosti.
Vrátiť:
- Príklad refaktorizácie (<=30 riadkov)
### E) Extrakcia dát do JSON (v3)
Systém: Vráťte iba platný JSON.
Používateľ: Extrahujte spoločnosť, príjem a sídlo z textu. Ak chýbajú, použite null.
Schéma: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
Riešenie problémov: Keď sa výstupy odchyľujú alebo halucinujú
- Príliš rozsiahle? Znížte maximálny počet tokenov alebo pridajte „Max. 120 slov.“
- Nekonzistentný formát? Pridajte systémový prompt iba pre JSON a stop sekvenciu.
- Nesprávne predpoklady? Pridajte jedno-riadkové obmedzenie: „Ak si nie ste istí, položte 1 objasňujúcu otázku.“
- Matematické chyby? Pridajte „Pred konečnou odpoveďou skontrolujte aritmetiku.“
- Krehké reťazové úlohy? Rozdeľte na dve volania: plán → vykonanie.
Rýchly štart API (koncepčný)
- Správa koncového bodu a kľúčov sa riadi rozhraním v štýle OpenAI. Očakávajte štandardné polia ako
model, messages, temperature, max_tokens a možnosti streamovania.
- Špecifiká DeepSeek v3 a tvrdenia o výkone sú zhrnuté v oficiálnych novinkách/aktualizácii modelu a kartách modelu.
Stojí za zmienku: Použitie Sider.AI pre iteráciu promptov
Ak rýchlo skúmate vzory – testujete zero-shot vs. few-shot, prepínate formáty alebo porovnávate odpovede R1 vs. v3 – asistent prekrytia môže urýchliť slučku. Mimochodom, Sider.AI uľahčuje navrhovanie, iteráciu a A/B testovanie promptov na stránkach a nástrojoch v rámci jedného pracovného postupu, takže sa môžete zamerať na minimálny prompt, ktorý najlepšie funguje pre vašu úlohu. Kľúčové poznatky
- Preferujte minimálne, zero-shot prompty pre DeepSeek R1; vyhýbajte sa explicitným žiadostiam o reťazové uvažovanie.
- Použite DeepSeek v3 pre rýchly a škálovateľný chat a štruktúrované úlohy; spoliehajte sa na obmedzené formáty pre spoľahlivosť.
- Pridávajte few-shot príklady iba na opravu konzistentných zlyhaní.
- Vynucujte štruktúru pomocou JSON schém, krátkych systémových promptov a stop sekvencií.
- Pre komplexné uvažovanie žiadajte konečné odpovede plus stručné zdôvodnenia – nie úplné protokoly uvažovania.
FAQ
Q1: Kedy by som si mal vybrať DeepSeek R1 namiesto DeepSeek v3?
Vyberte si DeepSeek R1 pre viacstupňové uvažovanie, komplexné plánovanie a matematické/logické úlohy. Vyberte si v3 pre rýchly, všeobecný chat, tvorbu návrhov, pomoc pri kódovaní a kanály s vysokou priepustnosťou.
Q2: Mám používať promptovanie s reťazovým uvažovaním s DeepSeek R1?
Nie. Usmernenia odporúčajú vyhýbať sa explicitnému reťazovému uvažovaniu a spoliehať sa na vstavané uvažovanie modelu. Namiesto toho žiadajte konečné odpovede so stručnými zdôvodneniami.
Q3: Ako získam konzistentný JSON z DeepSeek v3?
Použite krátky systémový prompt, ktorý vyžaduje iba JSON, definujte prísnu schému a voliteľne nastavte stop sekvencie. Znížte teplotu a obmedzte maximálny počet tokenov, aby ste obmedzili odchýlky.
Q4: Akú teplotu mám použiť pre úlohy uvažovania?
Začnite nízko (0,0 – 0,3) pre determinizmus a hodnotenie. Zvýšte na 0,4 – 0,7 pre vyváženú kreativitu pri tvorbe návrhov alebo kódovaní; použite vyššie hodnoty pre brainstorming.
Q5: Môžem spúšťať modely DeepSeek lokálne?
Existujú komunitné nastavenia na experimentovanie, ale produkcia často používa hostované API pre stabilitu a výkon. Skontrolujte karty modelu a komunitné príručky pre lokálne pokyny.