Hur man använder DeepSeek v3 och R1: Promptning för resonemang och chattuppgifter
Om du någonsin har överkonstruerat en prompt bara för att få ett sämre svar är du inte ensam. Med resonemangsbaserade modeller som DeepSeek R1 och chattmodeller med högt genomflöde som DeepSeek v3 slår den gamla taktiken (långa prompter, tung kedja-av-tankar-övertalning) ofta tillbaka. Den här guiden visar dig exakt hur du promptar DeepSeek v3 och R1 för resonemangs- och chattuppgifter – vad du ska hålla enkelt, när du ska bygga upp och hur du justerar inställningar för stabila, korrekta resultat.
Stilnotering: Praktisk och lösningsorienterad. Vi kommer att fokusera på vad som fungerar, med klipp-och-klistra-mönster och skyddsräcken.
- Använd DeepSeek R1 när du behöver robusta resonemang i flera steg, bevis och komplex planering.
- Använd DeepSeek v3 för snabb, exakt chatt, kodningshjälp, utkast och allmänna frågor och svar i stor skala.
- Tvinga inte fram kedjan-av-tankar. Be istället om "slutgiltiga svar", "kortfattad motivering" eller strukturerade utdata.
- Håll prompterna korta och tydliga; lägg till begränsningar och utvärderingskriterier endast när det är nödvändigt.
- Börja med noll-skott; lägg till få-skotts-exempel endast om du ser konsekventa fellägen.
Vad är skillnaden mellan DeepSeek R1 och v3
- DeepSeek R1: En resonemangsoptimerad modell utformad för att "tänka innan du svarar", vilket minskar behovet av explicit steg-för-steg-promptning. Många plattformar och dokument rekommenderar att man undviker krav på kedjan-av-tankar; noll-skott fungerar ofta bäst för R1.
- DeepSeek v3: En snabb, stark MoE-chattmodell (totalt 671 miljarder parametrar; 37 miljarder aktiva per token) som syftar till allmänna språkuppgifter med utmärkt kostnadsprestanda, välbekant API-ergonomi och modern modellkvalitet. Officiella dokument visar API-användning i OpenAI-stil.
I praktiken:
- Välj R1 för: matematiska ordproblem, strategiska nedbrytningar, planering med flera begränsningar, knepiga resonemang med latenta steg.
- Välj v3 för: kundchatt, kodgranskningar, omskrivning, sammanfattning och snabba iterationsslingor.
Den gyllene regeln: Över-prompta inte resonemangsmodeller
Resonemangsmodeller som R1 utför redan intern överläggning. Att tvinga fram kedjan-av-tankar ("tänk steg för steg och visa ditt resonemang") lägger ofta till utförlighet, kan distrahera modellen och i vissa inställningar kan det avrådas. Använd istället:
- "Ge det slutgiltiga svaret och en kort förklaring."
- "Ge svaret och lista sedan de tre viktigaste faktorerna som ledde dig dit."
- "Returnera endast resultatet plus en 2-meningsmotivering."
Detta överensstämmer med vägledning om att enkla noll-skotts-prompter kan vara lika effektiva – eller bättre – än komplicerade stegvisa instruktioner för R1.
Promptningsmönster som fungerar
1) Noll-skott, minimalistisk (Bästa första försöket för R1; bra för v3 också)
Mål: Lös ett icke-trivialt problem med minimala begränsningar.
Promptmall:
Du är en noggrann problemlösare.
Fråga: {task}
Instruktioner: Ange det slutgiltiga svaret och en kortfattad motivering (max 3 meningar).
Varför detta fungerar: Det uppmuntrar till internt resonemang samtidigt som utdata hålls fokuserade och korta.
2) Begränsad utdata (För API:er, tillförlitlighet eller automatisering)
Använd när du behöver förutsägbara format.
Promptmall:
System: Du måste endast returnera giltig JSON.
Användare: Sammanfatta det här dokumentet i 5 punkter med en risk och en möjlighet.
Returnera JSON: {
"bullets": . Nyheter/modellnoteringar lyfter fram v3:s effektivitet och skala, medan modellkort ger ytterligare sammanhang.
Välja mellan DeepSeek v3 och R1 efter användningsfall
- Kundsupportchatt: v3 för snabbhet och kostnad; lägg till få-skotts-exempel för ton och policyefterlevnad.
- Analytikerbriefingar och besluts PM: R1 för resonemang med högre integritet; ställ in begränsningen "kortfattad motivering".
- Kodgranskning och refaktoreringsplaner: v3 är utmärkt för snabb iteration; R1 när du behöver djupgående resonemang om kompromisser.
- Matematik, logik, schemaläggning med begränsningar: R1 utmärker sig vanligtvis.
- Storskalig sammanfattning eller omskrivningspipelines: v3 för genomströmning.
För en handledning om att bygga med R1 i en RAG-assistent, se community- och handledningsskrifter som visar end-to-end-mönster, kodningsorienterade exempel för v3 och lokala experiment genom community-stackar.
Säker hantering av resonemangsinnehåll
- Be inte om fullständig kedja-av-tankar. Om du behöver transparens, begär en kort motivering eller en lista över viktiga faktorer.
- För känsliga domäner, inkludera en policylinje: "Om du är osäker eller om uppgiften kan orsaka skada, ställ förtydligande frågor eller vägra."
- Lägg till valideringsprompter för numeriska uppgifter: "Dubbelkolla aritmetiken innan du svarar."
Detta speglar den vanliga bästa praxisvägledningen för R1-stilmodeller: minimal promptning, undvik framkallning av kedjan-av-tankar och lita på modellens interna resonemang.
Promptbibliotek: Kopieringsklara kodsnuttar
A) Komplex planering (R1)
Mål: Planera en 6-veckors produktbeta för 1 000 användare med minimal churn.
Returnera:
- Milstolpar (vecka för vecka)
- Åtgärder (en per risk)
Begränsningar: Håll totalen under 200 ord.
### B) Policykänslig chatt (v3)
System: Du är en hjälpsam, policykompatibel assistent. Om en begäran strider mot policyn, ställ en förtydligande fråga eller ge ett säkert alternativ.
Användare: Utarbeta ett återbetalningssvar för en försenad beställning. Behåll en empatisk ton och erbjud två alternativ.
### C) Matematik/Logik (R1)
Lös följande. Ange det slutgiltiga svaret och en 2-meningskontroll.
Problem: {word problem}
### D) Kodgranskning (v3)
Du är en senior Python-granskare. Analysera kodavsnittet för prestanda och läsbarhet.
Returnera:
- Exempel på refaktorisering (<=30 rader)
### E) Dataextraktion till JSON (v3)
System: Returnera endast giltig JSON.
Användare: Extrahera företag, intäkter och HQ från texten. Om det saknas, använd null.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
Felsökning: När utdata glider eller hallucinerar
- För utförligt? Sänk max tokens eller lägg till "Max 120 ord."
- Inkonsekvent format? Lägg till systemprompt endast för JSON och en stoppsekvens.
- Felaktiga antaganden? Lägg till en enradig begränsning: "Om du är osäker, ställ 1 förtydligande fråga."
- Matematiska fel? Lägg till "Dubbelkolla aritmetiken innan det slutgiltiga svaret."
- Bräckliga kedjeuppgifter? Dela upp i två anrop: planera → utför.
API Snabbstart (Konceptuell)
- Slutpunkts- och nyckelhantering följer ett gränssnitt i OpenAI-stil. Förvänta dig standardfält som
model, messages, temperature, max_tokens och strömningsalternativ.
- DeepSeek v3-specifikationer och prestandapåståenden sammanfattas i den officiella nyhets-/modelluppdateringen och modellkorten.
Värt att notera: Använda Sider.AI för promptiteration
Om du utforskar mönster snabbt – testar noll-skott vs. få-skott, växlar format eller jämför R1 vs v3-svar – kan en overlay-assistent snabba upp slingan. Förresten, Sider.AI gör det enkelt att utarbeta, iterera och A/B-prompter över sidor och verktyg i ett enda arbetsflöde, så att du kan nollställa den minimala prompten som fungerar bäst för din uppgift. Viktiga slutsatser
- Föredra minimala noll-skotts-prompter för DeepSeek R1; undvik explicita förfrågningar om kedjan-av-tankar.
- Använd DeepSeek v3 för snabb, skalbar chatt och strukturerade uppgifter; luta dig mot begränsade format för tillförlitlighet.
- Lägg till få-skotts-exempel endast för att korrigera konsekventa fellägen.
- Tvinga fram struktur med JSON-scheman, korta systemprompter och stoppsekvenser.
- För komplexa resonemang, be om slutgiltiga svar plus korta motiveringar – inte fullständiga resonemangsloggar.
FAQ
F1: När ska jag välja DeepSeek R1 framför DeepSeek v3?
Välj DeepSeek R1 för resonemang i flera steg, komplex planering och matematik/logikuppgifter. Välj v3 för snabb, allmän chatt, utkast, kodningshjälp och pipelines med högt genomflöde.
F2: Ska jag använda kedjan-av-tankar-promptning med DeepSeek R1?
Nej. Vägledning tyder på att man undviker explicit kedjan-av-tankar och förlitar sig på modellens inbyggda resonemang. Be istället om slutgiltiga svar med korta motiveringar.
F3: Hur får jag konsekvent JSON från DeepSeek v3?
Använd en kort systemprompt som endast kräver JSON, definiera ett snävt schema och ställ eventuellt in stoppsekvenser. Sänk temperaturen och begränsa max tokens för att begränsa drift.
F4: Vilken temperatur ska jag använda för resonemangsuppgifter?
Börja lågt (0,0–0,3) för determinism och utvärdering. Höj till 0,4–0,7 för balanserad kreativitet i utkast eller kodning; använd högre värden för brainstorming.
F5: Kan jag köra DeepSeek-modeller lokalt?
Community-inställningar finns för experiment, men produktion använder ofta hostade API:er för stabilitet och prestanda. Kontrollera modellkort och community-guider för lokala instruktioner.