Kaip naudoti DeepSeek v3 ir R1: raginimai argumentavimui ir pokalbių užduotims
Jei kada nors per daug sudėtingai sukonstravote raginimą ir gavote prastesnį atsakymą, nesate vieni. Su argumentavimu pagrįstais modeliais, tokiais kaip DeepSeek R1, ir didelio pralaidumo pokalbių modeliais, tokiais kaip DeepSeek v3, senas vadovas (ilgai trunkantys raginimai, intensyvus grandininis mąstymo įtikinėjimas) dažnai duoda priešingų rezultatų. Šis vadovas parodo, kaip tiksliai raginti DeepSeek v3 ir R1 argumentavimo ir pokalbių užduotims – ką palikti paprasta, kada daryti pakopas ir kaip sureguliuoti nustatymus, kad rezultatai būtų stabilūs ir tikslūs.
Stiliaus pastaba: praktiška ir orientuota į sprendimus. Mes sutelksime dėmesį į tai, kas veikia, pateikdami "nukopijuok ir įklijuok" šablonus ir apsaugos priemones.
- Naudokite DeepSeek R1, kai jums reikia tvirto daugiapakopio argumentavimo, įrodymų ir sudėtingo planavimo.
- Naudokite DeepSeek v3 greitam, tiksliam pokalbiui, pagalbai koduojant, projektų rengimui ir bendriems klausimams ir atsakymams dideliu mastu.
- Neverkite grandininio mąstymo. Vietoj to prašykite „galutinių atsakymų“, „trumpo pagrindimo“ arba struktūruotų išvesties duomenų.
- Raginimus laikykite trumpus ir aiškius; apribojimus ir vertinimo kriterijus pridėkite tik tada, kai būtina.
- Pradėkite nuo nulinio šūvio; pridėkite kelių šūvių pavyzdžių tik tada, jei pastebite nuoseklius gedimų režimus.
Kuo skiriasi DeepSeek R1 nuo v3
- DeepSeek R1: argumentavimui optimizuotas modelis, sukurtas „pagalvoti prieš atsakant“, sumažinant poreikį aiškiai nurodyti žingsnis po žingsnio. Daugelis platformų ir dokumentų pataria vengti grandininio mąstymo reikalavimų; nulinis šūvis dažnai geriausiai tinka R1.
- DeepSeek v3: greitas, stiprus MoE pokalbių modelis (iš viso 671B parametrų; 37B aktyvūs vienam tokenui), skirtas bendrosios paskirties kalbos užduotims atlikti, pasižymintis puikiu sąnaudų ir našumo santykiu, pažįstama API ergonomika ir šiuolaikine modelio kokybe. Oficialiuose dokumentuose rodomas OpenAI stiliaus API naudojimas.
Praktiškai:
- Pasirinkite R1, jei reikia: matematikos uždavinių tekstais, strategijos suskirstymo, daugiapakopio planavimo, sudėtingo argumentavimo su paslėptais žingsniais.
- Pasirinkite v3, jei reikia: klientų pokalbių, kodo peržiūrų, perrašymo, apibendrinimo ir greitų iteracijos ciklų.
Auksinė taisyklė: neperkraukite argumentavimo modelių raginimais
Argumentavimo modeliai, tokie kaip R1, jau atlieka vidinį svarstymą. Grandininio mąstymo primetimas („galvokite žingsnis po žingsnio ir parodykite savo argumentavimą“) dažnai prideda žodžių, gali blaškyti modelį ir kai kuriais atvejais gali būti nerekomenduojamas. Vietoj to, naudokite:
- „Pateikite galutinį atsakymą ir trumpą paaiškinimą.“
- „Pateikite atsakymą, tada išvardykite 3 pagrindinius veiksnius, kurie jus ten nuvedė.“
- „Grąžinkite tik rezultatą ir 2 sakinių pagrindimą.“
Tai atitinka gaires, kad paprasti, nulinio šūvio raginimai gali būti tokie pat veiksmingi – arba geresni – nei sudėtingos žingsnis po žingsnio instrukcijos R1.
Veikiantys raginimo šablonai
1) Nulinis šūvis, minimalistinis (geriausias pirmas bandymas R1; puikiai tinka ir v3)
Tikslas: išspręsti netrivialią problemą su minimaliais apribojimais.
Raginimo šablonas:
Jūs esate atidus problemų sprendėjas.
Klausimas: {task}
Instrukcijos: pateikite galutinį atsakymą ir glaustą pagrindimą (maks. 3 sakiniai).
Kodėl tai veikia: tai skatina vidinį argumentavimą, tuo pačiu išlaikant išvesties duomenis sutelktus ir trumpus.
2) Apribota išvestis (skirta API, patikimumui arba automatizavimui)
Naudokite, kai jums reikia nuspėjamų formatų.
Raginimo šablonas:
Sistema: turite grąžinti tik tinkamą JSON.
Vartotojas: apibendrinkite šį dokumentą 5 punktais, nurodydami vieną riziką ir vieną galimybę.
Grąžinti JSON: {
"bullets": . Naujienų / modelio pastabose pabrėžiamas v3 efektyvumas ir mastas, o modelio kortelėse pateikiamas papildomas kontekstas.
DeepSeek v3 ir R1 pasirinkimas pagal naudojimo atvejį
- Klientų aptarnavimo pokalbiai: v3 greičiui ir sąnaudoms; pridėkite kelių šūvių pavyzdžių, kad atitiktų toną ir politiką.
- Analitikų instruktažai ir sprendimų memorandumai: R1 didesniam argumentavimo vientisumui; nustatykite „trumpo pagrindimo“ apribojimą.
- Kodo peržiūros ir refaktoravimo planai: v3 puikiai tinka greitai iteracijai; R1, kai jums reikia gilaus argumentavimo apie kompromisus.
- Matematika, logika, planavimas su apribojimais: R1 paprastai puikiai pasižymi.
- Didelio masto apibendrinimo arba perrašymo konvejeriai: v3 pralaidumui.
Apie mokymo programą, sukurtą su R1 RAG asistente, žr. bendruomenės ir mokymo programos rašinius, kuriuose pateikiami kompleksiniai šablonai, į kodavimą orientuoti v3 pavyzdžiai ir vietiniai eksperimentai per bendruomenės rinkinius.
Saugus argumentavimo turinio tvarkymas
- Neprašykite viso grandininio mąstymo. Jei jums reikia skaidrumo, paprašykite trumpo pagrindimo arba pagrindinių veiksnių sąrašo.
- Jautriose srityse įtraukite politikos eilutę: „Jei nesate tikri arba užduotis gali padaryti žalos, užduokite patikslinančių klausimų arba atsisakykite.“
- Pridėkite skaitinių užduočių patvirtinimo raginimus: „Prieš atsakydami dar kartą patikrinkite aritmetiką.“
Tai atspindi bendras geriausios praktikos gaires, skirtas R1 stiliaus modeliams: minimalus raginimas, venkite grandininio mąstymo išgavimo ir pasikliaukite modelio vidiniu argumentavimu.
Raginimų biblioteka: paruošti naudojimui fragmentai
A) Sudėtingas planavimas (R1)
Tikslas: suplanuoti 6 savaičių produkto beta versiją 1 000 vartotojų su minimaliu atsisakymu.
Grąžinti:
- Pagrindinės rizikos (maks. 5)
- Rizikos mažinimo priemonės (po vieną rizikai)
Apribojimai: bendras skaičius neviršija 200 žodžių.
### B) Politikai jautrus pokalbis (v3)
Sistema: jūs esate naudingas, politiką atitinkantis asistentas. Jei užklausa prieštarauja politikai, užduokite patikslinantį klausimą arba pasiūlykite saugią alternatyvą.
Vartotojas: parengkite atsakymą dėl uždelsto užsakymo grąžinimo. Išlaikykite empatišką toną ir pasiūlykite dvi parinktis.
### C) Matematika / Logika (R1)
Išspręskite toliau pateiktą užduotį. Pateikite galutinį atsakymą ir 2 sakinių patikrinimą.
Problema: {word problem}
### D) Kodo peržiūra (v3)
Jūs esate vyresnysis Python recenzentas. Išanalizuokite fragmentą dėl našumo ir įskaitomumo.
Grąžinti:
- Problemos (surašytos punktais)
- Pataisymai (surašyti punktais)
- Refaktoravimo pavyzdys (<=30 eilučių)
### E) Duomenų išgavimas į JSON (v3)
Sistema: grąžinkite tik tinkamą JSON.
Vartotojas: iš teksto ištraukite įmonę, pajamas ir būstinę. Jei trūksta, naudokite null.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Tekstas: {paste}
Trikčių šalinimas: kai išvesties duomenys nukrypsta arba haliucinuoja
- Per daug išsamu? Sumažinkite maksimalų žetonų skaičių arba pridėkite „Maks. 120 žodžių.“
- Nenuoseklus formatas? Pridėkite tik JSON sistemos raginimą ir sustabdymo seką.
- Neteisingos prielaidos? Pridėkite vienos eilutės apribojimą: „Jei nesate tikri, užduokite 1 patikslinantį klausimą.“
- Matematikos klaidos? Pridėkite „Prieš pateikdami galutinį atsakymą dar kartą patikrinkite aritmetiką.“
- Trapūs grandininiai uždaviniai? Padalinkite į du skambučius: planuoti → vykdyti.
API greita pradžia (konceptuali)
- Galinių punktų ir raktų valdymas atitinka OpenAI stiliaus sąsają. Tikėkitės standartinių laukų, tokių kaip
model, messages, temperature, max_tokens ir srautinio perdavimo parinkčių.
- Išsami informacija apie DeepSeek v3 ir teiginiai apie našumą apibendrinti oficialiose naujienose / modelio atnaujinime ir modelio kortelėse.
Verta paminėti: Sider.AI naudojimas raginimų iteracijai
Jei greitai tyrinėjate šablonus – išbandote nulinį šūvį ir kelis šūvius, perjungiate formatus arba lyginate R1 ir v3 atsakymus – perdangos asistentas gali pagreitinti ciklą. Beje, Sider.AI leidžia lengvai kurti, kartoti ir A/B raginimus įvairiuose puslapiuose ir įrankiuose vienoje darbo eigoje, todėl galite sutelkti dėmesį į minimalų raginimą, kuris geriausiai tinka jūsų užduočiai. Pagrindinės išvados
- Teikite pirmenybę minimaliems, nulinio šūvio raginimams, skirtiems DeepSeek R1; venkite aiškių grandininio mąstymo užklausų.
- Naudokite DeepSeek v3 greitam, keičiamo masto pokalbiui ir struktūruotoms užduotims; pasikliaukite apribotais formatais, kad užtikrintumėte patikimumą.
- Pridėkite kelių šūvių pavyzdžių tik norėdami ištaisyti nuoseklius gedimų režimus.
- Įgyvendinkite struktūrą naudodami JSON schemas, trumpus sistemos raginimus ir sustabdymo sekas.
- Sudėtingam argumentavimui paprašykite galutinių atsakymų ir trumpų pagrindimų, o ne visų argumentavimo žurnalų.
DUK
1 klausimas: kada turėčiau pasirinkti DeepSeek R1, o ne DeepSeek v3?
Pasirinkite DeepSeek R1 daugiapakopiam argumentavimui, sudėtingam planavimui ir matematikos / logikos užduotims. Pasirinkite v3 greitam, bendram pokalbiui, projektų rengimui, pagalbai koduojant ir didelio pralaidumo konvejeriams.
2 klausimas: ar turėčiau naudoti grandininio mąstymo raginimus su DeepSeek R1?
Ne. Gairės rodo, kad reikia vengti aiškaus grandininio mąstymo ir pasikliauti modelio įmontuotu argumentavimu. Vietoj to paprašykite galutinių atsakymų su trumpais pagrindimais.
3 klausimas: kaip gauti nuoseklų JSON iš DeepSeek v3?
Naudokite trumpą sistemos raginimą, kuris reikalauja tik JSON, apibrėžkite griežtą schemą ir, jei reikia, nustatykite sustabdymo sekas. Sumažinkite temperatūrą ir apribokite maksimalų žetonų skaičių, kad apribotumėte nukrypimą.
4 klausimas: kokią temperatūrą turėčiau naudoti argumentavimo užduotims?
Pradėkite nuo žemos (0,0–0,3), kad užtikrintumėte determinizmą ir įvertinimą. Padidinkite iki 0,4–0,7, kad sukurtumėte subalansuotą kūrybiškumą rengiant ar koduojant; naudokite didesnes vertes, kad generuotumėte idėjas.
5 klausimas: ar galiu paleisti DeepSeek modelius vietoje?
Eksperimentams yra bendruomenės sąrankos, tačiau gamybai dažnai naudojamos priglobtos API, kad būtų užtikrintas stabilumas ir našumas. Vietines instrukcijas rasite modelio kortelėse ir bendruomenės vadovuose.