Kako koristiti DeepSeek v3 i R1: Upute za poticanje zaključivanja i zadataka razgovora
Ako ste ikada prekomplicirali upit i dobili lošiji odgovor, niste jedini. S modelima koji prvo zaključuju, poput DeepSeek R1, i modelima za razgovor visokog propusnog opsega, poput DeepSeek v3, stara pravila (dugi upiti, snažno poticanje lanca razmišljanja) često se obiju o glavu. Ovaj vodič pokazuje vam točno kako potaknuti DeepSeek v3 i R1 za zadatke zaključivanja i razgovora—što zadržati jednostavnim, kada graditi i kako prilagoditi postavke za stabilne i točne rezultate.
Napomena o stilu: Praktično i usmjereno na rješenja. Usredotočit ćemo se na ono što funkcionira, s uzorcima za kopiranje i lijepljenje te zaštitnim ogradama.
- Koristite DeepSeek R1 kada vam je potrebno robusno zaključivanje u više koraka, dokazi i složeno planiranje.
- Koristite DeepSeek v3 za brz i točan razgovor, pomoć pri kodiranju, izradu nacrta i općenita pitanja i odgovore u velikom opsegu.
- Nemojte forsirati lanac razmišljanja. Umjesto toga, tražite "konačne odgovore", "kratko obrazloženje" ili strukturirane izlaze.
- Neka upiti budu kratki i jasni; dodajte ograničenja i kriterije ocjenjivanja samo kada je to potrebno.
- Počnite s pristupom nula snimaka; dodajte primjere s nekoliko snimaka samo ako primijetite dosljedne načine neuspjeha.
U čemu je razlika između DeepSeek R1 i v3
- DeepSeek R1: Model optimiziran za zaključivanje, dizajniran za "razmišljanje prije odgovaranja", smanjujući potrebu za eksplicitnim poticanjem korak po korak. Mnoge platforme i dokumenti savjetuju izbjegavanje zahtjeva za lancem razmišljanja; pristup nula snimaka često najbolje funkcionira za R1.
- DeepSeek v3: Brz i snažan MoE model za razgovor (ukupno 671B parametara; 37B aktivnih po tokenu) usmjeren na opće jezične zadatke s izvrsnim omjerom troškova i performansi, poznatom API ergonomijom i modernom kvalitetom modela. Službeni dokumenti prikazuju upotrebu API-ja u stilu OpenAI.
U praksi:
- Odaberite R1 za: matematičke zadatke riječima, raščlambe strategija, planiranje s više ograničenja, složeno zaključivanje sa skrivenim koracima.
- Odaberite v3 za: razgovor s korisnicima, recenzije koda, prepisivanje, sažimanje i brze iteracijske petlje.
Zlatno pravilo: Nemojte previše poticati modele za zaključivanje
Modeli za zaključivanje poput R1 već provode unutarnje promišljanje. Forsiranje lanca razmišljanja ("razmišljajte korak po korak i pokažite svoje zaključivanje") često dodaje opširnost, može omesti model i u nekim se postavkama može obeshrabriti. Umjesto toga, koristite:
- "Navedite konačni odgovor i kratko objašnjenje."
- "Dajte odgovor, a zatim navedite 3 ključna faktora koji su vas doveli do njega."
- "Vratite samo rezultat plus obrazloženje od 2 rečenice."
Ovo je u skladu sa smjernicama da jednostavni upiti s nula snimaka mogu biti jednako učinkoviti—ili bolji—od kompliciranih postupnih uputa za R1.
Uzorci poticanja koji funkcioniraju
1) Nula snimaka, minimalistički (Najbolji prvi pokušaj za R1; odličan i za v3)
Cilj: Riješite netrivijalan problem s minimalnim ograničenjima.
Predložak upita:
Vi ste pažljiv rješavač problema.
Pitanje: {task}
Upute: Navedite konačni odgovor i sažeto obrazloženje (maksimalno 3 rečenice).
Zašto ovo funkcionira: Potiče unutarnje zaključivanje, a istovremeno održava izlaz usredotočenim i kratkim.
2) Ograničeni izlaz (Za API-je, pouzdanost ili automatizaciju)
Koristite kada vam trebaju predvidljivi formati.
Predložak upita:
Sustav: Morate vratiti samo valjani JSON.
Korisnik: Sažmite ovaj dokument u 5 točaka s jednim rizikom i jednom prilikom.
Vratite JSON: {
"bullets": . Napomene o vijestima/modelu ističu učinkovitost i opseg v3, dok kartice modela pružaju dodatni kontekst.
Odabir između DeepSeek v3 i R1 prema slučaju upotrebe
- Razgovor s korisničkom podrškom: v3 za brzinu i troškove; dodajte primjere s nekoliko snimaka za ton i pridržavanje pravila.
- Brifinzi analitičara i memorandumi o odlučivanju: R1 za zaključivanje s većim integritetom; postavite ograničenje "kratko obrazloženje".
- Recenzija koda i planovi refaktoriranja: v3 je izvrstan za brzu iteraciju; R1 kada vam je potrebno duboko zaključivanje o kompromisima.
- Matematika, logika, raspoređivanje s ograničenjima: R1 se obično ističe.
- Sažimanje velikih razmjera ili cjevovodi za prepisivanje: v3 za propusnost.
Za upute za izradu s R1 u RAG pomoćniku, pogledajte članke zajednice i upute koje prikazuju obrasce od kraja do kraja, primjere orijentirane na kodiranje za v3 i lokalne eksperimente putem stogova zajednice.
Sigurno rukovanje sadržajem zaključivanja
- Nemojte tražiti puni lanac razmišljanja. Ako vam je potrebna transparentnost, zatražite kratko obrazloženje ili popis ključnih faktora.
- Za osjetljiva područja, uključite liniju politike: "Ako niste sigurni ili bi zadatak mogao uzrokovati štetu, postavite pitanja za pojašnjenje ili odbijte."
- Dodajte upite za provjeru valjanosti za numeričke zadatke: "Provjerite aritmetiku prije odgovaranja."
Ovo odražava uobičajene smjernice najbolje prakse za modele u stilu R1: minimalno poticanje, izbjegavanje poticanja lanca razmišljanja i oslanjanje na unutarnje zaključivanje modela.
Biblioteka upita: Isječci spremni za kopiranje
A) Složeno planiranje (R1)
Cilj: Planirajte 6-tjednu beta verziju proizvoda za 1.000 korisnika s minimalnim odljevom.
Vratite:
- Prekretnice (iz tjedna u tjedan)
- Ključni rizici (maksimalno 5)
- Ublažavanja (jedno po riziku)
Ograničenja: Ukupno držite ispod 200 riječi.
### B) Razgovor osjetljiv na pravila (v3)
Sustav: Vi ste pomoćnik koji je usklađen s pravilima. Ako je zahtjev u sukobu s pravilima, postavite pitanje za pojašnjenje ili ponudite sigurnu alternativu.
Korisnik: Nacrtajte odgovor na povrat novca za zakašnjelu narudžbu. Zadržite empatičan ton i ponudite dvije mogućnosti.
### C) Matematika/Logika (R1)
Riješite sljedeće. Navedite konačni odgovor i provjeru od 2 rečenice.
Problem: {word problem}
Vi ste viši Python recenzent. Analizirajte isječak za performanse i čitljivost.
Vratite:
- Primjer refaktoriranja (<=30 redaka)
### E) Izdvajanje podataka u JSON (v3)
Sustav: Vratite samo valjani JSON.
Korisnik: Izdvojite tvrtku, prihod i sjedište iz teksta. Ako nedostaje, koristite null.
Shema: {"company":"string","revenue":"string|null","hq":"string|null"}
Tekst: {paste}
Rješavanje problema: Kada izlazi odstupaju ili haluciniraju
- Previše opširno? Smanjite maksimalni broj tokena ili dodajte "Maksimalno 120 riječi."
- Nedosljedan format? Dodajte sistemski upit samo za JSON i slijed zaustavljanja.
- Pogrešne pretpostavke? Dodajte ograničenje u jednom retku: "Ako niste sigurni, postavite 1 pitanje za pojašnjenje."
- Matematičke pogreške? Dodajte "Provjerite aritmetiku prije konačnog odgovora."
- Krhki zadaci lanca? Podijelite na dva poziva: plan → izvršenje.
Brzi početak API-ja (konceptualno)
- Upravljanje krajnjom točkom i ključem slijedi sučelje u stilu OpenAI. Očekujte standardna polja kao što su
model, messages, temperature, max_tokens i opcije streaminga.
- Specifičnosti DeepSeek v3 i tvrdnje o performansama sažete su u službenim vijestima/ažuriranju modela i karticama modela.
Vrijedno je napomenuti: Korištenje Sider.AI za iteraciju upita
Ako brzo istražujete uzorke—testirate nula snimaka u odnosu na nekoliko snimaka, prebacujete formate ili uspoređujete odgovore R1 u odnosu na v3—pomoćnik s preklapanjem može ubrzati petlju. Usput, Sider.AI olakšava izradu nacrta, ponavljanje i A/B upita na stranicama i alatima u jednom tijeku rada, tako da se možete usredotočiti na minimalni upit koji najbolje funkcionira za vaš zadatak. Ključne točke
- Preferirajte minimalne upite s nula snimaka za DeepSeek R1; izbjegavajte eksplicitne zahtjeve za lancem razmišljanja.
- Koristite DeepSeek v3 za brzi razgovor i strukturirane zadatke koji se mogu skalirati; oslonite se na ograničene formate za pouzdanost.
- Dodajte primjere s nekoliko snimaka samo da biste ispravili dosljedne načine neuspjeha.
- Provedite strukturu sa JSON shemama, kratkim sistemskim upitima i slijedovima zaustavljanja.
- Za složeno zaključivanje, tražite konačne odgovore plus kratka obrazloženja—ne pune zapise zaključivanja.
FAQ
P1: Kada bih trebao odabrati DeepSeek R1 umjesto DeepSeek v3?
Odaberite DeepSeek R1 za zaključivanje u više koraka, složeno planiranje i matematičke/logičke zadatke. Odaberite v3 za brzi, općeniti razgovor, izradu nacrta, pomoć pri kodiranju i cjevovode visokog propusnog opsega.
P2: Trebam li koristiti poticanje lanca razmišljanja s DeepSeek R1?
Ne. Smjernice sugeriraju izbjegavanje eksplicitnog lanca razmišljanja i oslanjanje na ugrađeno zaključivanje modela. Umjesto toga, tražite konačne odgovore s kratkim obrazloženjima.
P3: Kako dobiti dosljedan JSON iz DeepSeek v3?
Koristite kratki sistemski upit koji nalaže samo JSON, definirajte usku shemu i po želji postavite slijedove zaustavljanja. Smanjite temperaturu i ograničite maksimalni broj tokena kako biste ograničili odstupanje.
P4: Koju temperaturu trebam koristiti za zadatke zaključivanja?
Počnite nisko (0,0–0,3) za determinizam i ocjenjivanje. Povećajte na 0,4–0,7 za uravnoteženu kreativnost u izradi nacrta ili kodiranju; koristite veće vrijednosti za razmišljanje.
P5: Mogu li lokalno pokretati modele DeepSeek?
Postoje postavke zajednice za eksperimentiranje, ali proizvodnja često koristi hostirane API-je za stabilnost i performanse. Provjerite kartice modela i vodiče zajednice za lokalne upute.