Jak używać DeepSeek v3 i R1: Promptowanie do zadań związanych z rozumowaniem i czatem
Jeśli kiedykolwiek przekombinowałeś prompt, tylko po to, by otrzymać gorszą odpowiedź, nie jesteś sam. W przypadku modeli opartych na rozumowaniu, takich jak DeepSeek R1, i modeli czatowych o wysokiej przepustowości, takich jak DeepSeek v3, stare metody (długie prompty, intensywne nakłanianie do rozumowania krok po kroku) często przynoszą odwrotny skutek. Ten przewodnik pokazuje dokładnie, jak promptować DeepSeek v3 i R1 do zadań związanych z rozumowaniem i czatem – co upraszczać, kiedy budować strukturę i jak dostroić ustawienia, aby uzyskać stabilne i dokładne wyniki.
Uwaga dotycząca stylu: Praktyczny i zorientowany na rozwiązania. Skupimy się na tym, co działa, z wzorcami do kopiowania i wklejania oraz zabezpieczeniami.
- Używaj DeepSeek R1, gdy potrzebujesz solidnego, wieloetapowego rozumowania, dowodów i złożonego planowania.
- Używaj DeepSeek v3 do szybkiego, dokładnego czatu, pomocy w kodowaniu, tworzenia wersji roboczych i ogólnych pytań i odpowiedzi na dużą skalę.
- Nie wymuszaj rozumowania krok po kroku. Zamiast tego proś o „ostateczne odpowiedzi”, „krótkie uzasadnienie” lub ustrukturyzowane dane wyjściowe.
- Utrzymuj krótkie i jasne prompty; dodawaj ograniczenia i kryteria oceny tylko wtedy, gdy jest to konieczne.
- Zacznij od zero‑shot; dodawaj przykłady few‑shot tylko wtedy, gdy widzisz powtarzające się tryby awarii.
Co różni DeepSeek R1 od v3
- DeepSeek R1: Model zoptymalizowany pod kątem rozumowania, zaprojektowany do „myślenia przed udzieleniem odpowiedzi”, zmniejszając potrzebę wyraźnego promptowania krok po kroku. Wiele platform i dokumentów zaleca unikanie żądań rozumowania krok po kroku; zero‑shot często działa najlepiej w przypadku R1.
- DeepSeek v3: Szybki, mocny model MoE (671B parametrów łącznie; 37B aktywnych na token) przeznaczony do ogólnych zadań językowych z doskonałą wydajnością kosztową, znaną ergonomią API i nowoczesną jakością modelu. Oficjalne dokumenty pokazują użycie API w stylu OpenAI.
W praktyce:
- Wybierz R1 dla: zadań tekstowych z matematyki, analizy strategii, planowania z wieloma ograniczeniami, trudnego rozumowania z ukrytymi krokami.
- Wybierz v3 dla: czatu z klientami, recenzji kodu, przepisywania, podsumowywania i szybkich pętli iteracji.
Złota zasada: Nie przesadzaj z promptowaniem modeli rozumowania
Modele rozumowania, takie jak R1, już przeprowadzają wewnętrzne deliberacje. Wymuszanie rozumowania krok po kroku („pomyśl krok po kroku i pokaż swoje rozumowanie”) często dodaje rozwlekłości, może rozpraszać model, a w niektórych ustawieniach może być odradzane. Zamiast tego użyj:
- „Podaj ostateczną odpowiedź i krótkie wyjaśnienie.”
- „Podaj odpowiedź, a następnie wymień 3 kluczowe czynniki, które do niej doprowadziły.”
- „Zwróć tylko wynik plus 2‑zdaniowe uzasadnienie.”
Jest to zgodne z wytycznymi, że proste prompty zero‑shot mogą być równie skuteczne – lub lepsze – niż skomplikowane instrukcje krok po kroku dla R1.
Wzorce promptowania, które działają
1) Zero‑Shot, Minimalistyczny (Najlepsza pierwsza próba dla R1; świetny również dla v3)
Cel: Rozwiąż nietrywialny problem z minimalnymi ograniczeniami.
Szablon promptu:
Jesteś uważnym rozwiązywaczem problemów.
Pytanie: {task}
Instrukcje: Podaj ostateczną odpowiedź i zwięzłe uzasadnienie (maks. 3 zdania).
Dlaczego to działa: Zachęca do wewnętrznego rozumowania, jednocześnie utrzymując skupienie i krótkość danych wyjściowych.
2) Ograniczone dane wyjściowe (dla API, niezawodności lub automatyzacji)
Używaj, gdy potrzebujesz przewidywalnych formatów.
Szablon promptu:
System: Musisz zwracać tylko prawidłowy JSON.
Użytkownik: Podsumuj ten dokument w 5 punktach z jednym ryzykiem i jedną szansą.
Zwróć JSON: {
"bullets": . Aktualności/notatki o modelu podkreślają wydajność i skalę v3, a karty modelu zapewniają dodatkowy kontekst.
Wybór między DeepSeek v3 i R1 według przypadku użycia
- Czat obsługi klienta: v3 dla szybkości i kosztów; dodaj przykłady few‑shot dla tonu i zgodności z zasadami.
- Briefingi analityczne i notatki decyzyjne: R1 dla rozumowania o wyższej integralności; ustaw ograniczenie „krótkie uzasadnienie”.
- Recenzja kodu i plany refaktoryzacji: v3 jest doskonały do szybkiej iteracji; R1, gdy potrzebujesz głębokiego rozumowania na temat kompromisów.
- Matematyka, logika, planowanie z ograniczeniami: R1 zazwyczaj przoduje.
- Podsumowywanie lub przepisywanie na dużą skalę: v3 dla przepustowości.
Samouczek dotyczący budowania z R1 w asystencie RAG można znaleźć w artykułach społeczności i samouczkach, które pokazują kompleksowe wzorce, przykłady zorientowane na kodowanie dla v3 i lokalne eksperymenty za pośrednictwem stosów społeczności.
Bezpieczne obchodzenie się z treściami rozumowania
- Nie proś o pełne rozumowanie krok po kroku. Jeśli potrzebujesz przejrzystości, poproś o krótkie uzasadnienie lub listę kluczowych czynników.
- W przypadku wrażliwych dziedzin uwzględnij linię zasad: „Jeśli nie jesteś pewien lub zadanie może spowodować szkodę, zadaj pytania wyjaśniające lub odmów.”
- Dodaj prompty walidacyjne dla zadań numerycznych: „Sprawdź dwukrotnie arytmetykę przed udzieleniem odpowiedzi.”
Odzwierciedla to powszechne najlepsze praktyki dla modeli w stylu R1: minimalne promptowanie, unikanie wydobywania rozumowania krok po kroku i poleganie na wewnętrznym rozumowaniu modelu.
Biblioteka promptów: Gotowe do kopiowania fragmenty
A) Złożone planowanie (R1)
Cel: Zaplanuj 6-tygodniową betę produktu dla 1000 użytkowników z minimalnym wskaźnikiem rezygnacji.
Zwróć:
- Kamienie milowe (tydzień po tygodniu)
- Kluczowe ryzyka (maks. 5)
- Środki łagodzące (jedno na ryzyko)
Ograniczenia: Utrzymaj całość poniżej 200 słów.
### B) Czat wrażliwy na zasady (v3)
System: Jesteś pomocnym asystentem zgodnym z zasadami. Jeśli żądanie jest sprzeczne z zasadami, zadaj pytanie wyjaśniające lub zaproponuj bezpieczną alternatywę.
Użytkownik: Przygotuj odpowiedź dotyczącą zwrotu pieniędzy za opóźnione zamówienie. Zachowaj empatyczny ton i zaoferuj dwie opcje.
### C) Matematyka/Logika (R1)
Rozwiąż poniższe. Podaj ostateczną odpowiedź i 2-zdaniową kontrolę.
Problem: {word problem}
### D) Recenzja kodu (v3)
Jesteś starszym recenzentem Pythona. Przeanalizuj fragment pod kątem wydajności i czytelności.
Zwróć:
- Przykładowa refaktoryzacja (<=30 linii)
### E) Ekstrakcja danych do JSON (v3)
System: Zwróć tylko prawidłowy JSON.
Użytkownik: Wyodrębnij firmę, przychody i siedzibę z tekstu. Jeśli brakuje, użyj null.
Schema: {"company":"string","revenue":"string|null","hq":"string|null"}
Text: {paste}
Rozwiązywanie problemów: Kiedy dane wyjściowe dryfują lub halucynują
- Zbyt rozwlekłe? Obniż maksymalną liczbę tokenów lub dodaj „Maks. 120 słów”.
- Niespójny format? Dodaj prompt systemowy tylko dla JSON i sekwencję zatrzymania.
- Błędne założenia? Dodaj jedno‑liniowe ograniczenie: „Jeśli nie jesteś pewien, zadaj 1 pytanie wyjaśniające.”
- Błędy matematyczne? Dodaj „Sprawdź dwukrotnie arytmetykę przed ostateczną odpowiedzią.”
- Kruche zadania łańcuchowe? Podziel na dwa wywołania: plan → wykonanie.
Szybki start API (koncepcyjny)
- Zarządzanie punktami końcowymi i kluczami odbywa się za pomocą interfejsu w stylu OpenAI. Oczekuj standardowych pól, takich jak
model, messages, temperature, max_tokens i opcji przesyłania strumieniowego.
- Specyfika DeepSeek v3 i twierdzenia dotyczące wydajności są podsumowane w oficjalnych aktualnościach/aktualizacji modelu i kartach modelu.
Warto zauważyć: Używanie Sider.AI do iteracji promptów
Jeśli szybko eksplorujesz wzorce – testujesz zero‑shot vs. few‑shot, przełączasz formaty lub porównujesz odpowiedzi R1 vs v3 – asystent nakładkowy może przyspieszyć pętlę. Nawiasem mówiąc, Sider.AI ułatwia tworzenie, iterowanie i A/B promptów na stronach i narzędziach w jednym przepływie pracy, dzięki czemu możesz skupić się na minimalnym prompcie, który najlepiej pasuje do Twojego zadania. Kluczowe wnioski
- Preferuj minimalne prompty zero‑shot dla DeepSeek R1; unikaj wyraźnych żądań rozumowania krok po kroku.
- Używaj DeepSeek v3 do szybkiego, skalowalnego czatu i zadań ustrukturyzowanych; polegaj na ograniczonych formatach dla niezawodności.
- Dodawaj przykłady few‑shot tylko w celu poprawy spójnych trybów awarii.
- Wymuś strukturę za pomocą schematów JSON, krótkich promptów systemowych i sekwencji zatrzymania.
- W przypadku złożonego rozumowania proś o ostateczne odpowiedzi plus krótkie uzasadnienia – a nie pełne dzienniki rozumowania.
FAQ
P1: Kiedy powinienem wybrać DeepSeek R1 zamiast DeepSeek v3?
Wybierz DeepSeek R1 do wieloetapowego rozumowania, złożonego planowania i zadań matematycznych/logicznych. Wybierz v3 do szybkiego, ogólnego czatu, tworzenia wersji roboczych, pomocy w kodowaniu i potoków o wysokiej przepustowości.
P2: Czy powinienem używać promptowania krok po kroku z DeepSeek R1?
Nie. Wytyczne sugerują unikanie wyraźnego rozumowania krok po kroku i poleganie na wbudowanym rozumowaniu modelu. Zamiast tego proś o ostateczne odpowiedzi z krótkimi uzasadnieniami.
P3: Jak uzyskać spójny JSON z DeepSeek v3?
Użyj krótkiego promptu systemowego, który nakazuje tylko JSON, zdefiniuj ścisły schemat i opcjonalnie ustaw sekwencje zatrzymania. Obniż temperaturę i ogranicz maksymalną liczbę tokenów, aby ograniczyć dryf.
P4: Jaką temperaturę powinienem użyć do zadań związanych z rozumowaniem?
Zacznij od niskiej (0,0–0,3) dla determinizmu i oceny. Podnieś do 0,4–0,7 dla zrównoważonej kreatywności w tworzeniu lub kodowaniu; użyj wyższych wartości do burzy mózgów.
P5: Czy mogę uruchamiać modele DeepSeek lokalnie?
Istnieją konfiguracje społecznościowe do eksperymentowania, ale produkcja często wykorzystuje hostowane API dla stabilności i wydajności. Sprawdź karty modelu i przewodniki społeczności, aby uzyskać lokalne instrukcje.