Cara Menggunakan DeepSeek v3 dan R1: Prompting untuk Tugas Penalaran dan Chat
Jika Anda pernah membuat prompt yang terlalu rumit dan malah mendapatkan jawaban yang lebih buruk, Anda tidak sendirian. Dengan model yang mengutamakan penalaran seperti DeepSeek R1 dan model chat dengan tinggi seperti DeepSeek v3, cara lama (prompt panjang, bujukan yang berat) sering kali menjadi bumerang. Panduan ini menunjukkan kepada Anda secara tepat cara membuat prompt DeepSeek v3 dan R1 untuk tugas penalaran dan chat—apa yang harus disederhanakan, kapan harus membuat kerangka, dan cara menyesuaikan pengaturan untuk hasil yang stabil dan akurat.
Catatan gaya: Praktis & berorientasi solusi. Kita akan fokus pada apa yang berhasil, dengan pola dan pagar pembatas yang bisa langsung dipakai.
- Gunakan DeepSeek R1 saat Anda membutuhkan penalaran multi-langkah yang kuat, bukti, dan perencanaan yang kompleks.
- Gunakan DeepSeek v3 untuk chat yang cepat dan akurat, bantuan pengkodean, penyusunan draf, dan Tanya Jawab umum dalam skala besar.
- Jangan memaksakan . Minta "jawaban akhir," "rasional singkat," atau keluaran terstruktur sebagai gantinya.
- Buat prompt tetap pendek dan jelas; tambahkan batasan dan kriteria evaluasi hanya jika diperlukan.
- Mulai dengan ; tambahkan contoh hanya jika Anda melihat mode kegagalan yang konsisten.
Apa Perbedaan DeepSeek R1 vs v3
- DeepSeek R1: Model yang dioptimalkan untuk penalaran yang dirancang untuk "berpikir sebelum menjawab," mengurangi kebutuhan akan langkah demi langkah yang eksplisit. Banyak platform dan dokumen menyarankan untuk menghindari tuntutan ; sering kali berfungsi paling baik untuk R1,,.
- DeepSeek v3: Model chat MoE yang cepat dan kuat (total 671B parameter; 37B aktif per token) yang ditujukan untuk tugas bahasa serbaguna dengan kinerja biaya yang sangat baik, ergonomi API yang familier, dan kualitas model modern,. Dokumen resmi menunjukkan penggunaan API ala OpenAI.
Dalam praktiknya:
- Pilih R1 untuk: soal cerita matematika, uraian strategi, perencanaan multi-batasan, penalaran rumit dengan langkah-langkah laten.
- Pilih v3 untuk: chat pelanggan, tinjauan kode, penulisan ulang, peringkasan, dan iterasi cepat.
Aturan Emas: Jangan Terlalu Banyak Membuat Prompt Model Penalaran
Model penalaran seperti R1 sudah melakukan pertimbangan internal. Memaksakan ("berpikir langkah demi langkah dan tunjukkan penalaran Anda") sering kali menambahkan verbalitas, dapat mengganggu model, dan dalam beberapa pengaturan mungkin tidak dianjurkan. Sebagai gantinya, gunakan:
- "Berikan jawaban akhir dan penjelasan singkat."
- "Berikan jawabannya, lalu daftarkan 3 faktor kunci yang membawa Anda ke sana."
- "Kembalikan hanya hasilnya ditambah justifikasi 2 kalimat."
Ini selaras dengan panduan bahwa prompt yang sederhana bisa sama efektifnya—atau lebih baik—daripada instruksi bertahap yang rumit untuk R1,,.
Pola Prompting Yang Berhasil
1) , Minimalis (Upaya pertama terbaik untuk R1; bagus juga untuk v3)
Tujuan: Memecahkan masalah nontrivial dengan batasan minimal.
Templat prompt:
Anda adalah pemecah masalah yang cermat.
Pertanyaan: {task}
Instruksi: Berikan jawaban akhir dan rasional yang ringkas (maks 3 kalimat).
Mengapa ini berhasil: Ini mendorong penalaran internal sambil menjaga keluaran tetap fokus dan pendek.
2) Keluaran Terbatas (Untuk API, keandalan, atau otomatisasi)
Gunakan saat Anda membutuhkan format yang dapat diprediksi.
Templat prompt:
Sistem: Anda harus mengembalikan JSON yang valid saja.
Pengguna: Ringkas dokumen ini dalam 5 poin-poin dengan satu risiko dan satu peluang.
Kembalikan JSON: {
"bullets": . Catatan berita/model menyoroti efisiensi dan skala v3, sementara kartu model memberikan konteks tambahan.
Memilih Antara DeepSeek v3 dan R1 berdasarkan Kasus Penggunaan
- Chat dukungan pelanggan: v3 untuk kecepatan dan biaya; tambahkan contoh untuk nada dan kepatuhan kebijakan.
- analis dan memo keputusan: R1 untuk penalaran dengan integritas lebih tinggi; tetapkan batasan "rasional singkat".
- Tinjauan kode dan rencana refaktor: v3 sangat baik untuk iterasi cepat; R1 saat Anda membutuhkan penalaran mendalam tentang .
- Matematika, logika, penjadwalan dengan batasan: R1 biasanya unggul.
- Peringkasan atau penulisan ulang skala besar: v3 untuk .
Untuk tutorial membangun dengan R1 di asisten RAG, lihat tulisan komunitas dan tutorial yang menunjukkan pola , contoh berorientasi pengkodean untuk v3, dan eksperimen lokal melalui komunitas.
Penanganan Konten Penalaran yang Aman
- Jangan meminta penuh. Jika Anda membutuhkan transparansi, minta justifikasi singkat atau daftar faktor kunci.
- Untuk domain sensitif, sertakan baris kebijakan: "Jika Anda tidak yakin atau tugas tersebut dapat menyebabkan kerugian, ajukan pertanyaan klarifikasi atau tolak."
- Tambahkan prompt validasi untuk tugas numerik: "Periksa kembali aritmatika sebelum menjawab."
Ini mencerminkan panduan praktik terbaik umum untuk model gaya R1: minimal, hindari elisitasi , dan andalkan penalaran internal model,,.
Perpustakaan Prompt: Cuplikan Siap Salin
A) Perencanaan Kompleks (R1)
Tujuan: Rencanakan beta produk 6 minggu untuk 1.000 pengguna dengan minimal.
Kembalikan:
- Mitigasi (satu per risiko)
Batasan: Jaga total di bawah 200 kata.
### B) Chat Sensitif Kebijakan (v3)
Sistem: Anda adalah asisten yang membantu dan patuh kebijakan. Jika permintaan bertentangan dengan kebijakan, ajukan pertanyaan klarifikasi atau berikan alternatif yang aman.
Pengguna: Buat draf respons pengembalian dana untuk pesanan yang tertunda. Pertahankan nada empatik dan tawarkan dua opsi.
### C) Matematika/Logika (R1)
Selesaikan yang berikut. Berikan jawaban akhir dan pemeriksaan 2 kalimat.
Masalah: {soal cerita}
### D) Tinjauan Kode (v3)
Anda adalah peninjau Python senior. Analisis cuplikan untuk kinerja dan keterbacaan.
Kembalikan:
- Contoh refaktor (<=30 baris)
### E) Ekstraksi Data ke JSON (v3)
Sistem: Kembalikan JSON yang valid saja.
Pengguna: Ekstrak perusahaan, pendapatan, dan kantor pusat dari teks. Jika hilang, gunakan .
Skema: {"company":"string","revenue":"string|null","hq":"string|null"}
Teks: {paste}
Pemecahan Masalah: Saat Keluaran Menyimpang atau Berhalusinasi
- Terlalu panjang? Turunkan token maks atau tambahkan "Maks 120 kata."
- Format tidak konsisten? Tambahkan prompt sistem khusus JSON dan urutan berhenti.
- Asumsi salah? Tambahkan batasan satu baris: "Jika tidak yakin, ajukan 1 pertanyaan klarifikasi."
- Kesalahan matematika? Tambahkan "Periksa kembali aritmatika sebelum jawaban akhir."
- Tugas rantai yang rapuh? Bagi menjadi dua panggilan: rencana → eksekusi.
Mulai Cepat API (Konseptual)
- Manajemen dan kunci mengikuti antarmuka gaya OpenAI. Harapkan bidang standar seperti
model, messages, temperature, max_tokens, dan opsi .
- Spesifikasi dan klaim kinerja DeepSeek v3 diringkas dalam berita/pembaruan model dan kartu model resmi.
Perlu Dicatat: Menggunakan Sider.AI untuk Iterasi Prompt
Jika Anda menjelajahi pola dengan cepat—menguji vs. , mengalihkan format, atau membandingkan respons R1 vs v3—asisten dapat mempercepat . Omong-omong, Sider.AI memudahkan untuk membuat draf, melakukan iterasi, dan A/B prompt di seluruh halaman dan alat dalam satu alur kerja, sehingga Anda dapat fokus pada prompt minimal yang paling sesuai untuk tugas Anda . Poin-Poin Penting
- Pilih prompt minimal dan untuk DeepSeek R1; hindari permintaan eksplisit,,.
- Gunakan DeepSeek v3 untuk chat yang cepat dan terukur serta tugas terstruktur; andalkan format terbatas untuk keandalan,,.
- Tambahkan contoh hanya untuk memperbaiki mode kegagalan yang konsisten.
- Tegakkan struktur dengan skema JSON, prompt sistem pendek, dan urutan berhenti.
- Untuk penalaran kompleks, minta jawaban akhir ditambah justifikasi singkat—bukan log penalaran lengkap.
FAQ
Q1:Kapan saya harus memilih DeepSeek R1 daripada DeepSeek v3?
Pilih DeepSeek R1 untuk penalaran multi-langkah, perencanaan kompleks, dan tugas matematika/logika. Pilih v3 untuk chat umum yang cepat, pembuatan draf, bantuan pengkodean, dan tinggi.
Q2:Haruskah saya menggunakan dengan DeepSeek R1?
Tidak. Panduan menyarankan untuk menghindari eksplisit dan mengandalkan penalaran bawaan model. Minta jawaban akhir dengan justifikasi singkat sebagai gantinya.
Q3:Bagaimana cara mendapatkan JSON yang konsisten dari DeepSeek v3?
Gunakan prompt sistem pendek yang mewajibkan JSON saja, tentukan skema yang ketat, dan secara opsional tetapkan urutan berhenti. Turunkan suhu dan batasi token maks untuk membatasi penyimpangan.
Q4:Suhu berapa yang harus saya gunakan untuk tugas penalaran?
Mulai rendah (0,0–0,3) untuk determinisme dan evaluasi. Naikkan ke 0,4–0,7 untuk kreativitas seimbang dalam pembuatan draf atau pengkodean; gunakan nilai yang lebih tinggi untuk .
Q5:Bisakah saya menjalankan model DeepSeek secara lokal?
Pengaturan komunitas ada untuk eksperimen, tetapi produksi sering kali menggunakan API yang di- untuk stabilitas dan kinerja. Periksa kartu model dan panduan komunitas untuk instruksi lokal.