When should I choose DeepSeek R1 over DeepSeek v3?

Pick DeepSeek R1 for multi‑step reasoning, complex planning, and math/logic tasks. Choose v3 for fast, general chat, drafting, coding assistance, and high‑throughput pipelines.

Should I use chain‑of‑thought prompting with DeepSeek R1?

No. Guidance suggests avoiding explicit chain‑of‑thought and relying on the model’s built‑in reasoning. Ask for final answers with brief justifications instead.

How do I get consistent JSON from DeepSeek v3?

Use a short system prompt that mandates JSON only, define a tight schema, and optionally set stop sequences. Lower temperature and cap max tokens to limit drift.

What temperature should I use for reasoning tasks?

Start low (0.0–0.3) for determinism and evaluation. Raise to 0.4–0.7 for balanced creativity in drafting or coding; use higher values for brainstorming.

Can I run DeepSeek models locally?

Community setups exist for experimentation, but production often uses hosted APIs for stability and performance. Check model cards and community guides for local instructions.

Cách Sử Dụng DeepSeek v3 và R1: Gợi Ý (Prompting) cho Các Tác Vụ Suy Luận và Trò Chuyện

Nếu bạn đã từng thiết kế một gợi ý (prompt) quá phức tạp nhưng lại nhận được câu trả lời tệ hơn, thì bạn không hề đơn độc. Với các mô hình ưu tiên suy luận như DeepSeek R1 và các mô hình trò chuyện thông lượng cao như DeepSeek v3, cách làm cũ (gợi ý dài, ép buộc chuỗi suy nghĩ) thường phản tác dụng. Hướng dẫn này sẽ chỉ cho bạn chính xác cách gợi ý DeepSeek v3 và R1 cho các tác vụ suy luận và trò chuyện—những gì cần giữ đơn giản, khi nào cần dàn dựng và cách điều chỉnh cài đặt để có kết quả ổn định và chính xác.

Lưu ý về phong cách: Thiết thực & hướng đến giải pháp. Chúng ta sẽ tập trung vào những gì hiệu quả, với các mẫu cắt-dán và các biện pháp bảo vệ.

Sử dụng DeepSeek R1 khi bạn cần suy luận đa bước mạnh mẽ, chứng minh và lập kế hoạch phức tạp.

Sử dụng DeepSeek v3 để trò chuyện nhanh chóng, chính xác, hỗ trợ viết mã, soạn thảo và hỏi đáp chung ở quy mô lớn.

Không ép buộc chuỗi suy nghĩ. Thay vào đó, hãy yêu cầu “câu trả lời cuối cùng”, “lý do ngắn gọn” hoặc đầu ra có cấu trúc.

Giữ cho các gợi ý ngắn gọn và rõ ràng; chỉ thêm các ràng buộc và tiêu chí đánh giá khi cần thiết.

Bắt đầu với zero-shot; chỉ thêm các ví dụ few-shot nếu bạn thấy các chế độ lỗi nhất quán.

Điểm Khác Biệt Giữa DeepSeek R1 và v3

DeepSeek R1: Một mô hình được tối ưu hóa cho suy luận được thiết kế để “suy nghĩ trước khi trả lời”, giảm nhu cầu gợi ý từng bước rõ ràng. Nhiều nền tảng và tài liệu khuyên nên tránh các yêu cầu về chuỗi suy nghĩ; zero-shot thường hoạt động tốt nhất cho R1.

DeepSeek v3: Một mô hình trò chuyện MoE nhanh chóng, mạnh mẽ (tổng cộng 671B tham số; 37B hoạt động trên mỗi token) nhằm vào các tác vụ ngôn ngữ đa năng với hiệu suất chi phí tuyệt vời, công thái học API quen thuộc và chất lượng mô hình hiện đại. Tài liệu chính thức hiển thị cách sử dụng API theo kiểu OpenAI.

Trong thực tế:

Chọn R1 cho: các bài toán đố về toán học, phân tích chiến lược, lập kế hoạch đa ràng buộc, suy luận phức tạp với các bước tiềm ẩn.

Chọn v3 cho: trò chuyện với khách hàng, đánh giá mã, viết lại, tóm tắt và các vòng lặp lặp lại nhanh chóng.

Nguyên Tắc Vàng: Không Gợi Ý Quá Mức Các Mô Hình Suy Luận

Các mô hình suy luận như R1 đã thực hiện cân nhắc nội bộ. Ép buộc chuỗi suy nghĩ (“hãy suy nghĩ từng bước và trình bày lý do của bạn”) thường làm tăng thêm tính dài dòng, có thể làm xao nhãng mô hình và trong một số cài đặt có thể không được khuyến khích. Thay vào đó, hãy sử dụng:

“Cung cấp câu trả lời cuối cùng và một lời giải thích ngắn gọn.”

“Đưa ra câu trả lời, sau đó liệt kê 3 yếu tố chính dẫn bạn đến đó.”

“Chỉ trả về kết quả cộng với một lời biện minh gồm 2 câu.”

Điều này phù hợp với hướng dẫn rằng các gợi ý đơn giản, zero-shot có thể hiệu quả—hoặc tốt hơn—so với các hướng dẫn từng bước phức tạp cho R1.

Các Mẫu Gợi Ý Hoạt Động Hiệu Quả

1) Zero-Shot, Tối Giản (Thử tốt nhất lần đầu cho R1; tuyệt vời cho v3)

Mục tiêu: Giải quyết một vấn đề không tầm thường với các ràng buộc tối thiểu.

Mẫu gợi ý:

Bạn là một người giải quyết vấn đề cẩn thận.
Câu hỏi: {task}
Hướng dẫn: Cung cấp câu trả lời cuối cùng và lý do ngắn gọn (tối đa 3 câu).

Tại sao điều này hiệu quả: Nó khuyến khích suy luận nội bộ trong khi vẫn giữ cho đầu ra tập trung và ngắn gọn.

2) Đầu Ra Bị Ràng Buộc (Đối Với API, độ tin cậy hoặc tự động hóa)

Sử dụng khi bạn cần các định dạng có thể dự đoán được.

Mẫu gợi ý:

Hệ thống: Bạn chỉ được trả về JSON hợp lệ.
Người dùng: Tóm tắt tài liệu này trong 5 điểm chính với một rủi ro và một cơ hội.
Trả về JSON: {
"bullets": . Các ghi chú về tin tức/mô hình làm nổi bật hiệu quả và quy mô của v3, trong khi thẻ mô hình cung cấp thêm ngữ cảnh.

Lựa Chọn Giữa DeepSeek v3 và R1 Theo Trường Hợp Sử Dụng

Trò chuyện hỗ trợ khách hàng: v3 để có tốc độ và chi phí; thêm các ví dụ few-shot để tuân thủ giọng điệu và chính sách.

Thông tin tóm tắt của nhà phân tích và bản ghi nhớ quyết định: R1 để có suy luận có tính toàn vẹn cao hơn; đặt ràng buộc “lý do ngắn gọn”.

Đánh giá mã và kế hoạch tái cấu trúc: v3 rất tuyệt vời để lặp lại nhanh chóng; R1 khi bạn cần suy luận sâu sắc về sự đánh đổi.

Toán học, logic, lập lịch với các ràng buộc: R1 thường vượt trội.

Tóm tắt hoặc viết lại quy mô lớn: v3 để có thông lượng.

Để có hướng dẫn xây dựng với R1 trong trợ lý RAG, hãy xem các bài viết của cộng đồng và hướng dẫn hiển thị các mẫu end-to-end, các ví dụ hướng đến mã hóa cho v3 và các thử nghiệm cục bộ thông qua các ngăn xếp cộng đồng.

Xử Lý An Toàn Nội Dung Suy Luận

Không yêu cầu chuỗi suy nghĩ đầy đủ. Nếu bạn cần tính minh bạch, hãy yêu cầu một lời biện minh ngắn gọn hoặc một danh sách các yếu tố chính.

Đối với các lĩnh vực nhạy cảm, hãy bao gồm một dòng chính sách: “Nếu bạn không chắc chắn hoặc nhiệm vụ có thể gây hại, hãy đặt câu hỏi làm rõ hoặc từ chối.”

Thêm các gợi ý xác thực cho các nhiệm vụ số: “Kiểm tra lại số học trước khi trả lời.”

Điều này phản ánh hướng dẫn thực hành tốt nhất phổ biến cho các mô hình kiểu R1: gợi ý tối thiểu, tránh gợi ý chuỗi suy nghĩ và dựa vào suy luận nội bộ của mô hình.

Thư Viện Gợi Ý: Đoạn Mã Sẵn Sàng Sao Chép

A) Lập Kế Hoạch Phức Tạp (R1)

Mục tiêu: Lập kế hoạch beta sản phẩm trong 6 tuần cho 1.000 người dùng với mức độ rời bỏ tối thiểu. Trả về:

Các mốc quan trọng (hàng tuần)

Các rủi ro chính (tối đa 5)

Các biện pháp giảm thiểu (một cho mỗi rủi ro) Ràng buộc: Tổng số dưới 200 từ.


### B) Trò Chuyện Nhạy Cảm về Chính Sách (v3)

Hệ thống: Bạn là một trợ lý hữu ích, tuân thủ chính sách. Nếu một yêu cầu xung đột với chính sách, hãy đặt câu hỏi làm rõ hoặc cung cấp một giải pháp thay thế an toàn. Người dùng: Soạn thảo phản hồi hoàn tiền cho một đơn hàng bị chậm trễ. Giữ giọng điệu đồng cảm và cung cấp hai lựa chọn.


### C) Toán Học/Logic (R1)

Giải các bài toán sau. Cung cấp câu trả lời cuối cùng và một kiểm tra gồm 2 câu. Bài toán: {word problem}


### D) Đánh Giá Mã (v3)

Bạn là một người đánh giá Python cấp cao. Phân tích đoạn mã về hiệu suất và khả năng đọc. Trả về:

Các vấn đề (được liệt kê)

Các bản sửa lỗi (được liệt kê)

Ví dụ tái cấu trúc (<=30 dòng)


### E) Trích Xuất Dữ Liệu sang JSON (v3)

Hệ thống: Chỉ trả về JSON hợp lệ. Người dùng: Trích xuất công ty, doanh thu và trụ sở chính từ văn bản. Nếu thiếu, hãy sử dụng null. Schema: {"company":"string","revenue":"string|null","hq":"string|null"} Text: {paste}

Khắc Phục Sự Cố: Khi Đầu Ra Trôi Dạt hoặc Ảo Giác

Quá dài dòng? Giảm số lượng token tối đa hoặc thêm “Tối đa 120 từ.”

Định dạng không nhất quán? Thêm dấu nhắc hệ thống chỉ JSON và một chuỗi dừng.

Giả định sai? Thêm một ràng buộc một dòng: “Nếu không chắc chắn, hãy đặt 1 câu hỏi làm rõ.”

Lỗi toán học? Thêm “Kiểm tra lại số học trước khi trả lời cuối cùng.”

Các tác vụ chuỗi mong manh? Chia thành hai lệnh gọi: lập kế hoạch → thực hiện.

Khởi Động Nhanh API (Về Mặt Khái Niệm)

Quản lý điểm cuối và khóa tuân theo giao diện kiểu OpenAI. Mong đợi các trường tiêu chuẩn như model, messages, temperature, max_tokens và các tùy chọn phát trực tuyến.

Các chi tiết cụ thể và tuyên bố về hiệu suất của DeepSeek v3 được tóm tắt trong bản tin/cập nhật mô hình chính thức và thẻ mô hình.

Đáng Chú Ý: Sử Dụng Sider.AI để Lặp Lại Gợi Ý

Nếu bạn đang khám phá các mẫu nhanh chóng—kiểm tra zero-shot so với few-shot, chuyển đổi định dạng hoặc so sánh phản hồi R1 so với v3—một trợ lý lớp phủ có thể tăng tốc vòng lặp. Nhân tiện, Sider.AI giúp bạn dễ dàng soạn thảo, lặp lại và A/B các gợi ý trên các trang và công cụ trong một quy trình làm việc duy nhất, để bạn có thể tập trung vào gợi ý tối thiểu hoạt động tốt nhất cho nhiệm vụ của mình.

Những Điểm Chính

Ưu tiên các gợi ý tối thiểu, zero-shot cho DeepSeek R1; tránh các yêu cầu chuỗi suy nghĩ rõ ràng.

Sử dụng DeepSeek v3 cho các tác vụ trò chuyện và có cấu trúc nhanh chóng, có thể mở rộng; dựa vào các định dạng bị ràng buộc để có độ tin cậy.

Chỉ thêm các ví dụ few-shot để sửa các chế độ lỗi nhất quán.

Thực thi cấu trúc với lược đồ JSON, dấu nhắc hệ thống ngắn và chuỗi dừng.

Đối với suy luận phức tạp, hãy yêu cầu câu trả lời cuối cùng cộng với các lý do ngắn gọn—không phải nhật ký suy luận đầy đủ.

Câu Hỏi Thường Gặp

Câu hỏi 1: Khi nào tôi nên chọn DeepSeek R1 thay vì DeepSeek v3? Chọn DeepSeek R1 cho các tác vụ suy luận đa bước, lập kế hoạch phức tạp và toán học/logic. Chọn v3 cho trò chuyện chung nhanh chóng, soạn thảo, hỗ trợ viết mã và các quy trình thông lượng cao.

Câu hỏi 2: Tôi có nên sử dụng gợi ý chuỗi suy nghĩ với DeepSeek R1 không? Không. Hướng dẫn khuyên nên tránh chuỗi suy nghĩ rõ ràng và dựa vào suy luận tích hợp của mô hình. Thay vào đó, hãy yêu cầu câu trả lời cuối cùng với các lý do ngắn gọn.

Câu hỏi 3: Làm cách nào để nhận được JSON nhất quán từ DeepSeek v3? Sử dụng một dấu nhắc hệ thống ngắn chỉ yêu cầu JSON, xác định một lược đồ chặt chẽ và tùy chọn đặt chuỗi dừng. Giảm nhiệt độ và giới hạn số lượng token tối đa để hạn chế sự trôi dạt.

Câu hỏi 4: Tôi nên sử dụng nhiệt độ nào cho các tác vụ suy luận? Bắt đầu thấp (0,0–0,3) để có tính xác định và đánh giá. Tăng lên 0,4–0,7 để có sự sáng tạo cân bằng trong soạn thảo hoặc viết mã; sử dụng các giá trị cao hơn để động não.

Câu hỏi 5: Tôi có thể chạy các mô hình DeepSeek cục bộ không? Tồn tại các thiết lập cộng đồng để thử nghiệm, nhưng sản xuất thường sử dụng API được lưu trữ để có tính ổn định và hiệu suất. Kiểm tra thẻ mô hình và hướng dẫn cộng đồng để biết hướng dẫn cục bộ.