DeepSeek v3 및 R1 사용법: 추론 및 채팅 작업을 위한 프롬프트 작성
프롬프트를 과도하게 설계했다가 오히려 더 나쁜 답변을 얻은 경험이 있다면, 혼자가 아닙니다. DeepSeek R1과 같은 추론 우선 모델과 DeepSeek v3와 같은 고성능 채팅 모델에서는 기존 방식(긴 프롬프트, 과도한 CoT 유도)이 종종 역효과를 냅니다. 이 가이드에서는 DeepSeek v3 및 R1에 대한 추론 및 채팅 작업을 위해 프롬프트를 작성하는 방법, 즉 무엇을 단순하게 유지하고, 언제 구조를 만들고, 안정적이고 정확한 결과를 위해 설정을 조정하는 방법을 정확하게 보여줍니다.
스타일 참고: 실용적 & 솔루션 중심. 잘 작동하는 것에 초점을 맞추고, 잘라내어 붙여넣을 수 있는 패턴과 안전 장치를 제공합니다.
- 견고한 다단계 추론, 증명 및 복잡한 계획이 필요한 경우 DeepSeek R1을 사용하십시오.
- 빠르고 정확한 채팅, 코딩 지원, 초안 작성 및 일반적인 Q&A를 대규모로 처리하려면 DeepSeek v3를 사용하십시오.
- Chain-of-thought (CoT)를 강요하지 마십시오. 대신 "최종 답변", "간단한 근거" 또는 구조화된 출력을 요청하십시오.
- 프롬프트를 짧고 명확하게 유지하십시오. 제약 조건 및 평가 기준은 필요한 경우에만 추가하십시오.
- Zero-shot으로 시작하십시오. 일관된 실패 모드가 보이는 경우에만 Few-shot 예제를 추가하십시오.
DeepSeek R1과 v3의 차이점
- DeepSeek R1: "답변하기 전에 생각"하도록 설계된 추론 최적화 모델로, 명시적인 단계별 프롬프트의 필요성을 줄입니다. 많은 플랫폼과 문서에서는 CoT 요구를 피하도록 권장합니다. Zero-shot이 R1에 가장 적합한 경우가 많습니다.
- DeepSeek v3: 빠르고 강력한 MoE 채팅 모델(총 6710억 개의 파라미터, 토큰당 370억 개 활성)로, 뛰어난 비용 대비 성능, 친숙한 API 사용 편의성 및 최신 모델 품질을 갖춘 범용 언어 작업을 목표로 합니다. 공식 문서에서는 OpenAI 스타일의 API 사용법을 보여줍니다.
실제 사용:
- 다음과 같은 경우 R1을 선택하십시오: 수학 단어 문제, 전략 분석, 다중 제약 조건 계획, 잠재적 단계가 있는 까다로운 추론.
- 다음과 같은 경우 v3를 선택하십시오: 고객 채팅, 코딩 검토, 재작성, 요약 및 빠른 반복 루프.
황금률: 추론 모델에 과도한 프롬프트를 사용하지 마십시오.
R1과 같은 추론 모델은 이미 내부적으로 심의를 수행합니다. CoT("단계별로 생각하고 추론을 보여주세요")를 강요하면 장황해지고 모델의 집중력을 흐트러뜨릴 수 있으며, 일부 설정에서는 권장되지 않을 수 있습니다. 대신 다음을 사용하십시오:
- "답변을 제시한 다음, 그 이유를 이끌어낸 3가지 핵심 요소를 나열하십시오."
- "결과와 2문장으로 된 정당성만 반환하십시오."
이는 간단한 Zero-shot 프롬프트가 R1에 대한 복잡한 단계별 지침만큼 효과적이거나 더 나을 수 있다는 지침과 일치합니다.
잘 작동하는 프롬프트 패턴
1) Zero-Shot, 최소주의 (R1에 가장 먼저 시도해보기 좋음; v3에도 좋음)
목표: 최소한의 제약 조건으로 중요한 문제를 해결합니다.
프롬프트 템플릿:
당신은 신중한 문제 해결사입니다.
질문: {task}
지침: 최종 답변과 간결한 근거(최대 3문장)를 제공하십시오.
이것이 작동하는 이유: 출력을 집중시키고 짧게 유지하면서 내부 추론을 장려합니다.
2) 제약된 출력 (API, 안정성 또는 자동화용)
예측 가능한 형식이 필요한 경우 사용하십시오.
프롬프트 템플릿:
시스템: 유효한 JSON만 반환해야 합니다.
사용자: 이 문서를 5개의 글머리 기호로 요약하고 하나의 위험 요소와 하나의 기회 요소를 포함하십시오.
JSON 반환: {
"bullets": . 뉴스/모델 노트는 v3의 효율성과 규모를 강조하고, 모델 카드는 추가 컨텍스트를 제공합니다.
사용 사례별 DeepSeek v3 및 R1 선택
- 고객 지원 채팅: 속도 및 비용을 위해 v3를 사용하십시오. 어조 및 정책 준수를 위해 Few-shot 예제를 추가하십시오.
- 분석가 브리핑 및 의사 결정 메모: 더 높은 무결성 추론을 위해 R1을 사용하십시오. "간단한 근거" 제약 조건을 설정하십시오.
- 코딩 검토 및 리팩터링 계획: 빠른 반복에는 v3가 훌륭합니다. 절충안에 대한 심층적인 추론이 필요한 경우 R1을 사용하십시오.
- 제약 조건이 있는 수학, 논리, 스케줄링: 일반적으로 R1이 뛰어납니다.
- 대규모 요약 또는 재작성 파이프라인: 처리량을 위해 v3를 사용하십시오.
RAG 어시스턴트에서 R1을 사용하여 빌드하는 방법에 대한 자습서는 커뮤니티 및 자습서 작성에서 엔드 투 엔드 패턴, v3에 대한 코딩 중심 예제 및 커뮤니티 스택을 통한 로컬 실험을 보여줍니다.
추론 콘텐츠의 안전한 처리
- 전체 CoT를 요청하지 마십시오. 투명성이 필요한 경우 짧은 정당성 또는 핵심 요소 목록을 요청하십시오.
- 민감한 도메인의 경우 정책 라인을 포함하십시오: "확실하지 않거나 작업이 해를 끼칠 수 있는 경우 명확한 질문을 하거나 거부하십시오."
- 수치 작업에 대한 유효성 검사 프롬프트를 추가하십시오: "답변하기 전에 산술 연산을 다시 확인하십시오."
이는 R1 스타일 모델에 대한 일반적인 모범 사례 지침을 반영합니다. 즉, 최소한의 프롬프트, CoT 유도 방지 및 모델의 내부 추론에 의존합니다.
프롬프트 라이브러리: 복사 가능한 스니펫
A) 복잡한 계획 (R1)
목표: 최소한의 이탈로 1,000명의 사용자를 위한 6주 제품 베타를 계획하십시오.
반환:
- 완화 (위험당 하나)
제약 조건: 총 200단어 미만으로 유지하십시오.
시스템: 당신은 도움이 되는 정책 준수 어시스턴트입니다. 요청이 정책과 충돌하는 경우 명확한 질문을 하거나 안전한 대안을 제공하십시오.
사용자: 지연된 주문에 대한 환불 응답을 작성하십시오. 공감적인 어조를 유지하고 두 가지 옵션을 제공하십시오.
다음을 해결하십시오. 최종 답변과 2문장 검사를 제공하십시오.
문제: {word problem}
당신은 선임 Python 검토자입니다. 성능 및 가독성을 위해 스니펫을 분석하십시오.
반환:
### E) JSON으로 데이터 추출 (v3)
시스템: 유효한 JSON만 반환하십시오.
사용자: 텍스트에서 회사, 수익 및 HQ를 추출하십시오. 누락된 경우 null을 사용하십시오.
스키마: {"company":"string","revenue":"string|null","hq":"string|null"}
텍스트: {paste}
문제 해결: 출력이 벗어나거나 환각을 일으키는 경우
- 너무 장황합니까? 최대 토큰 수를 줄이거나 "최대 120단어"를 추가하십시오.
- 일관성 없는 형식입니까? JSON 전용 시스템 프롬프트와 중지 시퀀스를 추가하십시오.
- 잘못된 가정입니까? 한 줄 제약 조건을 추가하십시오: "확실하지 않은 경우 명확한 질문 1개를 하십시오."
- 수학 오류입니까? "최종 답변 전에 산술 연산을 다시 확인하십시오."를 추가하십시오.
- 깨지기 쉬운 chain 작업입니까? 두 개의 호출로 분할하십시오: 계획 → 실행.
API 빠른 시작 (개념적)
- 엔드포인트 및 키 관리는 OpenAI 스타일 인터페이스를 따릅니다.
model, messages, temperature, max_tokens 및 스트리밍 옵션과 같은 표준 필드를 예상하십시오.
- DeepSeek v3 사양 및 성능 주장은 공식 뉴스/모델 업데이트 및 모델 카드에 요약되어 있습니다.
참고: 프롬프트 반복을 위해 Sider.AI 사용
패턴을 빠르게 탐색하는 경우(Zero-shot 대 Few-shot 테스트, 형식 전환 또는 R1 대 v3 응답 비교) 오버레이 어시스턴트가 루프 속도를 높일 수 있습니다. 덧붙여서 Sider.AI를 사용하면 단일 워크플로에서 페이지와 도구 전체에서 프롬프트를 쉽게 작성, 반복 및 A/B 테스트할 수 있으므로 작업에 가장 적합한 최소 프롬프트를 찾을 수 있습니다. 주요 내용
- DeepSeek R1에는 최소한의 Zero-shot 프롬프트를 선호하십시오. 명시적인 CoT 요청을 피하십시오.
- 빠르고 확장 가능한 채팅 및 구조화된 작업에는 DeepSeek v3를 사용하십시오. 안정성을 위해 제약된 형식을 활용하십시오.
- 일관된 실패 모드를 수정하기 위해서만 Few-shot 예제를 추가하십시오.
- JSON 스키마, 짧은 시스템 프롬프트 및 중지 시퀀스로 구조를 적용하십시오.
- 복잡한 추론의 경우 전체 추론 로그가 아닌 최종 답변과 간단한 정당성을 요청하십시오.
FAQ
Q1:DeepSeek v3 대신 DeepSeek R1을 선택해야 하는 경우는 언제입니까?
다단계 추론, 복잡한 계획 및 수학/논리 작업에는 DeepSeek R1을 선택하십시오. 빠르고 일반적인 채팅, 초안 작성, 코딩 지원 및 높은 처리량 파이프라인에는 v3를 선택하십시오.
Q2:DeepSeek R1과 함께 CoT 프롬프트를 사용해야 합니까?
아니요. 지침에서는 명시적인 CoT를 피하고 모델의 내장 추론에 의존할 것을 제안합니다. 대신 간단한 정당성이 포함된 최종 답변을 요청하십시오.
Q3:DeepSeek v3에서 일관된 JSON을 얻으려면 어떻게 해야 합니까?
JSON만 강제하는 짧은 시스템 프롬프트를 사용하고, 엄격한 스키마를 정의하고, 선택적으로 중지 시퀀스를 설정하십시오. 드리프트를 제한하려면 온도를 낮추고 최대 토큰 수를 제한하십시오.
Q4:추론 작업에 어떤 온도를 사용해야 합니까?
결정론 및 평가를 위해 낮게(0.0–0.3) 시작하십시오. 초안 작성 또는 코딩에서 균형 잡힌 창의성을 위해 0.4–0.7로 올리고, 브레인스토밍에는 더 높은 값을 사용하십시오.
Q5:DeepSeek 모델을 로컬에서 실행할 수 있습니까?
실험을 위한 커뮤니티 설정이 있지만 프로덕션에서는 안정성 및 성능을 위해 호스팅된 API를 사용하는 경우가 많습니다. 로컬 지침은 모델 카드 및 커뮤니티 가이드를 확인하십시오.