Agentic 의사 결정 및 실행 계획을 위해 DeepSeek v3.1 Terminus를 사용하는 방법
Agentic AI는 단순히 질문에 답하는 것을 넘어, 다음에 무엇을 해야 할지, 왜 중요한지, 어떻게 실행할지를 결정하는 것입니다. DeepSeek v3.1 Terminus는 더 강력한 추론, 도구 사용, 복잡한 워크플로우를 위해 설계된 다단계 계획 기능을 통해 이러한 영역에 진입합니다. Agentic 의사 결정 및 신뢰할 수 있는 실행 계획에 연결하는 방법을 궁금해하셨다면, 이 가이드에서 실용적인 엔드 투 엔드 플레이북을 제공합니다.
참고: DeepSeek v3.1은 최근 업데이트를 통해 Fireworks와 같은 플랫폼에서 사용 가능성을 포함하여 코딩 및 Agentic 진행의 개선으로 인정받았습니다. 또한 DeepSeek과 Gemini 및 Mistral과 같은 모델을 혼합하는 프롬프트 스태킹 접근 방식은 에이전트가 창의성과 정확성을 모두 필요로 할 때 유용한 보다 강력한 다중 모델 워크플로우를 가능하게 합니다.
이 튜토리얼에서는 실용적이고 솔루션 지향적인 접근 방식을 취합니다. 즉시 적용할 수 있는 스캐폴드, 프롬프트, 시스템 설계 패턴 및 품질 관리 체크리스트를 얻을 수 있습니다. 또한 다중 모델 "프롬프트 스택"이 적합한 위치와 에이전트 루프가 꼬이기 전에 디버깅하는 방법도 보여 드리겠습니다.
구축할 내용
- 모호한 목표를 구체적이고 우선 순위가 지정된 실행 계획으로 전환하는 Agentic 루프
- 명시적 기준을 사용하여 속도와 정확성의 균형을 맞추는 의사 결정 정책
- 도구 사용 패턴: 검색, 검색, 계산기 및 실행 스텁
- 선택 사항: DeepSeek v3.1 Terminus가 계획을 처리하고 다른 모델이 하위 작업을 처리하는 다중 모델 프롬프트 스택.
Agentic 의사 결정을 위한 DeepSeek v3.1 Terminus를 선택하는 이유?
- 더 강력한 다단계 추론 및 코딩 지향 실행은 에이전트의 "계획자/감독"으로서 효과적입니다.
- 특히 구조화된 프롬프트를 통해 결정론이 필요한 경우 혼합 작업(요구 사항 분석 → 계획 → 도구 호출 → 종합)에서 성능이 뛰어납니다.
- 프롬프트 스택에서 잘 작동합니다. 브레인스토밍을 창의적인 모델에 위임하고, 제약 조건 인식 계획을 위해 DeepSeek을 사용하고, 빠른 모델을 호출하여 검증합니다.
참고로, 다중 모델 전환이 가능한 사용자 친화적인 인터페이스에서 이를 오케스트레이션하려는 경우, Sider.AI를 사용하면 이러한 흐름을 쉽게 구성하고 연구 및 계획 중에 프롬프트 스택을 재사용할 수 있습니다. 다음에서 살펴볼 수 있습니다. Agent 아키텍처 한눈에 보기
신뢰할 수 있는 에이전트는 5개의 레이어로 구성됩니다.
- 목표 수집: 지저분한 목표를 구조화된 목표 및 제약 조건으로 정규화합니다.
- 추론된 계획: 단계, 추정치, 종속성 및 위험 플래그가 있는 초안 계획을 생성합니다.
- 의사 결정 정책: 비용, 시간, 신뢰도 및 위험을 기준으로 다음 작업을 선택합니다.
- 툴링: 검증 가능한 출력을 사용하여 단계를 검색, 검색, 계산 및 실행합니다.
- QA 및 성찰: 요구 사항에 대한 출력을 확인하고, 비판을 실행하고, 수정합니다.
DeepSeek v3.1 Terminus는 레이어 2~5를 고정할 수 있지만, 특히 구조화된 계획 및 성찰적 의사 결정에서 뛰어납니다.
핵심 프롬프트 패턴(재사용 가능)
일관되고 구조화된 "시스템 + 개발자 + 사용자" 프롬프트를 사용합니다. 다음은 조정할 수 있는 기준선입니다.
시스템
계획 우선 에이전트로 작동하는 DeepSeek v3.1 Terminus입니다. 다음을 수행해야 합니다.
- 단계, 종속성, 소유자(알려진 경우), 도구, 예상 출력이 포함된 실행 계획 생성
- 의사 결정 정책 사용: 종속성이 차단하지 않는 한 영향이 크고 노력이 적은 작업을 먼저 우선 순위 지정
- 단계를 실행하기 전에 검증 방법 및 롤백 계획 초안 작성
- 단계별로 생각하되 간결하고 구조화된 결과를 반환
개발자
정책:
- 항상 누락된 제약 조건(예산, 마감일, 품질 기준, 규정 준수) 요청
- 추론을 위해 스크래치패드를 사용합니다. 최종 계획만 요약합니다.
- 도구를 호출할 때 JSON 도구 호출 블록(이름, 입력)을 내보냅니다.
- 각 도구 결과 후 비판을 실행하고 수락하거나 수정합니다.
- 안정적인 계획 후 또는 누락된 정보로 인해 차단된 경우 중지
사용자
목표: {user goal here}
컨텍스트: {available data, tools, constraints}
출력 형식: {objectives, plan, decisions, risks, open_questions} 키가 있는 JSON
목표에서 실행 계획으로: 작업 예제
시나리오: "기본 이메일 캡처 및 3개의 SEO 페이지를 포함하여 10일 이내에 새로운 AI 기능에 대한 랜딩 페이지를 시작합니다."
프롬프트(사용자)
목표: 10일 이내에 랜딩 페이지 + 3개의 SEO 페이지 시작
컨텍스트: 예산 $1,500. 도구: Webflow, Mailchimp, Notion. 대상: B2B PM. 모바일 최적화 필수; Lighthouse 점수 ≥ 90.
예상 출력(구조)
- 목표: 메트릭 및 타임라인이 포함된 SMART 목표
샘플 출력(약어)
- O1: Lighthouse ≥ 90으로 7일차까지 반응형 랜딩 페이지 게시
- O2: 3일차까지 더블 옵트인으로 이메일 캡처 설정
- O3: "AI 로드맵", "Agentic 의사 결정", "실행 계획"을 타겟팅하여 10일차까지 3개의 SEO 페이지 게시
- 1단계: 요구 사항 고정(3시간) → 이해 관계자 승인
- 2단계: Figma의 와이어프레임(5시간) → 모바일 우선 변형
- 3단계: Webflow 빌드(10시간) → 구성 요소, 양식, 분석
- 4단계: SEO 개요 + 초안(8시간) → 브리프, 키워드, H2 구조
- 5단계: QA + Lighthouse 튜닝(4시간) → ≥ 90 모바일
- 속도를 위해 Mailchimp 사용; CRM 통합 연기
- 시간을 절약하기 위해 템플릿 기반 히어로 사용; 나중에 사용자 지정 그림 사용
- SEO 색인 지연 → 사이트맵 제출, 내부 링크
- 양식 안정성 → 데스크톱 및 모바일에서 테스트, 폴백 캡처
실제로 작동하는 의사 결정 정책
에이전트의 선택은 느낌이 아니라 정책이어야 합니다.
- 가치/노력 매트릭스: 학습 및 추진력을 가속화하기 위해 가치가 높고 노력이 적은 작업의 우선 순위를 지정합니다.
- 신뢰도 임계값: 모델 신뢰도가 0.6 미만이면 추가 검증 단계를 실행합니다(예: 두 번째 모델 또는 사람 개입).
- 비용 가드레일: 예상 토큰/도구 비용이 예산을 초과하는 경우 압축된 컨텍스트 모드로 전환하고 일괄 검색합니다.
- 위험 게이트: 단계가 규정 준수에 영향을 미치는 경우 실행 전에 필수 체크리스트 및 법률 검토를 실행합니다.
이러한 정책을 통해 DeepSeek v3.1 Terminus는 예측 가능하게 추론하고 행동할 수 있습니다.
도구 사용 청사진(검색, RAG 및 실행)
에이전트가 사용 가능한 항목과 호출 방법을 알 수 있도록 명시적 도구 인터페이스를 도입합니다.
- web_search(query) → {results}
- retrieve(doc_ids or query) → {snippets}
- calculate(expression) → {value}
- execute(command) → {stdout, stderr}
- schedule(task, time) → {event_id}
DeepSeek v3.1 Terminus를 사용하여 각 도구 호출을 다음 항목과 페어링합니다.
프롬프트 스니펫
사용 가능한 도구: web_search, retrieve, calculate, execute
도구가 필요하다고 생각되면 다음을 생성합니다.
{
"tool_call": {
"name": "web_search",
"input": {"query": "<string>"}
},
"reason": "<why this tool>"
}
그런 다음 도구 결과를 기다립니다. 결과 후 다음을 생성합니다.
{"critique": "<issues>", "decision": "accept|revise", "next": "<next step>"}
성찰 및 자기 비판 루프
단일하고 가벼운 성찰 패스는 중단 없이 10~20% 더 나은 결과를 얻는 경향이 있습니다. 각 주요 단계 후에 다음을 추가합니다.
- 계획 검토: 단계가 최소화되고 종속성 순서대로 되어 있습니까?
- 증거 확인: 출처를 인용하거나 메트릭을 확인했습니까?
- 위험 스캔: 가장 가능성 있는 최악의 실패는 무엇입니까? 조기에 감지하는 방법은 무엇입니까?
- 단순화: 품질을 저하시키지 않고 단계를 삭제하거나 병합할 수 있습니까?
더 긴 프로젝트의 경우 "체크포인트 케이던스"(예: 0일, 3일, 7일, 최종)를 추가하여 조기에 드리프트를 감지합니다.
DeepSeek v3.1 Terminus를 사용한 프롬프트 스태킹
다중 모델 프롬프트 스택은 더 나은 속도와 정확도를 제공할 수 있습니다. 효과적인 패턴:
- 1단계(분기): 창의적인 모델을 사용하여 옵션을 브레인스토밍합니다.
- 2단계(수렴): DeepSeek v3.1 Terminus를 사용하여 선택, 계획 및 제약합니다.
- 3단계(확인): 빠르고 문자 그대로의 모델을 사용하여 사실, 링크 및 계산을 확인합니다.
이 패턴은 복잡한 프로젝트를 위해 DeepSeek, Gemini 및 Mistral을 결합하는 프롬프트 스태킹 가이드에 자세히 설명되어 있습니다. 연구 중심 작업(시장 스캔, 문헌 검토)의 경우 심층 연구 워크플로우 체크리스트도 유용합니다.
복사할 수 있는 템플릿
요구 사항 분석가입니다. 다음을 명확히 하기 위해 5~8개의 타겟 질문을 합니다.
- 마감일, 예산, 품질 기준
- 대상 고객, 필수 도구, 제약 조건(규정 준수, 브랜드)
- 성공 메트릭 및 실패해서는 안 되는 위험
번호가 매겨진 목록으로 반환합니다. 질문 후에 중지합니다.
예: 연구 → 결정 → 실행 계획
목표: "Agentic 플랫폼에 대한 3개의 ICP를 식별하고 다음 분기 로드맵을 제안합니다."
- A단계(연구): web_search + retrieve; 시장 신호 및 경쟁사 포지셔닝을 수집합니다.
- B단계(합성): DeepSeek v3.1 Terminus는 사용 사례와 문제점을 클러스터링합니다.
- C단계(결정): 가치/노력 및 신뢰도 임계값을 적용합니다. ICP를 선택합니다.
- D단계(계획): 마일스톤, 소유자, 위험 및 예산 상한선이 포함된 분기 계획을 만듭니다.
- E단계(확인): 빠른 전문가 검토 또는 가벼운 사용자 인터뷰를 실행합니다.
구현 참고 사항
- JSON 스키마를 사용하여 모델 출력을 검증합니다. 일치하지 않는 응답은 거부합니다.
- 감사를 위해 입력, 근거 및 결과와 함께 각 결정을 기록합니다.
- 드리프트를 방지하기 위해 "메모리" 문서(목표, 결정, 가정)를 유지합니다.
- 실제 효과(이메일, 배포)가 있는 실행 단계의 경우 사람 개입 승인이 필요합니다.
종합하기
DeepSeek v3.1 Terminus는 다음과 같은 경우 특히 효과적입니다.
- 모든 것을 수행하는 실행자가 아닌 결정의 계획자/중재자로 취급합니다.
- 명확한 정책, 도구 계약 및 검증 규칙을 제공합니다.
- 프롬프트 스택을 사용하여 모델 간의 강점을 결합합니다.
채팅, 프롬프트 및 모델에서 이러한 흐름을 쉽게 관리할 수 있는 곳을 원하시면 Sider.AI가 Agentic 의사 결정을 위해 조정할 수 있는 재사용 가능한 프롬프트 스택 및 템플릿을 사용하여 다중 모델 연구 및 계획을 오케스트레이션하는 데 도움을 줄 수 있습니다(방문 ). 다음 단계
- 위의 템플릿을 에이전트 프레임워크에 복사합니다.
- 5~9단계 계획으로 시작하고 하나의 성찰 패스를 활성화합니다.
- 외부 작업에 대한 도구 계약 및 검증을 추가합니다.
- 작업에 창의적인 분기와 정확한 수렴이 모두 필요한 경우 프롬프트 스택으로 반복합니다.
주요 내용:
- 구조는 영리함을 이깁니다. 정책, 계약 및 검사는 에이전트를 안정적으로 만듭니다.
- 다중 모델 스택을 사용하여 창의성, 계획 및 검증을 레이어로 다룹니다.
참고 자료 및 추가 자료
- 복잡한 프로젝트를 위한 DeepSeek, Gemini, Mistral을 사용한 프롬프트 스태킹.
- 코딩 및 Agentic 진행의 DeepSeek v3.1 개선 사항.
- 심층 연구 워크플로우 프롬프트 및 검증 체크리스트.
FAQ
Q1:Agentic 의사 결정을 위해 DeepSeek v3.1 Terminus에 대한 프롬프트를 어떻게 구성합니까?
계층화된 프롬프트를 사용합니다. 수집 질문, 구조화된 계획 JSON, 명시적 의사 결정 정책 및 도구 호출 계약. 각 섹션을 짧게 유지하고 중요한 단계에 대한 검증 및 롤백을 강제합니다.
Q2:실행 계획을 위해 DeepSeek v3.1에 어떤 도구를 연결해야 합니까?
검색, 검색(RAG), 계산기 및 간단한 실행 스텁으로 시작합니다. 스래싱을 방지하기 위해 각 도구에 대한 전제 조건, 예상 출력, 검증 단계 및 롤백 절차를 정의합니다.
Q3:더 나은 결과를 위해 DeepSeek을 다른 모델과 결합할 수 있습니까?
예. 프롬프트 스택을 사용합니다. 브레인스토밍을 위한 창의적인 모델, 제약 조건 인식 계획을 위한 DeepSeek v3.1 Terminus, 검증을 위한 빠른 모델. 이 접근 방식은 복잡한 다단계 프로젝트에 효과적입니다.
Q4:에이전트 루프가 영원히 실행되는 것을 어떻게 방지합니까?
명시적 중지 조건과 성찰 케이던스를 설정합니다. 계획 길이를 제한하고 신뢰도 임계값을 사용하고 위험이 높은 작업에 대한 사람 승인을 요구합니다. 결정을 기록하고 정책을 감사하고 조정하기 위해 결과를 기록합니다.
Q5:계획을 위해 DeepSeek v3.1 Terminus를 시작하는 가장 간단한 방법은 무엇입니까?
계획 템플릿과 5~9단계 계획으로 시작하고 단일 성찰 패스를 추가하고 외부 작업에 대한 검증을 포함합니다. 필요에 따라 도구 통합 및 다중 모델 스택으로 확장합니다.