자신감을 가지고 다단계 로봇 작업을 구성하세요
작업을 명확하게 설명할 수 있다면 로봇도 할 수 있을 것입니다. 이는 Gemini Robotics 1.5와 ER 1.5의 약속입니다. 이 모델들은 높은 수준의 의도를 실제 세계에서 신뢰할 수 있는 다단계 실행 계획으로 전환하는 접지 기반, 구현된 추론을 위해 구축되었습니다. 다음은 실제 로봇 공학을 위한 강력한 다단계 워크플로를 구성하는 데 도움이 되는 의도별로 정리된 25개의 검증된 프롬프트 템플릿입니다.
스타일 참고: 실용적이고 솔루션 지향적입니다. 각 템플릿에는 구조, 권장 보호 장치 및 선택적 변수가 포함되어 있습니다. {OBJECT}, {LOCATION}, {POLICY} 및 {CONSTRAINTS}와 같은 자리 표시자를 컨텍스트로 바꾸십시오.
이 템플릿 사용 방법
- 높은 수준의 목표로 시작한 다음 센서 검사 및 복구 동작으로 단계를 열거합니다.
- 안전, 속도/정밀도, 환경 가정 및 폴백 전략과 같은 제약 조건을 포함합니다.
- 상태 피드백 채널(예: 비전 성공 기준, 힘/토크 임계값)을 제공합니다.
- 취약한 단계별 마이크로 관리보다 선언적 목표를 선호하십시오. 모델이 계획하고 적응하도록 하십시오.
참고로, 팀 전체에서 프롬프트, 로그 및 반복을 오케스트레이션하는 경우 Sider.AI와 같은 사이드 패널 지원을 통해 문서 및 코드와 함께 프롬프트를 작성, 테스트 및 개선하고 로봇 기술 및 절차를 반복할 때 컨텍스트를 볼 수 있습니다. 섹션 A — 계획 및 접지 (기초)
- 작업 청사진 (목표 → 제약 조건 → 계획 → 검사)
- 프롬프트
"당신은 모바일 매니퓰레이터를 제어하고 있습니다.
목표: {GOAL}.
환경: {DESCRIPTION}; 알려진 객체: {OBJECT_LIST}.
제약 조건: {CONSTRAINTS}.
출력: 1) 확인해야 할 가정, 2) 지각/행동 단계가 있는 정렬된 계획, 3) 단계별 안전 점검, 4) 복구 행동, 5) 종료 조건 및 성공 메트릭."
- 다음 경우에 사용: 높은 수준의 목표를 보호 장치가 있는 운영 계획으로 변환합니다.
- 프롬프트
"행동하기 전에 관찰 모델을 구축하십시오. {GOAL}에 필요한 관찰, 신뢰 임계값 및 에지 케이스를 식별하십시오. JSON 출력:
{ observations:. 더 넓은 프롬프트 및 에이전트 패턴의 경우 Google의 Gemini 쿡북 및 에이전트 가이드가 유용한 참고 자료입니다.
예: 주방 작업을 위한 엔드 투 엔드 프롬프트
목표: 간단한 샐러드를 준비하여 포장합니다.
프롬프트
"당신은 평행 그리퍼와 도구 교환기가 있는 7-DOF 모바일 매니퓰레이터를 제어하고 있습니다.
목표: 상추, 토마토, 오이 및 드레싱으로 샐러드를 준비하고 포장합니다.
환경: 싱크대, 도마, 요리사 칼, 샐러드 볼, 점심 용기가 있는 주방 아일랜드. 사람이 있을 수 있습니다.
제약 조건: 사람으로부터 0.5m 이내에 칼날이 없습니다. 칼날은 항상 절단하지 않는 한 칼집에 넣습니다. 그리퍼 힘 ≤ 15 N. 슬라이스 두께 3–4 mm. 표면 살균 처리.
출력:
- 단계별 계획 (세척 → 준비 → 절단 → 조립 → 포장),
- 성공 메트릭 (균등한 슬라이스의 시각적 확인, 용기 밀봉, 영역 청소),
얻을 수 있는 것: 지각 게이트, 도구 처리 규칙 및 명확한 성공 기준이 있는 장기적인 안전 인식 절차입니다.
마무리 생각
훌륭한 로봇 공학 프롬프트는 항공의 체크리스트와 같습니다. 명확한 목표, 측정 가능한 게이트 및 계획된 탈출. 이 25개의 템플릿을 빌딩 블록으로 사용한 다음 실제 실행의 로그로 개선하십시오. Gemini Robotics 1.5와 ER 1.5가 에이전트 계획을 실제 세계로 계속 가져옴에 따라 귀하의 프롬프트는 좋은 데모와 신뢰할 수 있는 일상 작업의 차이점입니다.
FAQ
Q1:Gemini Robotics 1.5 / ER 1.5는 무엇에 사용됩니까?
이들은 로봇이 물건을 집거나, 음식을 준비하거나, 시설 운영과 같이 복잡하고 다단계 작업을 통해 지각하고, 계획하고, 행동할 수 있도록 하는 구현된 추론 모델입니다. 이들은 접지, 안전 및 적응형 계획을 강조합니다.
Q2:다단계 로봇 작업을 위한 프롬프트를 어떻게 작성합니까?
목표, 환경 및 제약 조건을 명시하십시오. 확인해야 할 가정, 안전 점검, 복구 행동 및 성공 메트릭을 요청하십시오. 모델이 단계를 계획하는 동안 정책 및 임계값을 적용하십시오.
Q3:이러한 프롬프트는 불확실성과 오류를 처리할 수 있습니까?
예. 신뢰 임계값, 오류 서명 및 폴백 분기를 포함하십시오. 명목, 낮은 신뢰도 및 실패 경로가 있는 상태 머신을 설계하면 구조화되지 않은 설정에서 안정성이 향상됩니다.
Q4:정확한 궤적을 지정해야 합니까?
일반적으로는 아닙니다. 높은 수준의 목표, 명확한 제약 조건 (힘, 간극, 속도) 및 검증 게이트를 제공하십시오. 모델은 이러한 제약 조건과 일치하는 궤적을 생성할 수 있습니다.
Q5:공식 문서 및 예제는 어디에서 찾을 수 있습니까?
Google DeepMind의 Gemini Robotics 페이지와 ER 1.5에 대한 개발자 개요, 그리고 더 넓은 프롬프트 및 에이전트 패턴에 대한 Gemini 쿡북 및 에이전트 가이드를 참조하십시오.