Komponer Multi-Trinns Robot Oppgaver med Selvtillit
Hvis du kan beskrive en oppgave tydelig, kan roboten din sannsynligvis gjøre det. Det er løftet til Gemini Robotics 1.5 og ER 1.5 – modeller bygget for forankret, legemlig resonnering som gjør høyt nivå intensjon om til pålitelige, multi-trinns handlingsplaner i den fysiske verden. Nedenfor er 25 utprøvde prompt-maler – organisert etter intensjon – som hjelper deg med å komponere robuste, multi-trinns arbeidsflyter for ekte robotikk.
Stilnotat: Praktisk og løsningsorientert. Hver mal inkluderer strukturen, anbefalte sikkerhetsmekanismer og valgfrie variabler. Erstatt plassholdere som {OBJECT}, {LOCATION}, {POLICY} og {CONSTRAINTS} med din kontekst.
Hvordan Bruke Disse Malene
- Start med et høyt nivå mål, og nummerer deretter trinn med sensor-sjekker og gjenopprettingsatferd.
- Inkluder begrensninger: sikkerhet, hastighet/presisjon, miljøantakelser og fallback-strategier.
- Gi tilbakemelding om statuskanaler (f.eks. visuelle suksesskriterier, kraft/dreiemoment-terskler).
- Foretrekk deklarative mål over skjøre steg-for-steg mikrostyring; la modellen planlegge og tilpasse seg.
Forresten, hvis du orkestrerer prompter, logger og iterasjoner på tvers av et team, kan en sidepanelassistent som Sider.AI hjelpe deg med å utarbeide, teste og finjustere prompter sammen med dine dokumenter og kode, og holde konteksten synlig mens du itererer på dine robotiske ferdigheter og prosedyrer. Seksjon A — Planlegging & Forankring (Grunnlag)
- Oppgave Tegning (Mål → Begrensninger → Plan → Sjekker)
- Prompt
"Du kontrollerer en mobil manipulator.
Mål: {GOAL}.
Miljø: {DESCRIPTION}; kjente objekter: {OBJECT_LIST}.
Begrensninger: {CONSTRAINTS}.
Output: 1) Antakelser å verifisere, 2) Ordnet plan med persepsjon/handlings trinn, 3) Sikkerhetssjekker per trinn, 4) Gjenopprettingsatferd, 5) Avslutningsbetingelser og suksessmålinger."
- Bruk når: Konverterer et høyt nivå mål til en operasjonell plan med sikkerhetsmekanismer.
- Persepsjon-Først Plan med Usikkerhetskvantifisering
- Prompt
"Før du handler, bygg en observasjonsmodell. Identifiser nødvendige observasjoner, konfidenseterskler og edge-tilfeller for {GOAL}. Output JSON:
{ observations:. For bredere prompt- og agentmønstre er Googles Gemini kokebok og agentguider nyttige referanser.
Eksempel: End-to-End Prompt for en Kjøkkenoppgave
Mål: Forbered en enkel salat og pakk den for å ta med.
Prompt
"Du kontrollerer en 7-DOF mobil manipulator med en parallell griper og verktøyveksler.
Mål: Forbered og pakk en salat med salat, tomat, agurk og dressing.
Miljø: Kjøkkenøy med vask, skjærebrett, kokkekniv, salatbolle, matboks. Mennesker kan være til stede.
Begrensninger: Ingen blader innenfor 0,5 m fra mennesker. Knivsegg alltid sliret med mindre den skjærer. Gripekraft ≤ 15 N. Skivetykkelse 3–4 mm. Overflater rengjort.
Output:
- Antakelser å verifisere (verktøy, ingredienser, belysning),
- Plan i faser (vask → forbered → skjær → monter → pakk),
- Sikkerhetssjekker per trinn (syn/kraft),
- Feilgjenoppretting (omgrep, flytt på nytt, rengjør på nytt),
- Suksessmålinger (visuell bekreftelse av jevne skiver; beholder forseglet; område rent),
- Loggskjema og bilder før/etter."
Hva du får: En langsiktig, sikkerhetsbevisst prosedyre med persepsjons-porter, verktøyhåndteringsregler og klare suksesskriterier.
Avsluttende Tanker
Gode robotikk-prompter leses som sjekklister fra luftfarten: klare mål, målbare porter og planlagte utveier. Bruk disse 25 malene som byggeklosser, og finjuster dem deretter med logger fra ekte kjøringer. Etter hvert som Gemini Robotics 1.5 og ER 1.5 fortsetter å bringe agentisk planlegging inn i den fysiske verden, er dine prompter forskjellen mellom en god demo og pålitelig daglig drift.
FAQ
Q1: Hva brukes Gemini Robotics 1.5 / ER 1.5 til?
De er legemlig resonneringsmodeller som lar roboter oppfatte, planlegge og handle på tvers av komplekse, multi-trinns oppgaver i den fysiske verden – som å plukke gjenstander, tilberede mat eller fasilitetsoperasjoner. De legger vekt på forankring, sikkerhet og adaptiv planlegging.
Q2: Hvordan skriver jeg prompter for multi-trinns robot oppgaver?
Angi mål, miljø og begrensninger. Be om antakelser å verifisere, sikkerhetssjekker, gjenopprettingsatferd og suksessmålinger. La modellen planlegge trinn mens du håndhever retningslinjer og terskler.
Q3: Kan disse promptene håndtere usikkerhet og feil?
Ja. Inkluder konfidenseterskler, feilsignaturer og fallback-grener. Å designe tilstandsmaskiner med nominelle, lav-konfidens og feilbaner forbedrer påliteligheten i ustrukturerte omgivelser.
Q4: Må jeg spesifisere eksakte baner?
Vanligvis ikke. Gi mål på høyt nivå, klare begrensninger (kraft, klaring, hastighet) og verifikasjons-porter. Modellen kan generere baner som er konsistente med disse begrensningene.
Q5: Hvor kan jeg finne offisielle dokumenter og eksempler?
Se Google DeepMinds Gemini Robotics sider og utvikleroversikten for ER 1.5, pluss Gemini kokeboken og agentguider for bredere prompting og agentmønstre.