Sammensæt fler-trins robotopgaver med selvtillid
Hvis du tydeligt kan beskrive en opgave, kan din robot sandsynligvis udføre den. Det er løftet fra Gemini Robotics 1.5 og ER 1.5 – modeller bygget til jordnær, legemliggjort ræsonnement, der omdanner hensigt på højt niveau til pålidelige, fler-trins handlingsplaner i den fysiske verden. Nedenfor er 25 gennemprøvede prompt-skabeloner – organiseret efter hensigt – der hjælper dig med at sammensætte robuste, fler-trins workflows til virkelighedsrobotteknologi.
Stilnote: Praktisk & løsningsorienteret. Hver skabelon inkluderer struktur, anbefalede sikkerhedsforanstaltninger og valgfrie variabler. Erstat pladsholdere som {OBJECT}, {LOCATION}, {POLICY} og {CONSTRAINTS} med din kontekst.
Sådan bruges disse skabeloner
- Start med et mål på højt niveau, og opregn derefter trin med sensorkontroller og genoprettelsesadfærd.
- Inkluder begrænsninger: sikkerhed, hastighed/præcision, miljøantagelser og fallback-strategier.
- Angiv state feedback-kanaler (f.eks. visionssucceskriterier, kraft/moment-tærskler).
- Foretræk deklarative mål frem for skrøbelig trin-for-trin mikrostyring; lad modellen planlægge og tilpasse.
Forresten, hvis du orkestrerer prompter, logfiler og iterationer på tværs af et team, kan en sidepanelassistent som Sider.AI hjælpe dig med at udarbejde, teste og finjustere prompter sammen med dine dokumenter og kode, og holde konteksten synlig, mens du itererer på dine robotfærdigheder og -procedurer. Afsnit A – Planlægning & Grounding (Grundlag)
- Opgave Blueprint (Mål → Begrænsninger → Plan → Kontroller)
- Prompt
"Du styrer en mobil manipulator.
Mål: {GOAL}.
Miljø: {DESCRIPTION}; kendte objekter: {OBJECT_LIST}.
Begrænsninger: {CONSTRAINTS}.
Output: 1) Antagelser der skal verificeres, 2) Ordnet plan med perception/handlings trin, 3) Sikkerhedskontroller pr. trin, 4) Genoprettelsesadfærd, 5) Afslutningsbetingelser og succesmetrics."
- Brug når: Konvertering af et mål på højt niveau til en operationel plan med sikkerhedsforanstaltninger.
- Perception-First Plan med usikkerhedskvantificering
- Prompt
"Før du handler, skal du opbygge en observationsmodel. Identificer nødvendige observationer, tillidstærskler og edge cases for {GOAL}. Output JSON:
{ observations:. For bredere prompt- og agentmønstre er Googles Gemini kogebog og agentvejledninger nyttige referencer.
Eksempel: End-to-End Prompt til en køkkenopgave
Mål: Forbered en simpel salat og pak den til at tage med.
Prompt
"Du styrer en 7-DOF mobil manipulator med en parallel gribemekanisme og værktøjsskifter.
Mål: Forbered og pak en salat med salat, tomat, agurk og dressing.
Miljø: Køkkenø med vask, skærebræt, kokkekniv, salatskål, madbeholder. Der kan være mennesker til stede.
Begrænsninger: Ingen knive inden for 0,5 m fra mennesker. Knivsæg altid i skede, medmindre der skæres. Gribekraft ≤ 15 N. Skivetykkelse 3–4 mm. Overflader rengjort.
Output:
- Antagelser der skal verificeres (værktøj, ingredienser, belysning),
- Plan i faser (vask → forbered → skær → saml → pak),
- Sikkerhedskontroller pr. trin (vision/kraft),
- Fejlretning (gen-grib, gen-lokalisering, gen-rengøring),
- Succesmetrics (visuel bekræftelse af jævne skiver; beholder forseglet; område rent),
- Logskema og fotos før/efter."
Hvad du får: En langtidshorisont, sikkerhedsbevidst procedure med perceptionsporte, værktøjshåndteringsregler og klare succeskriterier.
Afsluttende tanker
Gode robotteknologiprompter læses som tjeklister fra luftfarten: klare mål, målbare porte og planlagte flugtveje. Brug disse 25 skabeloner som byggesten, og finjuster dem derefter med logfiler fra rigtige kørsler. Efterhånden som Gemini Robotics 1.5 og ER 1.5 fortsætter med at bringe agentisk planlægning ind i den fysiske verden, er dine prompter forskellen mellem en god demo og pålidelig daglig drift.
FAQ
Q1:Hvad bruges Gemini Robotics 1.5 / ER 1.5 til?
De er legemliggjorte ræsonnementsmodeller, der lader robotter opfatte, planlægge og handle på tværs af komplekse, fler-trins opgaver i den fysiske verden – som at vælge genstande, tilberede mad eller facilitetsdrift. De understreger grounding, sikkerhed og adaptiv planlægning.
Q2:Hvordan skriver jeg prompter til fler-trins robotopgaver?
Angiv mål, miljø og begrænsninger. Bed om antagelser der skal verificeres, sikkerhedskontroller, genoprettelsesadfærd og succesmetrics. Lad modellen planlægge trin, mens du håndhæver politikker og tærskler.
Q3:Kan disse prompter håndtere usikkerhed og fejl?
Ja. Inkluder tillidstærskler, fejlsignaturer og fallback-grene. Design af state machines med nominelle, lav-tillids- og fejl paths forbedrer pålideligheden i ustrukturerede omgivelser.
Q4:Skal jeg specificere nøjagtige baner?
Normalt nej. Angiv mål på højt niveau, klare begrænsninger (kraft, frigang, hastighed) og verifikationsporte. Modellen kan generere baner, der er i overensstemmelse med disse begrænsninger.
Q5:Hvor kan jeg finde officielle dokumenter og eksempler?
Se Google DeepMinds Gemini Robotics-sider og udvikleroversigten for ER 1.5, plus Gemini-kogebogen og agentvejledningerne for bredere prompting og agentmønstre.