Skapa säkert robotuppgifter i flera steg
Om du tydligt kan beskriva en uppgift kan din robot troligen utföra den. Det är löftet med Gemini Robotics 1.5 och ER 1.5 – modeller byggda för grundad, förkroppsligad resonemangsförmåga som omvandlar avsikter på hög nivå till pålitliga åtgärdsplaner i flera steg i den fysiska världen. Nedan följer 25 beprövade promptmallar – organiserade efter avsikt – som hjälper dig att skapa robusta arbetsflöden i flera steg för verklig robotteknik.
Stilnotering: Praktisk och lösningsorienterad. Varje mall inkluderar struktur, rekommenderade skyddsräcken och valfria variabler. Ersätt platshållare som {OBJECT}, {LOCATION}, {POLICY} och {CONSTRAINTS} med din kontext.
Så här använder du dessa mallar
- Börja med ett mål på hög nivå och räkna sedan upp steg med sensorkontroller och återställningsbeteende.
- Inkludera begränsningar: säkerhet, hastighet/precision, miljöantaganden och reservstrategier.
- Tillhandahåll återkopplingskanaler för status (t.ex. kriterier för lyckad syn, kraft-/vridmomentsgränser).
- Föredra deklarativa mål framför sköra steg-för-steg-mikrohantering; låt modellen planera och anpassa sig.
Förresten, om du orkestrerar prompter, loggar och iterationer över ett team, kan en sidopanelsassistent som Sider.AI hjälpa dig att utarbeta, testa och förfina prompter tillsammans med dina dokument och din kod, och hålla kontexten synlig när du itererar på dina robotkunskaper och -procedurer. Avsnitt A – Planering och förankring (grunder)
- Uppgiftsritning (mål → begränsningar → plan → kontroller)
- Prompt
"Du styr en mobil manipulator.
Mål: {GOAL}.
Miljö: {DESCRIPTION}; kända objekt: {OBJECT_LIST}.
Begränsningar: {CONSTRAINTS}.
Utdata: 1) Antaganden att verifiera, 2) Ordnat schema med perceptions-/åtgärdssteg, 3) Säkerhetskontroller per steg, 4) Återställningsbeteenden, 5) Avslutningsvillkor och framgångsmått."
- Använd när: Konvertera ett mål på hög nivå till en operativ plan med skyddsräcken.
- Perceptionsförsta plan med osäkerhetskvantifiering
- Prompt
"Innan du agerar, bygg en observationsmodell. Identifiera nödvändiga observationer, konfidensgränser och gränsfall för {GOAL}. Utdata JSON:
{ observations:. För bredare prompt- och agentmönster är Googles Gemini-kokbok och agentguider användbara referenser.
Exempel: Komplett prompt för en köksuppgift
Mål: Förbered en enkel sallad och packa den för avhämtning.
Prompt
"Du styr en 7-DOF mobil manipulator med en parallell gripare och verktygsväxlare.
Mål: Förbered och packa en sallad med sallad, tomat, gurka och dressing.
Miljö: Köksö med diskho, skärbräda, kockkniv, salladsskål, lunchbehållare. Människor kan vara närvarande.
Begränsningar: Inga blad inom 0,5 m från människor. Knivseggen alltid täckt om den inte skär. Gripkraft ≤ 15 N. Skivtjocklek 3–4 mm. Sanerade ytor.
Utdata:
- Antaganden att verifiera (verktyg, ingredienser, belysning),
- Plan i faser (tvätta → förbereda → skära → montera → packa),
- Säkerhetskontroller per steg (syn/kraft),
- Felåterställning (omgripa, omplacera, omrengör),
- Framgångsmått (visuell bekräftelse av jämna skivor; behållare förseglad; rent område),
- Loggschema och foton före/efter."
Vad du får: En långsiktig, säkerhetsmedveten procedur med perceptionsgrindar, verktygshanteringsregler och tydliga framgångskriterier.
Avslutande tankar
Bra robotprompter läses som checklistor från flyget: tydliga mål, mätbara grindar och planerade utvägar. Använd dessa 25 mallar som byggstenar och förfina dem sedan med loggar från verkliga körningar. När Gemini Robotics 1.5 och ER 1.5 fortsätter att föra agentisk planering in i den fysiska världen, är dina prompter skillnaden mellan en bra demo och pålitlig daglig drift.
Vanliga frågor
F1:Vad används Gemini Robotics 1.5 / ER 1.5 till?
De är modeller för förkroppsligad resonemangsförmåga som låter robotar uppfatta, planera och agera i komplexa uppgifter i flera steg i den fysiska världen – som att plocka föremål, förbereda mat eller anläggningsverksamhet. De betonar förankring, säkerhet och adaptiv planering.
F2:Hur skriver jag prompter för robotuppgifter i flera steg?
Ange mål, miljö och begränsningar. Be om antaganden att verifiera, säkerhetskontroller, återställningsbeteenden och framgångsmått. Låt modellen planera steg medan du upprätthåller policyer och tröskelvärden.
F3:Kan dessa prompter hantera osäkerhet och fel?
Ja. Inkludera konfidensgränser, felsignaturer och reservgrenar. Att utforma tillståndsmaskiner med nominella, lågkonfidentiella och felaktiga sökvägar förbättrar tillförlitligheten i ostrukturerade miljöer.
F4:Behöver jag ange exakta banor?
Vanligtvis inte. Ange mål på hög nivå, tydliga begränsningar (kraft, frigång, hastighet) och verifieringsgrindar. Modellen kan generera banor som överensstämmer med dessa begränsningar.
F5:Var kan jag hitta officiella dokument och exempel?
Se Google DeepMinds Gemini Robotics-sidor och utvecklaröversikten för ER 1.5, plus Gemini-kokboken och agentguiderna för bredare prompting- och agentmönster.