Compuneți cu încredere sarcini robotice în mai mulți pași
Dacă puteți descrie clar o sarcină, robotul dvs. o poate face probabil. Aceasta este promisiunea Gemini Robotics 1.5 și ER 1.5 – modele construite pentru raționament întemeiat, întruchipat, care transformă intenția de nivel înalt în planuri de acțiune fiabile, în mai mulți pași, în lumea fizică. Mai jos sunt 25 de șabloane de prompt dovedite – organizate în funcție de intenție – care vă ajută să compuneți fluxuri de lucru robuste, în mai mulți pași, pentru robotică în lumea reală.
Notă de stil: Practic și orientat spre soluții. Fiecare șablon include structura, regulile de protecție recomandate și variabile opționale. Înlocuiți substituenții precum {OBJECT}, {LOCATION}, {POLICY} și {CONSTRAINTS} cu contextul dvs.
Cum să utilizați aceste șabloane
- Începeți cu un obiectiv de nivel înalt, apoi enumerați pașii cu verificări ale senzorilor și comportament de recuperare.
- Includeți constrângeri: siguranță, viteză/precizie, ipoteze de mediu și strategii de rezervă.
- Furnizați canale de feedback de stare (de exemplu, criterii de succes vizual, praguri de forță/cuplu).
- Preferă obiective declarative în locul microgestionării fragile pas cu pas; lăsați modelul să planifice și să se adapteze.
Apropo, dacă orchestrați solicitări, jurnale și iterații într-o echipă, un asistent cu panou lateral, cum ar fi Sider.AI, vă poate ajuta să redactați, să testați și să rafinați solicitări alături de documentele și codul dvs., menținând contextul vizibil pe măsură ce iterați asupra abilităților și procedurilor dvs. robotice. Secțiunea A – Planificare și împământare (Fundații)
- Planul sarcinii (Obiectiv → Constrângeri → Plan → Verificări)
- Prompt
"Controlezi un manipulator mobil.
Obiectiv: {GOAL}.
Mediu: {DESCRIPTION}; obiecte cunoscute: {OBJECT_LIST}.
Constrângeri: {CONSTRAINTS}.
Ieșire: 1) Ipoteze de verificat, 2) Plan ordonat cu pași de percepție/acțiune, 3) Verificări de siguranță per pas, 4) Comportamente de recuperare, 5) Condiții de încetare și valori ale succesului."
- Utilizați când: Convertiți un obiectiv de nivel înalt într-un plan operațional cu reguli de protecție.
- Plan de percepție mai întâi cu cuantificarea incertitudinii
- Prompt
"Înainte de a acționa, construiți un model de observație. Identificați observațiile necesare, pragurile de încredere și cazurile extreme pentru {GOAL}. Ieșire JSON:
{ observations:. Pentru modele mai largi de prompt și agent, ghidul de bucate Gemini de la Google și ghidurile agent sunt referințe utile.
Exemplu: Prompt end-to-end pentru o sarcină de bucătărie
Obiectiv: Pregătiți o salată simplă și împachetați-o pentru a lua la pachet.
Prompt
"Controlezi un manipulator mobil 7-DOF cu o prindere paralelă și un schimbător de scule.
Obiectiv: Pregătiți și împachetați o salată cu salată verde, roșii, castraveți și dressing.
Mediu: Insulă de bucătărie cu chiuvetă, tocător, cuțit de bucătar, castron pentru salată, recipient pentru prânz. Este posibil să fie prezenți oameni.
Constrângeri: Fără lame la mai puțin de 0,5 m de oameni. Marginea cuțitului este întotdeauna teacă, cu excepția tăierii. Forța de prindere ≤ 15 N. Grosimea feliei 3–4 mm. Suprafețe dezinfectate.
Ieșire:
- Ipoteze de verificat (unelte, ingrediente, iluminare),
- Planificați în faze (spălare → pregătire → tăiere → asamblare → împachetare),
- Verificări de siguranță per pas (vedere/forță),
- Recuperarea erorilor (reapucare, repoziționare, re-curățare),
- Valori ale succesului (confirmare vizuală a felilor uniforme; recipient sigilat; zonă curată),
- Schema jurnalului și fotografii înainte/după."
Ce veți obține: O procedură cu orizont lung, conștientă de siguranță, cu porți de percepție, reguli de manipulare a uneltelor și criterii clare de succes.
Gânduri de încheiere
Solicitările excelente de robotică se citesc ca liste de verificare din aviație: obiective clare, porți măsurabile și scăpări planificate. Utilizați aceste 25 de șabloane ca elemente constitutive, apoi rafinați-le cu jurnale de la rulări reale. Pe măsură ce Gemini Robotics 1.5 și ER 1.5 continuă să aducă planificarea agentică în lumea fizică, solicitările dvs. fac diferența dintre o demonstrație bună și operațiuni zilnice de încredere.
Întrebări frecvente
Î1: Pentru ce se folosește Gemini Robotics 1.5 / ER 1.5?
Sunt modele de raționament întruchipat care permit roboților să perceapă, să planifice și să acționeze în sarcini complexe, în mai mulți pași, în lumea fizică – cum ar fi ridicarea articolelor, pregătirea alimentelor sau operațiunile de facilități. Ele pun accent pe împământare, siguranță și planificare adaptivă.
Î2: Cum scriu solicitări pentru sarcini robotice în mai mulți pași?
Indicați obiectivul, mediul și constrângerile. Cereți ipoteze de verificat, verificări de siguranță, comportamente de recuperare și valori ale succesului. Lăsați modelul să planifice pașii în timp ce aplicați politici și praguri.
Î3: Pot aceste solicitări să gestioneze incertitudinea și erorile?
Da. Includeți praguri de încredere, semnături de eroare și ramuri de rezervă. Proiectarea mașinilor de stare cu căi nominale, cu încredere scăzută și cu erori îmbunătățește fiabilitatea în setări nestructurate.
Î4: Trebuie să specific traiectorii exacte?
De obicei, nu. Furnizați obiective de nivel înalt, constrângeri clare (forță, spațiu liber, viteză) și porți de verificare. Modelul poate genera traiectorii compatibile cu aceste constrângeri.
Î5: Unde pot găsi documente și exemple oficiale?
Consultați paginile Gemini Robotics de la Google DeepMind și prezentarea generală pentru dezvoltatori pentru ER 1.5, plus ghidul de bucate Gemini și ghidurile agent pentru solicitări mai largi și modele de agent.