Composeu tasques robòtiques de diversos passos amb confiança
Si podeu descriure una tasca clarament, el vostre robot probablement la podrà fer. Aquesta és la promesa de Gemini Robotics 1.5 i ER 1.5: models creats per a un raonament encarnat i fonamentat que converteixen la intenció d'alt nivell en plans d'acció fiables i de diversos passos al món físic. A continuació, hi ha 25 plantilles de provades, organitzades per intenció, que us ajuden a compondre fluxos de treball robustos i de diversos passos per a la robòtica del món real.
Nota d'estil: pràctic i orientat a la solució. Cada plantilla inclou l'estructura, les mesures de seguretat recomanades i les variables opcionals. Substituïu els marcadors de posició com {OBJECT}, {LOCATION}, {POLICY} i {CONSTRAINTS} amb el vostre context.
Com utilitzar aquestes plantilles
- Comenceu amb un objectiu d'alt nivell i, a continuació, enumereu els passos amb controls de sensors i comportament de recuperació.
- Incloeu restriccions: seguretat, velocitat/precisió, suposicions d'entorn i estratègies de reserva.
- Proporcioneu canals de retroalimentació d'estat (per exemple, criteris d'èxit de visió, llindars de força/parell).
- Preferiu objectius declaratius en lloc de microgestió pas a pas fràgil; deixeu que el model planifiqui i s'adapti.
Per cert, si orquestreu , registres i iteracions en un equip, un assistent de panell lateral com Sider.AI us pot ajudar a redactar, provar i perfeccionar juntament amb els vostres documents i codi, mantenint el context visible a mesura que itereu en les vostres habilitats i procediments robòtics. Secció A: planificació i fonamentació (fonaments)
- Pla de tasca (objectiu → restriccions → pla → comprovacions)
-
"Estàs controlant un manipulador mòbil.
Objectiu: {GOAL}.
Entorn: {DESCRIPTION}; objectes coneguts: {OBJECT_LIST}.
Restriccions: {CONSTRAINTS}.
Sortida: 1) Suposicions per verificar, 2) Pla ordenat amb passos de percepció/acció, 3) Comprovacions de seguretat per pas, 4) Comportaments de recuperació, 5) Condicions de finalització i mètriques d'èxit."
- Utilitzeu quan: convertiu un objectiu d'alt nivell en un pla operatiu amb mesures de seguretat.
- Pla de percepció primer amb quantificació de la incertesa
-
"Abans d'actuar, creeu un model d'observació. Identifiqueu les observacions necessàries, els llindars de confiança i els casos límit per a {GOAL}. Sortida JSON:
{ observations:. Per a patrons de i agents més amplis, la guia de cuina de Gemini de Google i les guies d'agents són referències útils.
Exemple: d'extrem a extrem per a una tasca de cuina
Objectiu: preparar una amanida senzilla i empaquetar-la per emportar.
"Estàs controlant un manipulador mòbil de 7 graus de llibertat amb una pinça paral·lela i un canviador d'eines.
Objectiu: preparar i empaquetar una amanida amb enciam, tomàquet, cogombre i amaniment.
Entorn: illa de cuina amb aigüera, taula de tallar, ganivet de cuiner, bol d'amanida, recipient per dinar. Pot haver-hi humans presents.
Restriccions: cap fulla a menys de 0,5 m dels humans. La vora del ganivet sempre enfundada tret que estigui tallant. Força de la pinça ≤ 15 N. Gruix de la llesca 3–4 mm. Superfícies desinfectades.
Sortida:
- Suposicions per verificar (eines, ingredients, il·luminació),
- Pla en fases (rentar → preparar → tallar → muntar → empaquetar),
- Comprovacions de seguretat per pas (visió/força),
- Recuperació d'errors (tornar a agafar, tornar a localitzar, tornar a netejar),
- Mètriques d'èxit (confirmació visual de llesques uniformes; recipient segellat; àrea neta),
- Esquema de registre i fotos abans/després."
Què obtindreu: un procediment d'horitzó llarg i conscient de la seguretat amb portes de percepció, regles de maneig d'eines i criteris d'èxit clars.
Reflexions finals
Els bons de robòtica es llegeixen com llistes de verificació de l'aviació: objectius clars, portes mesurables i fugides planificades. Utilitzeu aquestes 25 plantilles com a blocs de construcció i, a continuació, perfeccioneu-les amb registres d'execucions reals. A mesura que Gemini Robotics 1.5 i ER 1.5 continuen portant la planificació d'agents al món físic, els vostres són la diferència entre una bona demostració i operacions diàries fiables.
Preguntes freqüents
P1: Per a què s'utilitza Gemini Robotics 1.5 / ER 1.5?
Són models de raonament encarnats que permeten als robots percebre, planificar i actuar en tasques complexes de diversos passos al món físic, com ara recollir articles, preparar aliments o operacions d'instal·lacions. Emfatitzen la fonamentació, la seguretat i la planificació adaptativa.
P2: Com escric per a tasques robòtiques de diversos passos?
Indiqueu l'objectiu, l'entorn i les restriccions. Demaneu suposicions per verificar, comprovacions de seguretat, comportaments de recuperació i mètriques d'èxit. Deixeu que el model planifiqui els passos mentre apliqueu polítiques i llindars.
P3: Aquests poden gestionar la incertesa i els errors?
Sí. Incloeu llindars de confiança, signatures d'error i branques de reserva. El disseny de màquines d'estat amb camins nominals, de baixa confiança i de fallada millora la fiabilitat en entorns no estructurats.
P4: He d'especificar trajectòries exactes?
Normalment no. Proporcioneu objectius d'alt nivell, restriccions clares (força, folgança, velocitat) i portes de verificació. El model pot generar trajectòries coherents amb aquestes restriccions.
P5: On puc trobar documents i exemples oficials?
Veu les pàgines de Gemini Robotics de Google DeepMind i la visió general per a desenvolupadors per a ER 1.5, a més de la guia de cuina de Gemini i les guies d'agents per a i patrons d'agents més amplis.