What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

Composeu tasques robòtiques de diversos passos amb confiança

Si podeu descriure una tasca clarament, el vostre robot probablement la podrà fer. Aquesta és la promesa de Gemini Robotics 1.5 i ER 1.5: models creats per a un raonament encarnat i fonamentat que converteixen la intenció d'alt nivell en plans d'acció fiables i de diversos passos al món físic. A continuació, hi ha 25 plantilles de provades, organitzades per intenció, que us ajuden a compondre fluxos de treball robustos i de diversos passos per a la robòtica del món real.

Nota d'estil: pràctic i orientat a la solució. Cada plantilla inclou l'estructura, les mesures de seguretat recomanades i les variables opcionals. Substituïu els marcadors de posició com {OBJECT}, {LOCATION}, {POLICY} i {CONSTRAINTS} amb el vostre context.

Com utilitzar aquestes plantilles

Comenceu amb un objectiu d'alt nivell i, a continuació, enumereu els passos amb controls de sensors i comportament de recuperació.

Incloeu restriccions: seguretat, velocitat/precisió, suposicions d'entorn i estratègies de reserva.

Proporcioneu canals de retroalimentació d'estat (per exemple, criteris d'èxit de visió, llindars de força/parell).

Preferiu objectius declaratius en lloc de microgestió pas a pas fràgil; deixeu que el model planifiqui i s'adapti.

Per cert, si orquestreu , registres i iteracions en un equip, un assistent de panell lateral com Sider.AI us pot ajudar a redactar, provar i perfeccionar juntament amb els vostres documents i codi, mantenint el context visible a mesura que itereu en les vostres habilitats i procediments robòtics.

Secció A: planificació i fonamentació (fonaments)

Pla de tasca (objectiu → restriccions → pla → comprovacions)

"Estàs controlant un manipulador mòbil. Objectiu: {GOAL}. Entorn: {DESCRIPTION}; objectes coneguts: {OBJECT_LIST}. Restriccions: {CONSTRAINTS}. Sortida: 1) Suposicions per verificar, 2) Pla ordenat amb passos de percepció/acció, 3) Comprovacions de seguretat per pas, 4) Comportaments de recuperació, 5) Condicions de finalització i mètriques d'èxit."

Utilitzeu quan: convertiu un objectiu d'alt nivell en un pla operatiu amb mesures de seguretat.

Pla de percepció primer amb quantificació de la incertesa

"Abans d'actuar, creeu un model d'observació. Identifiqueu les observacions necessàries, els llindars de confiança i els casos límit per a {GOAL}. Sortida JSON: { observations:. Per a patrons de i agents més amplis, la guia de cuina de Gemini de Google i les guies d'agents són referències útils.

Exemple: d'extrem a extrem per a una tasca de cuina

Objectiu: preparar una amanida senzilla i empaquetar-la per emportar.

"Estàs controlant un manipulador mòbil de 7 graus de llibertat amb una pinça paral·lela i un canviador d'eines. Objectiu: preparar i empaquetar una amanida amb enciam, tomàquet, cogombre i amaniment. Entorn: illa de cuina amb aigüera, taula de tallar, ganivet de cuiner, bol d'amanida, recipient per dinar. Pot haver-hi humans presents. Restriccions: cap fulla a menys de 0,5 m dels humans. La vora del ganivet sempre enfundada tret que estigui tallant. Força de la pinça ≤ 15 N. Gruix de la llesca 3–4 mm. Superfícies desinfectades. Sortida:

Suposicions per verificar (eines, ingredients, il·luminació),

Pla en fases (rentar → preparar → tallar → muntar → empaquetar),

Comprovacions de seguretat per pas (visió/força),

Recuperació d'errors (tornar a agafar, tornar a localitzar, tornar a netejar),

Mètriques d'èxit (confirmació visual de llesques uniformes; recipient segellat; àrea neta),

Esquema de registre i fotos abans/després."

Què obtindreu: un procediment d'horitzó llarg i conscient de la seguretat amb portes de percepció, regles de maneig d'eines i criteris d'èxit clars.

Reflexions finals

Els bons de robòtica es llegeixen com llistes de verificació de l'aviació: objectius clars, portes mesurables i fugides planificades. Utilitzeu aquestes 25 plantilles com a blocs de construcció i, a continuació, perfeccioneu-les amb registres d'execucions reals. A mesura que Gemini Robotics 1.5 i ER 1.5 continuen portant la planificació d'agents al món físic, els vostres són la diferència entre una bona demostració i operacions diàries fiables.

Preguntes freqüents

P1: Per a què s'utilitza Gemini Robotics 1.5 / ER 1.5? Són models de raonament encarnats que permeten als robots percebre, planificar i actuar en tasques complexes de diversos passos al món físic, com ara recollir articles, preparar aliments o operacions d'instal·lacions. Emfatitzen la fonamentació, la seguretat i la planificació adaptativa.

P2: Com escric per a tasques robòtiques de diversos passos? Indiqueu l'objectiu, l'entorn i les restriccions. Demaneu suposicions per verificar, comprovacions de seguretat, comportaments de recuperació i mètriques d'èxit. Deixeu que el model planifiqui els passos mentre apliqueu polítiques i llindars.

P3: Aquests poden gestionar la incertesa i els errors? Sí. Incloeu llindars de confiança, signatures d'error i branques de reserva. El disseny de màquines d'estat amb camins nominals, de baixa confiança i de fallada millora la fiabilitat en entorns no estructurats.

P4: He d'especificar trajectòries exactes? Normalment no. Proporcioneu objectius d'alt nivell, restriccions clares (força, folgança, velocitat) i portes de verificació. El model pot generar trajectòries coherents amb aquestes restriccions.

P5: On puc trobar documents i exemples oficials? Veu les pàgines de Gemini Robotics de Google DeepMind i la visió general per a desenvolupadors per a ER 1.5, a més de la guia de cuina de Gemini i les guies d'agents per a i patrons d'agents més amplis.