Componga tareas robóticas de varios pasos con confianza
Si puede describir una tarea con claridad, es probable que su robot pueda realizarla. Esa es la promesa de Gemini Robotics 1.5 y ER 1.5: modelos construidos para un razonamiento fundamentado y encarnado que transforma la intención de alto nivel en planes de acción confiables y de varios pasos en el mundo físico. A continuación, se presentan 25 plantillas de *prompts* probadas, organizadas por intención, que le ayudarán a componer flujos de trabajo robustos y de varios pasos para la robótica del mundo real.
Nota de estilo: Práctica y orientada a la solución. Cada plantilla incluye la estructura, las protecciones recomendadas y las variables opcionales. Reemplace los marcadores de posición como {OBJECT}, {LOCATION}, {POLICY} y {CONSTRAINTS} con su contexto.
Cómo usar estas plantillas
- Comience con un objetivo de alto nivel y, a continuación, enumere los pasos con comprobaciones de sensores y comportamientos de recuperación.
- Incluya restricciones: seguridad, velocidad/precisión, supuestos del entorno y estrategias de respaldo.
- Proporcione canales de retroalimentación del estado (por ejemplo, criterios de éxito de la visión, umbrales de fuerza/par).
- Prefiera los objetivos declarativos a la microgestión paso a paso frágil; deje que el modelo planifique y se adapte.
Por cierto, si orquesta *prompts*, registros e iteraciones en un equipo, un asistente de panel lateral como Sider.AI puede ayudarle a redactar, probar y refinar *prompts* junto con sus documentos y código, manteniendo el contexto visible a medida que itera en sus habilidades y procedimientos robóticos. Sección A: Planificación y Fundamentación (Fundamentos)
- Plan de tareas (Objetivo → Restricciones → Plan → Comprobaciones)
- Prompt
"Estás controlando un manipulador móvil.
Objetivo: {GOAL}.
Entorno: {DESCRIPTION}; objetos conocidos: {OBJECT_LIST}.
Restricciones: {CONSTRAINTS}.
Salida: 1) Suposiciones para verificar, 2) Plan ordenado con pasos de percepción/acción, 3) Comprobaciones de seguridad por paso, 4) Comportamientos de recuperación, 5) Condiciones de terminación y métricas de éxito."
- Úselo cuando: Convierta un objetivo de alto nivel en un plan operativo con protecciones.
- Plan de percepción primero con cuantificación de la incertidumbre
<a0>Prompt
"Antes de actuar, construya un modelo de observación. Identifique las observaciones requeridas, los umbrales de confianza y los casos extremos para {GOAL}. Salida JSON:
{ observations:. Para *prompts* y patrones de agentes más amplios, la guía de cocina y las guías de agentes de Gemini de Google son referencias útiles.Ejemplo: *Prompt* de extremo a extremo para una tarea de cocina
Objetivo: Preparar una ensalada sencilla y empacarla para llevar.
Prompt
"Estás controlando un manipulador móvil de 7 grados de libertad con una pinza paralela y un cambiador de herramientas.
Objetivo: Preparar y empacar una ensalada con lechuga, tomate, pepino y aderezo.
Entorno: Isla de cocina con fregadero, tabla de cortar, cuchillo de chef, ensaladera, recipiente para el almuerzo. Puede haber humanos presentes.
Restricciones: No debe haber hojas a menos de 0,5 m de los humanos. El filo del cuchillo siempre debe estar enfundado, a menos que se esté cortando. Fuerza de la pinza ≤ 15 N. Grosor de la rebanada 3–4 mm. Superficies desinfectadas.
Salida:
- Suposiciones para verificar (herramientas, ingredientes, iluminación),
- Plan en fases (lavar → preparar → cortar → ensamblar → empacar),
- Comprobaciones de seguridad por paso (visión/fuerza),
- Recuperación de errores (volver a agarrar, volver a ubicar, volver a limpiar),
- Métricas de éxito (confirmación visual de rebanadas uniformes; recipiente sellado; área limpia),
- Esquema de registro y fotos de antes/después."
Lo que obtendrá: Un procedimiento de horizonte amplio y consciente de la seguridad con puertas de percepción, reglas de manejo de herramientas y criterios de éxito claros.
Reflexiones finales
Los buenos *prompts* de robótica se leen como listas de verificación de la aviación: objetivos claros, puertas medibles y escapes planificados. Utilice estas 25 plantillas como bloques de construcción y, a continuación, refínelas con los registros de las ejecuciones reales. A medida que Gemini Robotics 1.5 y ER 1.5 sigan incorporando la planificación agentic al mundo físico, sus *prompts* serán la diferencia entre una buena demostración y operaciones diarias confiables.
Preguntas frecuentes
P1: ¿Para qué se utiliza Gemini Robotics 1.5 / ER 1.5?
Son modelos de razonamiento encarnado que permiten a los robots percibir, planificar y actuar en tareas complejas de varios pasos en el mundo físico, como recoger objetos, preparar alimentos o realizar operaciones en instalaciones. Hacen hincapié en la fundamentación, la seguridad y la planificación adaptativa.
P2: ¿Cómo escribo *prompts* para tareas robóticas de varios pasos?
Indique el objetivo, el entorno y las restricciones. Solicite supuestos para verificar, comprobaciones de seguridad, comportamientos de recuperación y métricas de éxito. Deje que el modelo planifique los pasos mientras usted aplica las políticas y los umbrales.
P3: ¿Pueden estos *prompts* manejar la incertidumbre y los errores?
Sí. Incluya umbrales de confianza, firmas de error y ramas de respaldo. El diseño de máquinas de estado con rutas nominales, de baja confianza y de fallo mejora la fiabilidad en entornos no estructurados.
P4: ¿Tengo que especificar las trayectorias exactas?
Normalmente no. Proporcione objetivos de alto nivel, restricciones claras (fuerza, holgura, velocidad) y puertas de verificación. El modelo puede generar trayectorias coherentes con esas restricciones.
P5: ¿Dónde puedo encontrar documentos y ejemplos oficiales?
Consulte las páginas de Gemini Robotics de Google DeepMind y la descripción general para desarrolladores de ER 1.5, además de la guía de cocina de Gemini y las guías de agentes para *prompts* y patrones de agentes más amplios.