What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

Создавайте многоэтапные роботизированные задачи с уверенностью

Если вы можете четко описать задачу, ваш робот, скорее всего, сможет ее выполнить. Это обещание Gemini Robotics 1.5 и ER 1.5 — моделей, созданных для обоснованного, воплощенного рассуждения, которые преобразуют намерения высокого уровня в надежные, многоэтапные планы действий в физическом мире. Ниже представлены 25 проверенных шаблонов подсказок, сгруппированных по намерениям, которые помогут вам создать надежные многоэтапные рабочие процессы для реальной робототехники.

Примечание о стиле: Практичный и ориентированный на решения. Каждый шаблон включает в себя структуру, рекомендуемые защитные ограждения и необязательные переменные. Замените заполнители, такие как {OBJECT}, {LOCATION}, {POLICY} и {CONSTRAINTS}, своим контекстом.

Как использовать эти шаблоны

Начните с цели высокого уровня, затем перечислите шаги с проверками датчиков и поведением восстановления.

Включите ограничения: безопасность, скорость/точность, предположения об окружающей среде и стратегии отката.

Предоставьте каналы обратной связи о состоянии (например, критерии успеха визуализации, пороговые значения силы/крутящего момента).

Предпочитайте декларативные цели жесткому пошаговому микроуправлению; позвольте модели планировать и адаптироваться.

Кстати, если вы организуете подсказки, журналы и итерации в команде, боковая панель помощника, такая как Sider.AI, может помочь вам разрабатывать, тестировать и совершенствовать подсказки вместе с вашими документами и кодом, сохраняя контекст видимым по мере итерации ваших роботизированных навыков и процедур.

Раздел A — Планирование и обоснование (основы)

План задачи (Цель → Ограничения → План → Проверки)

Подсказка "Вы управляете мобильным манипулятором. Цель: {GOAL}. Окружение: {DESCRIPTION}; известные объекты: {OBJECT_LIST}. Ограничения: {CONSTRAINTS}. Вывод: 1) Предположения для проверки, 2) Упорядоченный план с шагами восприятия/действия, 3) Проверки безопасности на каждом шагу, 4) Поведение восстановления, 5) Условия прекращения и показатели успеха."

Использовать когда: Преобразование цели высокого уровня в оперативный план с защитными ограждениями.

План, ориентированный на восприятие, с количественной оценкой неопределенности

Подсказка "Перед тем, как действовать, постройте модель наблюдения. Определите необходимые наблюдения, пороговые значения достоверности и крайние случаи для {GOAL}. Выведите JSON: { observations:. Для получения более широких подсказок и шаблонов агентов полезны справочники и руководства по агентам Google Gemini.

Пример: Комплексная подсказка для кухонной задачи

Цель: Приготовить простой салат и упаковать его с собой.

Подсказка "Вы управляете 7-DOF мобильным манипулятором с параллельным захватом и устройством смены инструментов. Цель: Приготовить и упаковать салат с салатом-латуком, помидором, огурцом и заправкой. Окружение: Кухонный остров с раковиной, разделочной доской, кухонным ножом, миской для салата, контейнером для обеда. Могут присутствовать люди. Ограничения: Нет лезвий в пределах 0,5 м от людей. Лезвие ножа всегда в ножнах, если не режет. Усилие захвата ≤ 15 Н. Толщина ломтика 3–4 мм. Поверхности продезинфицированы. Вывод:

Предположения для проверки (инструменты, ингредиенты, освещение),

План по фазам (мытье → подготовка → нарезка → сборка → упаковка),

Проверки безопасности на каждом шагу (зрение/сила),

Восстановление после ошибок (повторный захват, повторное перемещение, повторная очистка),

Показатели успеха (визуальное подтверждение ровных ломтиков; контейнер запечатан; область чистая),

Схема журнала и фотографии до/после."

Что вы получите: Долгосрочную процедуру, учитывающую безопасность, с воротами восприятия, правилами обращения с инструментами и четкими критериями успеха.

Заключительные мысли

Отличные подсказки для робототехники читаются как контрольные списки из авиации: четкие цели, измеримые ворота и запланированные выходы. Используйте эти 25 шаблонов в качестве строительных блоков, а затем уточните их с помощью журналов из реальных запусков. Поскольку Gemini Robotics 1.5 и ER 1.5 продолжают внедрять агентское планирование в физический мир, ваши подсказки — это разница между хорошей демонстрацией и надежными повседневными операциями.

Часто задаваемые вопросы

Q1:Для чего используется Gemini Robotics 1.5 / ER 1.5? Это модели воплощенного рассуждения, которые позволяют роботам воспринимать, планировать и действовать в сложных, многоэтапных задачах в физическом мире, таких как выбор предметов, приготовление пищи или эксплуатация объектов. Они подчеркивают обоснование, безопасность и адаптивное планирование.

Q2:Как писать подсказки для многоэтапных роботизированных задач? Укажите цель, среду и ограничения. Запросите предположения для проверки, проверки безопасности, поведение восстановления и показатели успеха. Позвольте модели планировать шаги, а вы обеспечивайте соблюдение политик и пороговых значений.

Q3:Могут ли эти подсказки справиться с неопределенностью и ошибками? Да. Включите пороговые значения достоверности, сигнатуры ошибок и резервные ветви. Разработка конечных автоматов с номинальными путями, путями с низкой достоверностью и путями сбоя повышает надежность в неструктурированных условиях.

Q4:Нужно ли мне указывать точные траектории? Обычно нет. Предоставьте цели высокого уровня, четкие ограничения (сила, зазор, скорость) и ворота проверки. Модель может генерировать траектории, соответствующие этим ограничениям.

Q5:Где я могу найти официальные документы и примеры? См. страницы Google DeepMind Gemini Robotics и обзор разработчика для ER 1.5, а также справочник Gemini и руководства по агентам для более широких подсказок и шаблонов агентов.