Създавайте уверено роботизирани задачи с множество стъпки
Ако можете ясно да опишете една задача, вашият робот вероятно може да я изпълни. Това е обещанието на Gemini Robotics 1.5 и ER 1.5 – модели, създадени за обосновано, въплътено разсъждение, които превръщат намерение на високо ниво в надеждни планове за действие с множество стъпки във физическия свят. По-долу са представени 25 доказани шаблона за подкани – организирани по намерение – които ви помагат да създавате стабилни работни процеси с множество стъпки за реална роботика.
Бележка за стила: Практичен и ориентиран към решения. Всеки шаблон включва структурата, препоръчаните предпазни мерки и незадължителни променливи. Заменете контейнерите като {OBJECT}, {LOCATION}, {POLICY} и {CONSTRAINTS} с вашия контекст.
Как да използвате тези шаблони
- Започнете с цел на високо ниво, след което избройте стъпките със сензорни проверки и поведение за възстановяване.
- Включете ограничения: безопасност, скорост/прецизност, предположения за околната среда и стратегии за отстъпление.
- Осигурете канали за обратна връзка за състоянието (напр. критерии за успеваемост на зрението, прагове на сила/въртящ момент).
- Предпочитайте декларативни цели пред крехко микроуправление стъпка по стъпка; оставете модела да планира и да се адаптира.
Между другото, ако организирате подкани, логове и итерации в екип, помощник в страничен панел като Sider.AI може да ви помогне да изготвяте, тествате и усъвършенствате подкани заедно с вашите документи и код, като поддържате контекста видим, докато итерирате върху вашите роботизирани умения и процедури. Раздел A — Планиране и обосновка (Основи)
- План на задачата (Цел → Ограничения → План → Проверки)
- Подкана
"Вие контролирате мобилен манипулатор.
Цел: {GOAL}.
Околна среда: {DESCRIPTION}; известни обекти: {OBJECT_LIST}.
Ограничения: {CONSTRAINTS}.
Изход: 1) Предположения за проверка, 2) Подреден план със стъпки за възприятие/действие, 3) Проверки за безопасност за всяка стъпка, 4) Поведение за възстановяване, 5) Условия за прекратяване и показатели за успех."
- Използвайте когато: Преобразуване на цел на високо ниво в оперативен план с предпазни мерки.
- План, в който възприятието е на първо място, с количествено определяне на несигурността
- Подкана
"Преди да действате, изградете модел на наблюдение. Идентифицирайте необходимите наблюдения, праговете на доверие и крайните случаи за {GOAL}. Изходен JSON:
{ observations:. За по-широки модели на подкани и агенти, готварската книга Gemini на Google и ръководствата за агенти са полезни справки.
Пример: Подкана от край до край за кухненска задача
Цел: Пригответе проста салата и я опаковайте за вкъщи.
Подкана
"Вие контролирате 7‑DOF мобилен манипулатор с паралелен захващач и инструмент за смяна на инструменти.
Цел: Пригответе и опаковайте салата с маруля, домат, краставица и дресинг.
Околна среда: Кухненски остров с мивка, дъска за рязане, готварски нож, купа за салата, контейнер за обяд. Възможно е да има хора.
Ограничения: Без остриета на разстояние 0,5 m от хора. Острието на ножа винаги е в кания, освен когато реже. Сила на захващане ≤ 15 N. Дебелина на резена 3–4 mm. Дезинфекцирани повърхности.
Изход:
- Предположения за проверка (инструменти, съставки, осветление),
- План на фази (измиване → подготовка → рязане → сглобяване → опаковане),
- Проверки за безопасност на всяка стъпка (зрение/сила),
- Възстановяване след грешка (повторно захващане, повторно намиране, повторно почистване),
- Показатели за успех (визуално потвърждение на равномерни резени; запечатан контейнер; чиста площ),
- Схема на дневника и снимки преди/след."
Какво ще получите: Дългосрочна процедура, съобразена с безопасността, с врати за възприятие, правила за работа с инструменти и ясни критерии за успех.
Заключителни мисли
Страхотните роботизирани подкани се четат като контролни списъци от авиацията: ясни цели, измерими врати и планирани бягства. Използвайте тези 25 шаблона като градивни елементи, след което ги усъвършенствайте с логове от реални изпълнения. Тъй като Gemini Robotics 1.5 и ER 1.5 продължават да внасят агентно планиране във физическия свят, вашите подкани са разликата между добра демонстрация и надеждни ежедневни операции.
ЧЗВ
В1: За какво се използва Gemini Robotics 1.5 / ER 1.5?
Те са въплътени модели за разсъждение, които позволяват на роботите да възприемат, планират и действат в сложни задачи с множество стъпки във физическия свят – като например вземане на предмети, приготвяне на храна или операции в съоръжения. Те наблягат на обосновката, безопасността и адаптивното планиране.
В2: Как да пиша подкани за роботизирани задачи с множество стъпки?
Посочете целта, околната среда и ограниченията. Поискайте предположения за проверка, проверки за безопасност, поведение за възстановяване и показатели за успех. Оставете модела да планира стъпки, докато вие прилагате политики и прагове.
В3: Могат ли тези подкани да се справят с несигурност и грешки?
Да. Включете прагове на доверие, подписи на грешки и резервни клонове. Проектирането на машини на състояния с номинални, ниско доверие и пътища за отказ подобрява надеждността в неструктурирани настройки.
В4: Трябва ли да посочвам точни траектории?
Обикновено не. Предоставете цели на високо ниво, ясни ограничения (сила, хлабина, скорост) и врати за проверка. Моделът може да генерира траектории, съвместими с тези ограничения.
В5: Къде мога да намеря официални документи и примери?
Вижте страниците Gemini Robotics на Google DeepMind и обзора за разработчици за ER 1.5, плюс готварската книга Gemini и ръководствата за агенти за по-широки модели на подкани и агенти.