Sestavujte s jistotou víceúrovňové robotické úlohy
Pokud dokážete jasně popsat úlohu, váš robot ji pravděpodobně zvládne. To je slib modelů Gemini Robotics 1.5 a ER 1.5 – modelů vytvořených pro uzemněné, vtělené uvažování, které transformují záměr vysoké úrovně na spolehlivé, víceúrovňové akční plány ve fyzickém světě. Níže je uvedeno 25 osvědčených šablon promptů – uspořádaných podle záměru – které vám pomohou sestavit robustní, víceúrovňové pracovní postupy pro robotiku v reálném světě.
Styl: Praktický a orientovaný na řešení. Každá šablona zahrnuje strukturu, doporučené ochranné prvky a volitelné proměnné. Nahraďte zástupné symboly jako {OBJECT}, {LOCATION}, {POLICY} a {CONSTRAINTS} vaším kontextem.
Jak používat tyto šablony
- Začněte s cílem na vysoké úrovni a poté vyjmenujte kroky s kontrolami senzorů a chováním při obnově.
- Zahrňte omezení: bezpečnost, rychlost/přesnost, předpoklady prostředí a záložní strategie.
- Zajistěte kanály zpětné vazby o stavu (např. kritéria úspěchu vidění, prahové hodnoty síly/točivého momentu).
- Preferujte deklarativní cíle před křehkým mikromanagementem krok za krokem; nechte model plánovat a přizpůsobovat se.
Mimochodem, pokud organizujete prompty, protokoly a iterace napříč týmem, asistent v bočním panelu, jako je Sider.AI, vám může pomoci navrhovat, testovat a vylepšovat prompty vedle vašich dokumentů a kódu, přičemž kontext zůstává viditelný, jak iterujete na svých robotických dovednostech a postupech. Sekce A – Plánování a uzemnění (základy)
- Nákres úlohy (Cíl → Omezení → Plán → Kontroly)
- Prompt
"Řídíte mobilního manipulátora.
Cíl: {GOAL}.
Prostředí: {DESCRIPTION}; známé objekty: {OBJECT_LIST}.
Omezení: {CONSTRAINTS}.
Výstup: 1) Předpoklady k ověření, 2) Uspořádaný plán s kroky vnímání/akce, 3) Bezpečnostní kontroly pro každý krok, 4) Chování při obnově, 5) Podmínky ukončení a metriky úspěchu."
- Použijte, když: Převádíte cíl vysoké úrovně na provozní plán s ochrannými prvky.
- Plán upřednostňující vnímání s kvantifikací nejistoty
- Prompt
"Před provedením akce vytvořte model pozorování. Identifikujte požadovaná pozorování, prahové hodnoty spolehlivosti a okrajové případy pro {GOAL}. Výstup JSON:
{ observations:. Pro širší vzory promptů a agentů jsou užitečné reference Google’s Gemini cookbook a agent guides.
Příklad: Kompletní prompt pro kuchyňskou úlohu
Cíl: Připravte jednoduchý salát a zabalte ho s sebou.
Prompt
"Řídíte 7stupňového mobilního manipulátora s paralelním chapadlem a měničem nástrojů.
Cíl: Připravte a zabalte salát s hlávkovým salátem, rajčaty, okurkou a dresinkem.
Prostředí: Kuchyňský ostrůvek s dřezem, prkénkem, kuchařským nožem, salátovou mísou, obědovou krabičkou. Mohou být přítomni lidé.
Omezení: Žádné čepele do 0,5 m od lidí. Ostří nože je vždy v pouzdře, pokud se neřeže. Síla chapadla ≤ 15 N. Tloušťka plátku 3–4 mm. Povrchy dezinfikované.
Výstup:
- Předpoklady k ověření (nástroje, ingredience, osvětlení),
- Plán ve fázích (umytí → příprava → řezání → sestavení → balení),
- Bezpečnostní kontroly v každém kroku (zrak/síla),
- Obnova chyb (opětovné uchopení, opětovné umístění, opětovné vyčištění),
- Metriky úspěchu (vizuální potvrzení rovnoměrných plátků; nádoba utěsněná; oblast čistá),
- Schéma protokolu a fotografie před/po."
Co získáte: Dlouhodobý postup se znalostí bezpečnosti s vizuálními branami, pravidly pro manipulaci s nástroji a jasnými kritérii úspěchu.
Závěrečné myšlenky
Skvělé robotické prompty se čtou jako kontrolní seznamy z letectví: jasné cíle, měřitelné brány a plánované úniky. Použijte těchto 25 šablon jako stavební bloky a poté je vylepšete pomocí protokolů ze skutečných běhů. Protože Gemini Robotics 1.5 a ER 1.5 pokračují v přinášení agentického plánování do fyzického světa, vaše prompty jsou rozdílem mezi dobrou ukázkou a spolehlivými každodenními operacemi.
FAQ
Q1:K čemu se používají Gemini Robotics 1.5 / ER 1.5?
Jsou to modely vtěleného uvažování, které umožňují robotům vnímat, plánovat a jednat v rámci složitých, víceúrovňových úloh ve fyzickém světě – jako je vybírání položek, příprava jídla nebo provoz zařízení. Zdůrazňují uzemnění, bezpečnost a adaptivní plánování.
Q2:Jak píšu prompty pro víceúrovňové robotické úlohy?
Uveďte cíl, prostředí a omezení. Požádejte o předpoklady k ověření, bezpečnostní kontroly, chování při obnově a metriky úspěchu. Nechte model plánovat kroky, zatímco vy prosazujete zásady a prahové hodnoty.
Q3:Dokážou tyto prompty zvládnout nejistotu a chyby?
Ano. Zahrňte prahové hodnoty spolehlivosti, podpisy chyb a záložní větve. Návrh stavových automatů s nominálními, málo spolehlivými a chybovými cestami zlepšuje spolehlivost v nestrukturovaných nastaveních.
Q4:Musím zadávat přesné trajektorie?
Obvykle ne. Poskytněte cíle na vysoké úrovni, jasná omezení (síla, vůle, rychlost) a ověřovací brány. Model může generovat trajektorie, které jsou v souladu s těmito omezeními.
Q5:Kde najdu oficiální dokumenty a příklady?
Viz stránky Google DeepMind’s Gemini Robotics a přehled pro vývojáře pro ER 1.5 a také Gemini cookbook a agent guides pro širší prompty a vzory agentů.