What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

Z łatwością twórz wieloetapowe zadania robotyczne

Jeśli potrafisz jasno opisać zadanie, Twój robot prawdopodobnie będzie mógł je wykonać. To obietnica Gemini Robotics 1.5 i ER 1.5 – modeli stworzonych do ugruntowanego, ucieleśnionego rozumowania, które przekształcają intencje wysokiego poziomu w niezawodne, wieloetapowe plany działania w świecie fizycznym. Poniżej znajduje się 25 sprawdzonych szablonów promptów – uporządkowanych według intencji – które pomogą Ci tworzyć solidne, wieloetapowe przepływy pracy dla robotyki w świecie rzeczywistym.

Uwaga stylistyczna: Praktyczne i zorientowane na rozwiązania. Każdy szablon zawiera strukturę, zalecane zabezpieczenia i opcjonalne zmienne. Zastąp symbole zastępcze, takie jak {OBJECT}, {LOCATION}, {POLICY} i {CONSTRAINTS}, swoim kontekstem.

Jak korzystać z tych szablonów

Zacznij od celu wysokiego poziomu, a następnie wymień kroki z kontrolami czujników i zachowaniem naprawczym.

Uwzględnij ograniczenia: bezpieczeństwo, prędkość/precyzja, założenia dotyczące środowiska i strategie awaryjne.

Zapewnij kanały informacji zwrotnej o stanie (np. kryteria sukcesu wizji, progi siły/momentu obrotowego).

Preferuj deklaratywne cele od kruchych, szczegółowych mikrozarządzeń; pozwól modelowi planować i dostosowywać się.

Nawiasem mówiąc, jeśli organizujesz prompty, logi i iteracje w zespole, asystent w panelu bocznym, taki jak Sider.AI, może pomóc Ci w tworzeniu, testowaniu i udoskonalaniu promptów wraz z dokumentami i kodem, utrzymując widoczność kontekstu podczas iteracji umiejętności i procedur robotycznych.

Sekcja A – Planowanie i ugruntowanie (Podstawy)

Plan zadania (Cel → Ograniczenia → Plan → Kontrole)

Prompt "Sterujesz mobilnym manipulatorem. Cel: {GOAL}. Środowisko: {DESCRIPTION}; znane obiekty: {OBJECT_LIST}. Ograniczenia: {CONSTRAINTS}. Wynik: 1) Założenia do zweryfikowania, 2) Uporządkowany plan z krokami percepcji/działania, 3) Kontrole bezpieczeństwa na każdym kroku, 4) Zachowania naprawcze, 5) Warunki zakończenia i metryki sukcesu."

Użyj, gdy: Konwertujesz cel wysokiego poziomu w plan operacyjny z zabezpieczeniami.

Plan zorientowany na percepcję z kwantyfikacją niepewności

Prompt "Przed podjęciem działania zbuduj model obserwacji. Zidentyfikuj wymagane obserwacje, progi ufności i przypadki brzegowe dla {GOAL}. Wyjście JSON: { observations:. W przypadku szerszych wzorców promptów i agentów pomocne są przewodniki Google’a Gemini i przewodniki po agentach.

Przykład: Kompleksowy prompt dla zadania kuchennego

Cel: Przygotuj prostą sałatkę i zapakuj ją na wynos.

Prompt "Sterujesz 7-stopniowym mobilnym manipulatorem z równoległym chwytakiem i zmieniaczem narzędzi. Cel: Przygotuj i zapakuj sałatkę z sałatą, pomidorem, ogórkiem i sosem. Środowisko: Wyspa kuchenna ze zlewem, deską do krojenia, nożem szefa kuchni, miską na sałatę, pojemnikiem na lunch. Mogą być obecni ludzie. Ograniczenia: Brak ostrzy w promieniu 0,5 m od ludzi. Krawędź noża zawsze w osłonie, chyba że kroi. Siła chwytaka ≤ 15 N. Grubość plastra 3–4 mm. Powierzchnie zdezynfekowane. Wyjście:

Założenia do zweryfikowania (narzędzia, składniki, oświetlenie),

Plan w fazach (mycie → przygotowanie → krojenie → montaż → pakowanie),

Kontrole bezpieczeństwa na każdym kroku (wizja/siła),

Naprawa błędów (ponowny chwyt, ponowne umiejscowienie, ponowne czyszczenie),

Metryki sukcesu (wizualne potwierdzenie równych plasterków; pojemnik zapieczętowany; obszar czysty),

Schemat dziennika i zdjęcia przed/po."

Co otrzymasz: Długoterminową procedurę uwzględniającą bezpieczeństwo z bramkami percepcji, zasadami obsługi narzędzi i jasnymi kryteriami sukcesu.

Przemyślenia końcowe

Świetne prompty robotyczne czyta się jak listy kontrolne z lotnictwa: jasne cele, mierzalne bramki i zaplanowane ucieczki. Użyj tych 25 szablonów jako elementów składowych, a następnie udoskonal je za pomocą logów z rzeczywistych uruchomień. Ponieważ Gemini Robotics 1.5 i ER 1.5 w dalszym ciągu wprowadzają planowanie agentowe do świata fizycznego, Twoje prompty stanowią różnicę między dobrą demonstracją a niezawodną codzienną działalnością.

FAQ

P1: Do czego służą Gemini Robotics 1.5 / ER 1.5? Są to modele rozumowania ucieleśnionego, które pozwalają robotom postrzegać, planować i działać w złożonych, wieloetapowych zadaniach w świecie fizycznym – takich jak zbieranie przedmiotów, przygotowywanie jedzenia lub operacje w obiektach. Kładą nacisk na ugruntowanie, bezpieczeństwo i adaptacyjne planowanie.

P2: Jak pisać prompty dla wieloetapowych zadań robotycznych? Określ cel, środowisko i ograniczenia. Poproś o założenia do zweryfikowania, kontrole bezpieczeństwa, zachowania naprawcze i metryki sukcesu. Pozwól modelowi planować kroki, a Ty egzekwuj zasady i progi.

P3: Czy te prompty mogą radzić sobie z niepewnością i błędami? Tak. Uwzględnij progi ufności, sygnatury błędów i gałęzie awaryjne. Projektowanie automatów stanów ze ścieżkami nominalnymi, niskiej pewności i awaryjnymi poprawia niezawodność w nieustrukturyzowanych ustawieniach.

P4: Czy muszę określać dokładne trajektorie? Zazwyczaj nie. Podaj cele wysokiego poziomu, jasne ograniczenia (siła, prześwit, prędkość) i bramki weryfikacyjne. Model może generować trajektorie zgodne z tymi ograniczeniami.

P5: Gdzie mogę znaleźć oficjalne dokumenty i przykłady? Zobacz strony Gemini Robotics Google DeepMind i przegląd dla programistów dla ER 1.5, a także przewodnik Gemini i przewodniki po agentach, aby uzyskać szersze informacje na temat promptów i wzorców agentów.

25 Szablonów Promptów dla Gemini Robotics 1.5 / ER 1.5 do Tworzenia Zadań Wieloetapowych

Z łatwością twórz wieloetapowe zadania robotyczne

Jak korzystać z tych szablonów

Sekcja A – Planowanie i ugruntowanie (Podstawy)

Przykład: Kompleksowy prompt dla zadania kuchennego

Przemyślenia końcowe

FAQ