What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

Sestavite večstopenjske robotske naloge z zaupanjem

Če lahko jasno opišete nalogo, jo bo vaš robot verjetno lahko opravil. To je obljuba modelov Gemini Robotics 1.5 in ER 1.5 – modelov, zasnovanih za utemeljeno, utelešeno sklepanje, ki pretvarjajo namen na visoki ravni v zanesljive, večstopenjske akcijske načrte v fizičnem svetu. Spodaj je 25 preizkušenih predlog za pozive – organiziranih po namenu – ki vam pomagajo sestaviti robustne, večstopenjske poteke dela za robotiko v resničnem svetu.

Slogovna opomba: Praktično in usmerjeno v rešitve. Vsaka predloga vključuje strukturo, priporočene varovalke in izbirne spremenljivke. Zamenjajte označbe mesta, kot so {OBJECT}, {LOCATION}, {POLICY} in {CONSTRAINTS}, z vašim kontekstom.

Kako uporabljati te predloge

Začnite s ciljem na visoki ravni, nato pa naštejte korake s preverjanji senzorjev in vedenjem za obnovitev.

Vključite omejitve: varnost, hitrost/natančnost, predpostavke o okolju in strategije za preklop.

Zagotovite kanale za povratne informacije o stanju (npr. merila za uspeh vida, pragovi sile/navora).

Dajte prednost deklarativnim ciljem pred krhkim mikro-upravljanjem po korakih; prepustite modelu načrtovanje in prilagajanje.

Mimogrede, če orkestrirate pozive, dnevnike in ponovitve v celotni ekipi, vam lahko pomočnik na stranski plošči, kot je Sider.AI, pomaga pri pripravi, testiranju in izpopolnjevanju pozivov skupaj z vašo dokumentacijo in kodo, pri čemer je kontekst viden, ko ponavljate svoje robotske spretnosti in postopke.

Oddelek A – Načrtovanje in utemeljevanje (temelji)

Načrt naloge (Cilj → Omejitve → Načrt → Preverjanja)

Poziv "Nadzorujete mobilnega manipulatorja. Cilj: {GOAL}. Okolje: {DESCRIPTION}; znani predmeti: {OBJECT_LIST}. Omejitve: {CONSTRAINTS}. Izhod: 1) Predpostavke za preverjanje, 2) Urejen načrt s koraki zaznavanja/delovanja, 3) Varnostni pregledi na korak, 4) Vedenja za obnovitev, 5) Pogoji za prenehanje in metrike uspeha."

Uporabite, ko: Pretvarjate cilj na visoki ravni v operativni načrt z varovalkami.

Načrt najprej z zaznavanjem z ugotavljanjem negotovosti

Poziv "Preden ukrepate, zgradite model opazovanja. Določite potrebna opazovanja, pragove zaupanja in robne primere za {GOAL}. Izhod JSON: { observations:. Za širše vzorce pozivov in agentov so Googlova kuharska knjiga Gemini in vodniki za agente koristne reference.

Primer: celovit poziv za kuhinjsko nalogo

Cilj: Pripravite preprosto solato in jo zapakirajte za s seboj.

Poziv "Nadzorujete 7-DOF mobilnega manipulatorja s paralelnim prijemalom in izmenjevalnikom orodja. Cilj: Pripravite in zapakirajte solato s solato, paradižnikom, kumaro in prelivom. Okolje: Kuhinjski otok s pomivalnim koritom, desko za rezanje, kuharskim nožem, posodo za solato, posodo za kosilo. Ljudje so lahko prisotni. Omejitve: Brez rezil znotraj 0,5 m od ljudi. Rezilo noža je vedno v nožnici, razen pri rezanju. Sila prijemala ≤ 15 N. Debelina rezine 3–4 mm. Površine so razkužene. Izhod:

Predpostavke za preverjanje (orodja, sestavine, osvetlitev),

Načrt v fazah (pranje → priprava → rezanje → sestavljanje → pakiranje),

Varnostni pregledi na korak (vid/sila),

Obnovitev po napaki (ponovno prijemljanje, ponovna lokacija, ponovno čiščenje),

Metrike uspeha (vizualna potrditev enakomernih rezin; posoda zaprta; območje čisto),

Shema dnevnika in fotografije pred/po."

Kaj boste dobili: Dolgoročni postopek, ki se zaveda varnosti, z vrati za zaznavanje, pravili za ravnanje z orodji in jasnimi merili za uspeh.

Zaključne misli

Odlični robotski pozivi se berejo kot kontrolni seznami iz letalstva: jasni cilji, merljiva vrata in načrtovani izhodi. Uporabite teh 25 predlog kot gradnike, nato pa jih izpopolnite z dnevniki iz dejanskih izvajanj. Ker Gemini Robotics 1.5 in ER 1.5 še naprej vnašata agensko načrtovanje v fizični svet, so vaši pozivi tista razlika med dobrim demo in zanesljivim vsakodnevnim delovanjem.

Pogosta vprašanja

V1: Za kaj se uporablja Gemini Robotics 1.5 / ER 1.5? So modeli utelešenega sklepanja, ki robotom omogočajo zaznavanje, načrtovanje in delovanje v kompleksnih, večstopenjskih nalogah v fizičnem svetu – kot so pobiranje predmetov, priprava hrane ali upravljanje objektov. Poudarjajo utemeljevanje, varnost in prilagodljivo načrtovanje.

V2: Kako napišem pozive za večstopenjske robotske naloge? Navedite cilj, okolje in omejitve. Prosite za predpostavke za preverjanje, varnostne preglede, vedenja za obnovitev in metrike uspeha. Naj model načrtuje korake, medtem ko vi uveljavljate politike in pragove.

V3: Ali lahko ti pozivi obravnavajo negotovost in napake? Da. Vključite pragove zaupanja, podpise napak in nadomestne veje. Oblikovanje avtomatov stanja z nominalnimi potmi, potmi z nizkim zaupanjem in potmi neuspeha izboljšuje zanesljivost v nestrukturiranih okoljih.

V4: Ali moram določiti natančne trajektorije? Ponavadi ne. Zagotovite cilje na visoki ravni, jasne omejitve (sila, razdalja, hitrost) in verifikacijska vrata. Model lahko ustvari trajektorije, ki so skladne s temi omejitvami.

V5: Kje lahko najdem uradno dokumentacijo in primere? Oglejte si strani Google DeepMind's Gemini Robotics in pregled za razvijalce za ER 1.5, plus kuharsko knjigo Gemini in vodnike za agente za širše pozive in vzorce agentov.