What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

Bumuo ng Multi-Step Robotic Tasks nang may Kumpiyansa

Kung kaya mong ilarawan nang malinaw ang isang gawain, malamang na kaya rin itong gawin ng iyong robot. Iyan ang pangako ng Gemini Robotics 1.5 at ER 1.5—mga modelong binuo para sa grounded, embodied reasoning na ginagawang maaasahang plano ng pagkilos na multi-step sa pisikal na mundo ang high-level na layunin. Nasa ibaba ang 25 napatunayang template ng prompt—na nakaayos ayon sa layunin—na tumutulong sa iyong bumuo ng matatag at multi-step na workflow para sa robotics sa totoong mundo.

Paalala sa estilo: Praktikal at nakatuon sa solusyon. Kasama sa bawat template ang istruktura, mga inirerekomendang guardrail, at mga opsyonal na variable. Palitan ang mga placeholder tulad ng {OBJECT}, {LOCATION}, {POLICY}, at {CONSTRAINTS} ng iyong konteksto.

Paano Gamitin ang mga Template na Ito

Magsimula sa isang high-level na layunin, pagkatapos ay isa-isahin ang mga hakbang na may mga sensor check at recovery behavior.

Isama ang mga limitasyon: kaligtasan, bilis/precision, mga pagpapalagay sa kapaligiran, at mga fallback strategy.

Magbigay ng mga state feedback channel (hal., mga vision success criteria, force/torque threshold).

Mas piliin ang mga declarative na layunin kaysa sa mahinang step-by-step na micromanagement; hayaan ang model na magplano at umangkop.

Kung sakaling nag-o-orchestrate ka ng mga prompt, log, at iteration sa isang team, ang isang side panel assistant tulad ng Sider.AI ay makakatulong sa iyong mag-draft, mag-test, at mag-refine ng mga prompt kasama ng iyong mga dokumento at code, na pinapanatiling nakikita ang konteksto habang nag-i-iterate ka sa iyong robotic skills at procedures.

Seksyon A — Pagpaplano at Pagbabase (Mga Pundasyon)

Task Blueprint (Layunin → Mga Limitasyon → Plano → Mga Check)

Prompt "Kinokontrol mo ang isang mobile manipulator. Layunin: {GOAL}. Kapaligiran: {DESCRIPTION}; mga kilalang bagay: {OBJECT_LIST}. Mga Limitasyon: {CONSTRAINTS}. Output: 1) Mga pagpapalagay na dapat beripikahin, 2) Pinagsunod-sunod na plano na may mga perception/action step, 3) Mga safety check sa bawat hakbang, 4) Mga recovery behavior, 5) Mga kundisyon ng pagtatapos at mga sukatan ng tagumpay."

Gamitin kapag: Ginagawa ang isang high-level na layunin sa isang operational plan na may mga guardrail.

Perception-First Plan na may Uncertainty Quantification

Prompt "Bago kumilos, bumuo ng observation model. Tukuyin ang mga kinakailangang obserbasyon, mga confidence threshold, at mga edge case para sa {GOAL}. I-output ang JSON: { observations:. Para sa mas malawak na prompt at agent pattern, ang Google’s Gemini cookbook at agent guides ay mga kapaki-pakinabang na sanggunian.

Halimbawa: End-to-End na Prompt para sa isang Gawain sa Kusina

Layunin: Maghanda ng isang simpleng salad at i-pack ito para dalhin.

Prompt "Kinokontrol mo ang isang 7-DOF na mobile manipulator na may parallel gripper at tool-changer. Layunin: Maghanda at mag-pack ng salad na may litsugas, kamatis, pipino, at dressing. Kapaligiran: Kusina na may lababo, cutting board, chef knife, salad bowl, lunch container. Maaaring may mga tao sa paligid. Mga Limitasyon: Walang talim sa loob ng 0.5 m mula sa mga tao. Ang talim ng kutsilyo ay laging nakatago maliban kung gumugupit. Gripper force ≤ 15 N. Kapal ng hiwa 3–4 mm. Malinis ang mga surface. Output:

Mga pagpapalagay na dapat beripikahin (mga tool, sangkap, ilaw),

Plano sa mga phase (hugasan → ihanda → hiwain → pagsamahin → i-pack),

Mga per-step na safety check (vision/force),

Pagbawi sa pagkakamali (muling hawakan, muling hanapin, muling linisin),

Mga sukatan ng tagumpay (visual na kumpirmasyon ng pantay na hiwa; selyado ang container; malinis ang lugar),

Log schema at mga litrato bago/pagkatapos."

Kung ano ang makukuha mo: Isang long-horizon, safety-aware na pamamaraan na may perception gate, mga panuntunan sa paghawak ng tool, at malinaw na pamantayan ng tagumpay.

Mga Pangwakas na Kaisipan

Ang magagandang robotics prompt ay parang mga checklist mula sa aviation: malinaw na mga layunin, nasusukat na mga gate, at nakaplanong mga pagtakas. Gamitin ang 25 template na ito bilang mga building block, pagkatapos ay i-refine ang mga ito gamit ang mga log mula sa mga tunay na pagpapatakbo. Habang patuloy na dinadala ng Gemini Robotics 1.5 at ER 1.5 ang agentic planning sa pisikal na mundo, ang iyong mga prompt ang pagkakaiba sa pagitan ng isang magandang demo at maaasahang pang-araw-araw na operasyon.

FAQ

Q1:Para saan ginagamit ang Gemini Robotics 1.5 / ER 1.5? Ang mga ito ay mga embodied reasoning model na nagpapahintulot sa mga robot na makita, magplano, at kumilos sa buong kumplikado at multi-step na gawain sa pisikal na mundo—tulad ng pagpili ng mga item, paghahanda ng pagkain, o mga operasyon sa pasilidad. Binibigyang-diin nila ang grounding, kaligtasan, at adaptive planning.

Q2:Paano ako sumulat ng mga prompt para sa mga multi-step na robotic tasks? Sabihin ang layunin, kapaligiran, at mga limitasyon. Humingi ng mga pagpapalagay na dapat beripikahin, mga safety check, mga recovery behavior, at mga sukatan ng tagumpay. Hayaan ang model na magplano ng mga hakbang habang ipinapatupad mo ang mga patakaran at threshold.

Q3:Kaya bang pangasiwaan ng mga prompt na ito ang kawalan ng katiyakan at mga pagkakamali? Oo. Isama ang mga confidence threshold, mga error signature, at mga fallback branch. Ang pagdidisenyo ng mga state machine na may nominal, low-confidence, at failure paths ay nagpapabuti sa pagiging maaasahan sa mga unstructured na setting.

Q4:Kailangan ko bang tukuyin ang eksaktong mga trajectory? Karaniwan ay hindi. Magbigay ng mga high-level na layunin, malinaw na mga limitasyon (force, clearance, bilis), at mga verification gate. Ang model ay maaaring bumuo ng mga trajectory na naaayon sa mga limitasyong iyon.

Q5:Saan ako makakahanap ng mga opisyal na dokumento at halimbawa? Tingnan ang mga pahina ng Google DeepMind’s Gemini Robotics at ang developer overview para sa ER 1.5, kasama ang Gemini cookbook at agent guides para sa mas malawak na prompting at agent pattern.

25 Prompt Templates para sa Gemini Robotics 1.5 / ER 1.5 para Bumuo ng Multi-Step Tasks

Bumuo ng Multi-Step Robotic Tasks nang may Kumpiyansa

Paano Gamitin ang mga Template na Ito

Seksyon A — Pagpaplano at Pagbabase (Mga Pundasyon)

Halimbawa: End-to-End na Prompt para sa isang Gawain sa Kusina

Mga Pangwakas na Kaisipan

FAQ