Sestavite večstopenjske robotske naloge z zaupanjem
Če lahko jasno opišete nalogo, jo bo vaš robot verjetno lahko opravil. To je obljuba modelov Gemini Robotics 1.5 in ER 1.5 – modelov, zasnovanih za utemeljeno, utelešeno sklepanje, ki pretvarjajo namen na visoki ravni v zanesljive, večstopenjske akcijske načrte v fizičnem svetu. Spodaj je 25 preizkušenih predlog za pozive – organiziranih po namenu – ki vam pomagajo sestaviti robustne, večstopenjske poteke dela za robotiko v resničnem svetu.
Slogovna opomba: Praktično in usmerjeno v rešitve. Vsaka predloga vključuje strukturo, priporočene varovalke in izbirne spremenljivke. Zamenjajte označbe mesta, kot so {OBJECT}, {LOCATION}, {POLICY} in {CONSTRAINTS}, z vašim kontekstom.
Kako uporabljati te predloge
- Začnite s ciljem na visoki ravni, nato pa naštejte korake s preverjanji senzorjev in vedenjem za obnovitev.
- Vključite omejitve: varnost, hitrost/natančnost, predpostavke o okolju in strategije za preklop.
- Zagotovite kanale za povratne informacije o stanju (npr. merila za uspeh vida, pragovi sile/navora).
- Dajte prednost deklarativnim ciljem pred krhkim mikro-upravljanjem po korakih; prepustite modelu načrtovanje in prilagajanje.
Mimogrede, če orkestrirate pozive, dnevnike in ponovitve v celotni ekipi, vam lahko pomočnik na stranski plošči, kot je Sider.AI, pomaga pri pripravi, testiranju in izpopolnjevanju pozivov skupaj z vašo dokumentacijo in kodo, pri čemer je kontekst viden, ko ponavljate svoje robotske spretnosti in postopke. Oddelek A – Načrtovanje in utemeljevanje (temelji)
- Načrt naloge (Cilj → Omejitve → Načrt → Preverjanja)
- Poziv
"Nadzorujete mobilnega manipulatorja.
Cilj: {GOAL}.
Okolje: {DESCRIPTION}; znani predmeti: {OBJECT_LIST}.
Omejitve: {CONSTRAINTS}.
Izhod: 1) Predpostavke za preverjanje, 2) Urejen načrt s koraki zaznavanja/delovanja, 3) Varnostni pregledi na korak, 4) Vedenja za obnovitev, 5) Pogoji za prenehanje in metrike uspeha."
- Uporabite, ko: Pretvarjate cilj na visoki ravni v operativni načrt z varovalkami.
- Načrt najprej z zaznavanjem z ugotavljanjem negotovosti
- Poziv
"Preden ukrepate, zgradite model opazovanja. Določite potrebna opazovanja, pragove zaupanja in robne primere za {GOAL}. Izhod JSON:
{ observations:. Za širše vzorce pozivov in agentov so Googlova kuharska knjiga Gemini in vodniki za agente koristne reference.
Primer: celovit poziv za kuhinjsko nalogo
Cilj: Pripravite preprosto solato in jo zapakirajte za s seboj.
Poziv
"Nadzorujete 7-DOF mobilnega manipulatorja s paralelnim prijemalom in izmenjevalnikom orodja.
Cilj: Pripravite in zapakirajte solato s solato, paradižnikom, kumaro in prelivom.
Okolje: Kuhinjski otok s pomivalnim koritom, desko za rezanje, kuharskim nožem, posodo za solato, posodo za kosilo. Ljudje so lahko prisotni.
Omejitve: Brez rezil znotraj 0,5 m od ljudi. Rezilo noža je vedno v nožnici, razen pri rezanju. Sila prijemala ≤ 15 N. Debelina rezine 3–4 mm. Površine so razkužene.
Izhod:
- Predpostavke za preverjanje (orodja, sestavine, osvetlitev),
- Načrt v fazah (pranje → priprava → rezanje → sestavljanje → pakiranje),
- Varnostni pregledi na korak (vid/sila),
- Obnovitev po napaki (ponovno prijemljanje, ponovna lokacija, ponovno čiščenje),
- Metrike uspeha (vizualna potrditev enakomernih rezin; posoda zaprta; območje čisto),
- Shema dnevnika in fotografije pred/po."
Kaj boste dobili: Dolgoročni postopek, ki se zaveda varnosti, z vrati za zaznavanje, pravili za ravnanje z orodji in jasnimi merili za uspeh.
Zaključne misli
Odlični robotski pozivi se berejo kot kontrolni seznami iz letalstva: jasni cilji, merljiva vrata in načrtovani izhodi. Uporabite teh 25 predlog kot gradnike, nato pa jih izpopolnite z dnevniki iz dejanskih izvajanj. Ker Gemini Robotics 1.5 in ER 1.5 še naprej vnašata agensko načrtovanje v fizični svet, so vaši pozivi tista razlika med dobrim demo in zanesljivim vsakodnevnim delovanjem.
Pogosta vprašanja
V1: Za kaj se uporablja Gemini Robotics 1.5 / ER 1.5?
So modeli utelešenega sklepanja, ki robotom omogočajo zaznavanje, načrtovanje in delovanje v kompleksnih, večstopenjskih nalogah v fizičnem svetu – kot so pobiranje predmetov, priprava hrane ali upravljanje objektov. Poudarjajo utemeljevanje, varnost in prilagodljivo načrtovanje.
V2: Kako napišem pozive za večstopenjske robotske naloge?
Navedite cilj, okolje in omejitve. Prosite za predpostavke za preverjanje, varnostne preglede, vedenja za obnovitev in metrike uspeha. Naj model načrtuje korake, medtem ko vi uveljavljate politike in pragove.
V3: Ali lahko ti pozivi obravnavajo negotovost in napake?
Da. Vključite pragove zaupanja, podpise napak in nadomestne veje. Oblikovanje avtomatov stanja z nominalnimi potmi, potmi z nizkim zaupanjem in potmi neuspeha izboljšuje zanesljivost v nestrukturiranih okoljih.
V4: Ali moram določiti natančne trajektorije?
Ponavadi ne. Zagotovite cilje na visoki ravni, jasne omejitve (sila, razdalja, hitrost) in verifikacijska vrata. Model lahko ustvari trajektorije, ki so skladne s temi omejitvami.
V5: Kje lahko najdem uradno dokumentacijo in primere?
Oglejte si strani Google DeepMind's Gemini Robotics in pregled za razvijalce za ER 1.5, plus kuharsko knjigo Gemini in vodnike za agente za širše pozive in vzorce agentov.