Magabiztosan állítson össze többlépéses robotfeladatokat
Ha világosan le tud írni egy feladatot, a robotja valószínűleg el is tudja végezni. Ezt ígéri a Gemini Robotics 1.5 és az ER 1.5 – olyan modellek, amelyek a megalapozott, megtestesült következtetésre épülnek, és amelyek a magas szintű szándékot megbízható, többlépéses akciótervekké alakítják a fizikai világban. Az alábbiakban 25 bevált prompt sablon található – szándék szerint rendezve –, amelyek segítenek robusztus, többlépéses munkafolyamatok összeállításában a valós robotika számára.
Stílusjegyzet: Praktikus és megoldásorientált. Minden sablon tartalmazza a szerkezetet, az ajánlott védőkorlátokat és az opcionális változókat. Cserélje ki a helyőrzőket, például a {OBJECT}, {LOCATION}, {POLICY} és {CONSTRAINTS} elemeket a saját kontextusával.
Hogyan használja ezeket a sablonokat?
- Kezdje egy magas szintű céllal, majd sorolja fel a lépéseket szenzoros ellenőrzésekkel és helyreállítási viselkedéssel.
- Foglaljon bele korlátozásokat: biztonság, sebesség/pontosság, környezeti feltételezések és tartalék stratégiák.
- Biztosítson állapot-visszacsatolási csatornákat (pl. vizuális siker kritériumok, erő/nyomaték küszöbértékek).
- A törékeny, lépésről lépésre történő mikromenedzsment helyett részesítse előnyben a deklaratív célokat; hagyja, hogy a modell tervezzen és alkalmazkodjon.
Egyébként, ha egy csapatban hangolja össze a promptokat, naplókat és iterációkat, egy oldalsó panel asszisztens, mint a Sider.AI, segíthet a promptok tervezésében, tesztelésében és finomításában a dokumentumai és a kódja mellett, így az iteráció során a robotikai készségein és eljárásain a kontextus látható marad. A szakasz – Tervezés és megalapozás (alapok)
- Feladat tervrajza (Cél → Korlátozások → Terv → Ellenőrzések)
- Prompt
"Ön egy mobil manipulátort irányít.
Cél: {GOAL}.
Környezet: {DESCRIPTION}; ismert objektumok: {OBJECT_LIST}.
Korlátozások: {CONSTRAINTS}.
Kimenet: 1) Ellenőrizendő feltételezések, 2) Rendezett terv észlelési/cselekvési lépésekkel, 3) Biztonsági ellenőrzések lépésenként, 4) Helyreállítási viselkedések, 5) Megszüntetési feltételek és siker mérőszámok."
- Használja, ha: Egy magas szintű célt operatív tervvé alakít védőkorlátokkal.
- Észlelés-első terv bizonytalanság számszerűsítésével
- Prompt
"Cselekvés előtt építsen fel egy megfigyelési modellt. Azonosítsa a szükséges megfigyeléseket, a megbízhatósági küszöböket és a szélsőséges eseteket a {GOAL} érdekében. Kimeneti JSON:
{ observations:. A szélesebb körű promptokhoz és ügynöki mintákhoz a Google Gemini szakácskönyve és ügynöki útmutatói hasznos referenciák.
Példa: Végpontok közötti prompt egy konyhai feladathoz
Cél: Készítsen egy egyszerű salátát és csomagolja el.
Prompt
"Ön egy 7-DOF-os mobil manipulátort irányít párhuzamos megfogóval és szerszámváltóval.
Cél: Készítsen és csomagoljon salátát salátával, paradicsommal, uborkával és öntettel.
Környezet: Konyhasziget mosogatóval, vágódeszkával, szakácskéssel, salátástállal, uzsonnásdobozzal. Emberek lehetnek jelen.
Korlátozások: Nincsenek pengék az emberektől 0,5 méteren belül. A kés éle mindig tokban van, kivéve a vágást. Megfogó erő ≤ 15 N. Szelet vastagság 3–4 mm. Fertőtlenített felületek.
Kimenet:
- Ellenőrizendő feltételezések (szerszámok, összetevők, világítás),
- Terv fázisokban (mosás → előkészítés → vágás → összeállítás → csomagolás),
- Lépésenkénti biztonsági ellenőrzések (látás/erő),
- Hibaelhárítás (újrafogás, áthelyezés, újratisztítás),
- Siker mérőszámok (egyenletes szeletek vizuális megerősítése; lezárt tartály; tiszta terület),
- Naplózási séma és fényképek előtte/utána."
Amit kapni fog: Egy hosszú távú, biztonságtudatos eljárás észlelési kapukkal, szerszámkezelési szabályokkal és egyértelmű siker kritériumokkal.
Záró gondolatok
A nagyszerű robotikai promptok úgy olvashatók, mint a repülés ellenőrzőlistái: világos célok, mérhető kapuk és tervezett menekülések. Használja ezt a 25 sablont építőelemként, majd finomítsa őket a valós futtatások naplóival. Ahogy a Gemini Robotics 1.5 és az ER 1.5 továbbviszi az ágensi tervezést a fizikai világba, a promptjai jelentik a különbséget egy jó bemutató és a megbízható napi működés között.
GYIK
Q1:Mire használják a Gemini Robotics 1.5 / ER 1.5-öt?
Ezek olyan megtestesült következtetési modellek, amelyek lehetővé teszik a robotok számára, hogy érzékeljenek, tervezzenek és cselekedjenek összetett, többlépéses feladatokban a fizikai világban – például tárgyak kiválasztása, ételkészítés vagy létesítményi műveletek. Hangsúlyozzák a megalapozást, a biztonságot és az adaptív tervezést.
Q2:Hogyan írjak promptokat többlépéses robotfeladatokhoz?
Adja meg a célt, a környezetet és a korlátozásokat. Kérjen ellenőrizendő feltételezéseket, biztonsági ellenőrzéseket, helyreállítási viselkedéseket és siker mérőszámokat. Hagyja, hogy a modell lépéseket tervezzen, miközben Ön érvényesíti a szabályzatokat és a küszöböket.
Q3:Képesek ezek a promptok kezelni a bizonytalanságot és a hibákat?
Igen. Tartalmazzon megbízhatósági küszöböket, hibajeleket és tartalék ágakat. Az állapotsémák tervezése névleges, alacsony megbízhatóságú és hibás útvonalakkal javítja a megbízhatóságot a strukturálatlan beállításokban.
Q4:Pontos pályákat kell megadnom?
Általában nem. Adjon meg magas szintű célkitűzéseket, egyértelmű korlátozásokat (erő, távolság, sebesség) és ellenőrző kapukat. A modell képes olyan pályákat generálni, amelyek összhangban vannak ezekkel a korlátozásokkal.
Q5:Hol találok hivatalos dokumentumokat és példákat?
Lásd a Google DeepMind Gemini Robotics oldalait és az ER 1.5 fejlesztői áttekintését, valamint a Gemini szakácskönyvét és ügynöki útmutatóit a szélesebb körű promptoláshoz és ügynöki mintákhoz.