تكوين مهام روبوتية متعددة الخطوات بثقة
إذا كان بإمكانك وصف مهمة بوضوح، فمن المحتمل أن يتمكن الروبوت الخاص بك من القيام بها. هذا هو وعد Gemini Robotics 1.5 و ER 1.5 - وهما نموذجان مصممان للاستدلال المجسد والواقعي الذي يحول النوايا عالية المستوى إلى خطط عمل موثوقة ومتعددة الخطوات في العالم المادي. فيما يلي 25 نموذج مطالبة مثبتًا - منظمًا حسب النية - يساعدك على تكوين مهام سير عمل قوية ومتعددة الخطوات للروبوتات في العالم الحقيقي.
ملاحظة حول النمط: عملية وموجهة نحو الحلول. يتضمن كل نموذج البنية والضمانات الموصى بها والمتغيرات الاختيارية. استبدل العناصر النائبة مثل {OBJECT} و {LOCATION} و {POLICY} و {CONSTRAINTS} بالسياق الخاص بك.
كيفية استخدام هذه القوالب
- ابدأ بهدف رفيع المستوى، ثم اذكر الخطوات مع فحوصات المستشعر وسلوك الاسترداد.
- قم بتضمين القيود: السلامة والسرعة/الدقة وافتراضات البيئة واستراتيجيات التراجع.
- توفير قنوات تغذية مرتدة للحالة (مثل معايير نجاح الرؤية، وعتبات القوة/العزم).
- فضل الأهداف التصريحية على الإدارة التفصيلية الهشة خطوة بخطوة؛ دع النموذج يخطط ويتكيف.
بالمناسبة، إذا كنت تدير المطالبات والسجلات والتكرارات عبر فريق، فيمكن لمساعد اللوحة الجانبية مثل Sider.AI مساعدتك في صياغة المطالبات واختبارها وتحسينها جنبًا إلى جنب مع المستندات والتعليمات البرمجية الخاصة بك، مع إبقاء السياق مرئيًا أثناء التكرار على مهارات وإجراءات الروبوتات الخاصة بك. القسم أ - التخطيط والتأسيس (الأسس)
- مخطط المهمة (الهدف ← القيود ← الخطة ← الفحوصات)
- مطالبة
"أنت تتحكم في معالج متنقل.
الهدف: {GOAL}.
البيئة: {DESCRIPTION}؛ الكائنات المعروفة: {OBJECT_LIST}.
القيود: {CONSTRAINTS}.
الإخراج: 1) الافتراضات المراد التحقق منها، 2) خطة مرتبة مع خطوات الإدراك/العمل، 3) فحوصات السلامة لكل خطوة، 4) سلوكيات الاسترداد، 5) شروط الإنهاء ومقاييس النجاح."
- يستخدم عندما: تحويل هدف رفيع المستوى إلى خطة تشغيلية مع ضمانات.
- خطة الإدراك أولاً مع تحديد كمية عدم اليقين
- مطالبة
"قبل التصرف، قم ببناء نموذج مراقبة. حدد الملاحظات المطلوبة وعتبات الثقة والحالات الطرفية لـ {GOAL}. إخراج JSON:
{ observations:. للحصول على مطالبات وأنماط وكيل أوسع، تعد أدلة الطبخ والوكيل الخاصة بـ Google's Gemini مراجع مفيدة.
مثال: مطالبة شاملة لمهمة مطبخ
الهدف: تحضير سلطة بسيطة وتعبئتها لتناولها في الخارج.
مطالبة
"أنت تتحكم في معالج متنقل بـ 7 درجات من الحرية مع ماسك متوازي ومغير للأدوات.
الهدف: تحضير وتعبئة سلطة بالخس والطماطم والخيار والتتبيلة.
البيئة: جزيرة مطبخ بها حوض ومفرمة وسكين طاهٍ ووعاء سلطة وحاوية غداء. قد يكون البشر حاضرين.
القيود: لا توجد شفرات على بعد 0.5 متر من البشر. حافة السكين مغطاة دائمًا إلا عند القطع. قوة الماسك ≤ 15 نيوتن. سمك الشريحة 3-4 مم. الأسطح معقمة.
الإخراج:
- الافتراضات المراد التحقق منها (الأدوات والمكونات والإضاءة)،
- خطة على مراحل (غسل ← تحضير ← تقطيع ← تجميع ← تعبئة)،
- فحوصات السلامة لكل خطوة (الرؤية/القوة)،
- استعادة الأخطاء (إعادة الإمساك، إعادة التحديد، إعادة التنظيف)،
- مقاييس النجاح (تأكيد مرئي للشرائح المتساوية؛ الحاوية محكمة الغلق؛ المنطقة نظيفة)،
- مخطط السجل والصور قبل/بعد."
ما ستحصل عليه: إجراء طويل الأجل واعي بالسلامة مع بوابات إدراك وقواعد معالجة الأدوات ومعايير نجاح واضحة.
خواطر ختامية
تُقرأ مطالبات الروبوتات الرائعة مثل قوائم المراجعة من مجال الطيران: أهداف واضحة وبوابات قابلة للقياس ومخارج مخططة. استخدم هذه القوالب الـ 25 ككتل بناء، ثم قم بتحسينها بسجلات من عمليات التشغيل الحقيقية. بينما تواصل Gemini Robotics 1.5 و ER 1.5 جلب التخطيط الوكيلي إلى العالم المادي، فإن مطالباتك هي الفرق بين عرض توضيحي جيد وعمليات يومية موثوقة.
الأسئلة الشائعة
س1: ما هو استخدام Gemini Robotics 1.5 / ER 1.5؟
إنها نماذج استدلال مجسدة تتيح للروبوتات إدراك وتخطيط والتصرف عبر مهام معقدة ومتعددة الخطوات في العالم المادي - مثل التقاط العناصر أو تحضير الطعام أو عمليات المنشأة. إنها تؤكد على التأسيس والسلامة والتخطيط التكيفي.
س2: كيف أكتب مطالبات للمهام الروبوتية متعددة الخطوات؟
اذكر الهدف والبيئة والقيود. اطلب افتراضات للتحقق منها وفحوصات السلامة وسلوكيات الاسترداد ومقاييس النجاح. دع النموذج يخطط الخطوات بينما تقوم بفرض السياسات والعتبات.
س3: هل يمكن لهذه المطالبات التعامل مع عدم اليقين والأخطاء؟
نعم. قم بتضمين عتبات الثقة وتوقيعات الأخطاء وفروع التراجع. يؤدي تصميم آلات الحالة بمسارات اسمية ومنخفضة الثقة وفاشلة إلى تحسين الموثوقية في الإعدادات غير المنظمة.
س4: هل أحتاج إلى تحديد مسارات دقيقة؟
عادة لا. قم بتوفير أهداف عالية المستوى وقيود واضحة (القوة والتباعد والسرعة) وبوابات التحقق. يمكن للنموذج إنشاء مسارات متوافقة مع هذه القيود.
س5: أين يمكنني العثور على المستندات والأمثلة الرسمية؟
راجع صفحات Gemini Robotics الخاصة بـ Google DeepMind ونظرة عامة على المطورين لـ ER 1.5، بالإضافة إلى دليل الطبخ والوكيل الخاص بـ Gemini للحصول على مطالبات وأنماط وكيل أوسع.