What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

ایجاد وظایف رباتیک چند مرحله‌ای با اطمینان

اگر بتوانید یک وظیفه را به وضوح شرح دهید، احتمالاً ربات شما می‌تواند آن را انجام دهد. این وعده Gemini Robotics 1.5 و ER 1.5 است—مدل‌هایی که برای استدلال تجسم یافته و مبتنی بر واقعیت ساخته شده‌اند و قصد سطح بالا را به برنامه‌های عملیاتی چند مرحله‌ای و قابل اعتماد در دنیای فیزیکی تبدیل می‌کنند. در زیر 25 قالب اعلانی اثبات شده—سازماندهی شده بر اساس هدف—آورده شده است که به شما کمک می‌کند گردش‌های کاری چند مرحله‌ای و قوی برای رباتیک دنیای واقعی ایجاد کنید.

نکته سبکی: عملی و راه حل محور. هر الگو شامل ساختار، محافظت‌های توصیه شده و متغیرهای اختیاری است. مکان نگهدارها مانند {OBJECT}، {LOCATION}، {POLICY} و {CONSTRAINTS} را با متن خود جایگزین کنید.

نحوه استفاده از این الگوها

با یک هدف سطح بالا شروع کنید، سپس مراحل را با بررسی‌های حسگر و رفتار بازیابی شمارش کنید.

محدودیت‌ها را وارد کنید: ایمنی، سرعت/دقت، فرضیات محیطی و استراتژی‌های بازگشت.

کانال‌های بازخورد وضعیت را ارائه دهید (به عنوان مثال، معیارهای موفقیت دید، آستانه‌های نیرو/گشتاور).

اهداف اعلانی را بر مدیریت جزء به جزء گام به گام شکننده ترجیح دهید؛ اجازه دهید مدل برنامه ریزی و سازگاری داشته باشد.

به هر حال، اگر اعلان‌ها، گزارش‌ها و تکرارها را در سراسر یک تیم هماهنگ می‌کنید، یک دستیار پنل کناری مانند Sider.AI می‌تواند به شما در پیش‌نویس، آزمایش و اصلاح اعلان‌ها در کنار اسناد و کد خود کمک کند و با تکرار مهارت‌ها و رویه‌های رباتیک خود، زمینه را قابل مشاهده نگه دارد.

بخش A — برنامه ریزی و تثبیت (مبانی)

طرح وظیفه (هدف ← محدودیت‌ها ← طرح ← بررسی‌ها)

اعلان "شما در حال کنترل یک دستکاری کننده موبایل هستید. هدف: {GOAL}. محیط: {DESCRIPTION}؛ اشیاء شناخته شده: {OBJECT_LIST}. محدودیت‌ها: {CONSTRAINTS}. خروجی: 1) فرضیات برای تأیید، 2) طرح منظم با مراحل ادراک/عمل، 3) بررسی‌های ایمنی در هر مرحله، 4) رفتارهای بازیابی، 5) شرایط خاتمه و معیارهای موفقیت."

موارد استفاده: تبدیل یک هدف سطح بالا به یک برنامه عملیاتی با محافظت‌ها.

طرح ادراک اول با تعیین کمیت عدم قطعیت

اعلان "قبل از اقدام، یک مدل مشاهده بسازید. مشاهدات مورد نیاز، آستانه‌های اطمینان و موارد حاشیه‌ای را برای {GOAL} شناسایی کنید. خروجی JSON: {observations:. For broader prompt and agent patterns, Google’s Gemini cookbook and agent guides are helpful references.

مثال: اعلان سرتاسری برای یک کار آشپزخانه

هدف: تهیه یک سالاد ساده و بسته بندی آن برای بردن.

اعلان "شما در حال کنترل یک دستکاری کننده متحرک 7 درجه آزادی با یک گیره موازی و تعویض کننده ابزار هستید. هدف: تهیه و بسته بندی سالاد با کاهو، گوجه فرنگی، خیار و سس. محیط: جزیره آشپزخانه با سینک، تخته برش، چاقوی سرآشپز، کاسه سالاد، ظرف ناهار. ممکن است انسان‌ها حضور داشته باشند. محدودیت‌ها: هیچ تیغه‌ای در فاصله 0.5 متری انسان نباشد. لبه چاقو همیشه غلاف شود مگر اینکه در حال برش باشد. نیروی گیره ≤ 15 N. ضخامت برش 3-4 میلی متر. سطوح ضد عفونی شده. خروجی:

فرضیات برای تأیید (ابزار، مواد اولیه، نورپردازی)،

برنامه در مراحل (شستشو ← آماده سازی ← برش ← مونتاژ ← بسته بندی)،

بررسی‌های ایمنی در هر مرحله (دید/نیرو)،

بازیابی خطا (تنظیم مجدد، مکان یابی مجدد، تمیز کردن مجدد)،

معیارهای موفقیت (تأیید بصری برش‌های یکنواخت؛ بسته بندی ظرف؛ تمیز بودن ناحیه)،

طرحواره گزارش و عکس قبل/بعد."

آنچه به دست خواهید آورد: یک روش آگاهانه از ایمنی و دارای افق دید طولانی با دروازه‌های ادراک، قوانین کار با ابزار و معیارهای موفقیت واضح.

نکات پایانی

اعلان‌های عالی رباتیک مانند چک لیست‌های هوانوردی خوانده می‌شوند: اهداف واضح، دروازه‌های قابل اندازه گیری و فرارهای برنامه ریزی شده. از این 25 الگو به عنوان بلوک‌های ساختمانی استفاده کنید، سپس آنها را با گزارش‌های حاصل از اجراهای واقعی اصلاح کنید. از آنجایی که Gemini Robotics 1.5 و ER 1.5 به آوردن برنامه ریزی عاملی به دنیای فیزیکی ادامه می‌دهند، اعلان‌های شما تفاوت بین یک نسخه نمایشی خوب و عملیات روزانه قابل اعتماد هستند.

سوالات متداول

س1: Gemini Robotics 1.5 / ER 1.5 برای چه مواردی استفاده می‌شود؟ آنها مدل‌های استدلال تجسم یافته‌ای هستند که به ربات‌ها اجازه می‌دهند در وظایف پیچیده و چند مرحله‌ای در دنیای فیزیکی—مانند انتخاب آیتم‌ها، تهیه غذا یا عملیات تسهیلات—درک، برنامه‌ریزی و عمل کنند. آنها بر تثبیت، ایمنی و برنامه ریزی تطبیقی تأکید دارند.

س2: چگونه اعلان‌هایی برای وظایف رباتیک چند مرحله‌ای بنویسم؟ هدف، محیط و محدودیت‌ها را بیان کنید. درخواست تأیید فرضیات، بررسی‌های ایمنی، رفتارهای بازیابی و معیارهای موفقیت کنید. اجازه دهید مدل مراحل را برنامه ریزی کند در حالی که شما سیاست‌ها و آستانه‌ها را اعمال می‌کنید.

س3: آیا این اعلان‌ها می‌توانند عدم قطعیت و خطاها را مدیریت کنند؟ بله. آستانه‌های اطمینان، امضاهای خطا و شاخه‌های بازگشتی را وارد کنید. طراحی ماشین‌های حالت با مسیرهای اسمی، کم اطمینان و شکست، قابلیت اطمینان را در تنظیمات بدون ساختار بهبود می‌بخشد.

س4: آیا باید مسیرهای دقیق را مشخص کنم؟ معمولاً خیر. اهداف سطح بالا، محدودیت‌های واضح (نیرو، ترخیص، سرعت) و دروازه‌های تأیید را ارائه دهید. مدل می‌تواند مسیرهایی را تولید کند که با آن محدودیت‌ها سازگار باشند.

س5: کجا می‌توانم اسناد و نمونه‌های رسمی را پیدا کنم؟ به صفحات Gemini Robotics گوگل دیپ‌مایند و نمای کلی توسعه‌دهنده برای ER 1.5، به علاوه کتاب آشپزی Gemini و راهنمای عامل برای اعلان و الگوهای عاملی گسترده‌تر مراجعه کنید.