What is Gemini Robotics 1.5 / ER 1.5 used for?

They are embodied reasoning models that let robots perceive, plan, and act across complex, multi‑step tasks in the physical world—like picking items, preparing food, or facility operations. They emphasize grounding, safety, and adaptive planning.

How do I write prompts for multi‑step robotic tasks?

State the goal, environment, and constraints. Ask for assumptions to verify, safety checks, recovery behaviors, and success metrics. Let the model plan steps while you enforce policies and thresholds.

Can these prompts handle uncertainty and errors?

Yes. Include confidence thresholds, error signatures, and fallback branches. Designing state machines with nominal, low‑confidence, and failure paths improves reliability in unstructured settings.

Do I need to specify exact trajectories?

Usually no. Provide high‑level objectives, clear constraints (force, clearance, speed), and verification gates. The model can generate trajectories consistent with those constraints.

Where can I find official docs and examples?

See Google DeepMind’s Gemini Robotics pages and the developer overview for ER 1.5, plus the Gemini cookbook and agent guides for broader prompting and agent patterns.

আত্মবিশ্বাসের সাথে বহু-ধাপের রোবোটিক টাস্ক তৈরি করুন

আপনি যদি কোনও টাস্ক স্পষ্টভাবে বর্ণনা করতে পারেন তবে আপনার রোবট সম্ভবত এটি করতে পারবে। এটিই হল Gemini Robotics 1.5 এবং ER 1.5-এর প্রতিশ্রুতি—এই মডেলগুলি গ্রাউন্ডেড, এমবডিয়েড যুক্তির জন্য তৈরি করা হয়েছে যা উচ্চ-স্তরের উদ্দেশ্যকে বাস্তব জগতে নির্ভরযোগ্য, বহু-ধাপের অ্যাকশন প্ল্যানে পরিণত করে। নীচে 25টি প্রমাণিত প্রম্পট টেমপ্লেট রয়েছে—উদ্দেশ্যের ভিত্তিতে সাজানো—যা আপনাকে বাস্তব-বিশ্বের রোবোটিক্সের জন্য শক্তিশালী, বহু-ধাপের ওয়ার্কফ্লো তৈরি করতে সহায়তা করে।

শৈলী নোট: ব্যবহারিক ও সমাধান-ভিত্তিক। প্রতিটি টেমপ্লেটে কাঠামো, প্রস্তাবিত গার্ডরেল এবং ঐচ্ছিক ভেরিয়েবল অন্তর্ভুক্ত রয়েছে। আপনার প্রসঙ্গ দিয়ে {OBJECT}, {LOCATION}, {POLICY}, এবং {CONSTRAINTS}-এর মতো প্লেসহোল্ডারগুলি প্রতিস্থাপন করুন।

এই টেমপ্লেটগুলি কীভাবে ব্যবহার করবেন

একটি উচ্চ-স্তরের লক্ষ্য দিয়ে শুরু করুন, তারপরে সেন্সর চেক এবং পুনরুদ্ধারের আচরণ সহ ধাপগুলি গণনা করুন।

সীমাবদ্ধতা অন্তর্ভুক্ত করুন: সুরক্ষা, গতি/যথার্থতা, পরিবেশের অনুমান এবং ফলব্যাক কৌশল।

স্টেট ফিডব্যাক চ্যানেল সরবরাহ করুন (যেমন, দৃষ্টি সাফল্যের মানদণ্ড, ফোর্স/টর্ক থ্রেশহোল্ড)।

ধাপে ধাপে মাইক্রোম্যানেজমেন্টের চেয়ে ঘোষণামূলক লক্ষ্যগুলিকে বেশি গুরুত্ব দিন; মডেলটিকে পরিকল্পনা করতে এবং মানিয়ে নিতে দিন।

incidentally, আপনি যদি কোনও দল জুড়ে প্রম্পট, লগ এবং পুনরাবৃত্তি পরিচালনা করেন, তবে Sider.AI-এর মতো একটি সাইড প্যানেল সহকারী আপনার ডক্স এবং কোডের পাশাপাশি প্রম্পটগুলি ড্রাফ্ট, পরীক্ষা এবং পরিমার্জন করতে সহায়তা করতে পারে, আপনার রোবোটিক দক্ষতা এবং পদ্ধতির উপর পুনরাবৃত্তি করার সাথে সাথে প্রসঙ্গটি দৃশ্যমান রাখতে পারে।

অধ্যায় A — পরিকল্পনা ও গ্রাউন্ডিং (ভিত্তি)

টাস্ক ব্লুপ্রিন্ট (লক্ষ্য → সীমাবদ্ধতা → পরিকল্পনা → চেক)

প্রম্পট "আপনি একটি মোবাইল ম্যানিপুলেটর নিয়ন্ত্রণ করছেন। লক্ষ্য: {GOAL}। পরিবেশ: {DESCRIPTION}; পরিচিত বস্তু: {OBJECT_LIST}। সীমাবদ্ধতা: {CONSTRAINTS}। আউটপুট: 1) যাচাই করার জন্য অনুমান, 2) উপলব্ধি/অ্যাকশন পদক্ষেপ সহ অর্ডার করা পরিকল্পনা, 3) প্রতিটি ধাপের জন্য সুরক্ষা পরীক্ষা, 4) পুনরুদ্ধারের আচরণ, 5) সমাপ্তির শর্ত এবং সাফল্যের মেট্রিক।"

কখন ব্যবহার করবেন: যখন কোনও উচ্চ-স্তরের লক্ষ্যকে গার্ডরেল সহ একটি অপারেশনাল প্ল্যানে রূপান্তরিত করা হয়।

অনিশ্চয়তা কোয়ান্টিফিকেশন সহ উপলব্ধি-প্রথম পরিকল্পনা

প্রম্পট "কাজ করার আগে, একটি পর্যবেক্ষণ মডেল তৈরি করুন। {GOAL}-এর জন্য প্রয়োজনীয় পর্যবেক্ষণ, আত্মবিশ্বাসের থ্রেশহোল্ড এবং প্রান্তিক ক্ষেত্রগুলি সনাক্ত করুন। JSON আউটপুট করুন: { observations:. বৃহত্তর প্রম্পট এবং এজেন্ট প্যাটার্নের জন্য, Google-এর Gemini কুকবুক এবং এজেন্ট গাইড সহায়ক রেফারেন্স।

উদাহরণ: একটি রান্নাঘরের কাজের জন্য এন্ড-টু-এন্ড প্রম্পট

লক্ষ্য: একটি সাধারণ সালাদ তৈরি করুন এবং এটি প্যাক করে নিয়ে যান।

প্রম্পট "আপনি একটি সমান্তরাল গ্রিপার এবং টুল-চেঞ্জার সহ একটি 7-DOF মোবাইল ম্যানিপুলেটর নিয়ন্ত্রণ করছেন। লক্ষ্য: লেটুস, টমেটো, শসা এবং ড্রেসিং দিয়ে একটি সালাদ তৈরি এবং প্যাক করুন। পরিবেশ: সিঙ্ক, কাটিং বোর্ড, শেফ ছুরি, সালাদ বাটি, লাঞ্চ ধারক সহ রান্নাঘরের দ্বীপ। মানুষ উপস্থিত থাকতে পারে। সীমাবদ্ধতা: মানুষের 0.5 মিটারের মধ্যে কোনও ব্লেড নয়। কাটার সময় ছাড়া ছুরির ধার সবসময় ঢাকা থাকবে। গ্রিপার ফোর্স ≤ 15 N। স্লাইসের পুরুত্ব 3–4 মিমি। পৃষ্ঠতল স্যানিটাইজ করা। আউটপুট:

যাচাই করার জন্য অনুমান (সরঞ্জাম, উপাদান, আলো),

পর্যায়ক্রমে পরিকল্পনা (ধোয়া → প্রস্তুতি → কাটা → একত্র করা → প্যাক করা),

প্রতিটি ধাপের সুরক্ষা পরীক্ষা (দৃষ্টি/ফোর্স),

ত্রুটি পুনরুদ্ধার (পুনরায় ধরা, পুনরায় সনাক্ত করা, পুনরায় পরিষ্কার করা),

সাফল্যের মেট্রিক (সমান স্লাইসের চাক্ষুষ নিশ্চিতকরণ; ধারক সিল করা; এলাকা পরিষ্কার),

লগ স্কিমা এবং আগে/পরে ছবি।"

আপনি যা পাবেন: উপলব্ধি গেট, সরঞ্জাম পরিচালনার নিয়ম এবং সুস্পষ্ট সাফল্যের মানদণ্ড সহ একটি দীর্ঘ-অনুভূমিক, সুরক্ষা-সচেতন পদ্ধতি।

সমাপনী চিন্তা

দুর্দান্ত রোবোটিক্স প্রম্পটগুলি বিমান চলাচলের চেকলিস্টের মতো: স্পষ্ট লক্ষ্য, পরিমাপযোগ্য গেট এবং পরিকল্পিত অব্যাহতি। এই 25টি টেমপ্লেটকে বিল্ডিং ব্লক হিসাবে ব্যবহার করুন, তারপরে বাস্তব রান থেকে লগ দিয়ে সেগুলি পরিমার্জন করুন। যেহেতু Gemini Robotics 1.5 এবং ER 1.5 ক্রমাগত এজেন্টিক পরিকল্পনাকে বাস্তব জগতে নিয়ে আসছে, তাই আপনার প্রম্পটগুলি একটি ভাল ডেমো এবং নির্ভরযোগ্য দৈনিক কার্যক্রমের মধ্যে পার্থক্য তৈরি করে।

FAQ

প্রশ্ন 1: Gemini Robotics 1.5 / ER 1.5 কীসের জন্য ব্যবহৃত হয়? এগুলি হল এমবডিয়েড যুক্তির মডেল যা রোবটকে জটিল, বহু-ধাপের কাজগুলিতে উপলব্ধি, পরিকল্পনা এবং কাজ করতে দেয়—যেমন আইটেম বাছাই করা, খাবার প্রস্তুত করা বা সুবিধা পরিচালনা করা। তারা গ্রাউন্ডিং, সুরক্ষা এবং অভিযোজিত পরিকল্পনার উপর জোর দেয়।

প্রশ্ন 2: আমি কীভাবে বহু-ধাপের রোবোটিক কাজের জন্য প্রম্পট লিখব? লক্ষ্য, পরিবেশ এবং সীমাবদ্ধতা উল্লেখ করুন। যাচাই করার জন্য অনুমান, সুরক্ষা পরীক্ষা, পুনরুদ্ধারের আচরণ এবং সাফল্যের মেট্রিক জিজ্ঞাসা করুন। আপনি নীতি এবং থ্রেশহোল্ড প্রয়োগ করার সময় মডেলটিকে ধাপগুলির পরিকল্পনা করতে দিন।

প্রশ্ন 3: এই প্রম্পটগুলি কি অনিশ্চয়তা এবং ত্রুটিগুলি পরিচালনা করতে পারে? হ্যাঁ। আত্মবিশ্বাসের থ্রেশহোল্ড, ত্রুটি স্বাক্ষর এবং ফলব্যাক শাখা অন্তর্ভুক্ত করুন। স্বাভাবিক, কম-আত্মবিশ্বাস এবং ব্যর্থতার পথ সহ স্টেট মেশিন ডিজাইন করা অসংগঠিত সেটিংসে নির্ভরযোগ্যতা উন্নত করে।

প্রশ্ন 4: আমাকে কি সঠিক ট্র্যাজেক্টোরি নির্দিষ্ট করতে হবে? সাধারণত না। উচ্চ-স্তরের উদ্দেশ্য, স্পষ্ট সীমাবদ্ধতা (ফোর্স, ক্লিয়ারেন্স, গতি) এবং যাচাইকরণ গেট সরবরাহ করুন। মডেলটি সেই সীমাবদ্ধতাগুলির সাথে সঙ্গতি রেখে ট্র্যাজেক্টোরি তৈরি করতে পারে।

প্রশ্ন 5: আমি অফিসিয়াল ডক্স এবং উদাহরণ কোথায় পাব? Google DeepMind-এর Gemini Robotics পৃষ্ঠা এবং ER 1.5-এর জন্য বিকাশকারী ওভারভিউ, সাথে বৃহত্তর প্রম্পটিং এবং এজেন্ট প্যাটার্নের জন্য Gemini কুকবুক এবং এজেন্ট গাইড দেখুন।

Gemini Robotics 1.5 / ER 1.5-এর জন্য মাল্টি-স্টেপ টাস্ক কম্পোজ করার ২৫টি প্রম্পট টেমপ্লেট

আত্মবিশ্বাসের সাথে বহু-ধাপের রোবোটিক টাস্ক তৈরি করুন

এই টেমপ্লেটগুলি কীভাবে ব্যবহার করবেন

অধ্যায় A — পরিকল্পনা ও গ্রাউন্ডিং (ভিত্তি)

উদাহরণ: একটি রান্নাঘরের কাজের জন্য এন্ড-টু-এন্ড প্রম্পট

সমাপনী চিন্তা

FAQ