আত্মবিশ্বাসের সাথে বহু-ধাপের রোবোটিক টাস্ক তৈরি করুন
আপনি যদি কোনও টাস্ক স্পষ্টভাবে বর্ণনা করতে পারেন তবে আপনার রোবট সম্ভবত এটি করতে পারবে। এটিই হল Gemini Robotics 1.5 এবং ER 1.5-এর প্রতিশ্রুতি—এই মডেলগুলি গ্রাউন্ডেড, এমবডিয়েড যুক্তির জন্য তৈরি করা হয়েছে যা উচ্চ-স্তরের উদ্দেশ্যকে বাস্তব জগতে নির্ভরযোগ্য, বহু-ধাপের অ্যাকশন প্ল্যানে পরিণত করে। নীচে 25টি প্রমাণিত প্রম্পট টেমপ্লেট রয়েছে—উদ্দেশ্যের ভিত্তিতে সাজানো—যা আপনাকে বাস্তব-বিশ্বের রোবোটিক্সের জন্য শক্তিশালী, বহু-ধাপের ওয়ার্কফ্লো তৈরি করতে সহায়তা করে।
শৈলী নোট: ব্যবহারিক ও সমাধান-ভিত্তিক। প্রতিটি টেমপ্লেটে কাঠামো, প্রস্তাবিত গার্ডরেল এবং ঐচ্ছিক ভেরিয়েবল অন্তর্ভুক্ত রয়েছে। আপনার প্রসঙ্গ দিয়ে {OBJECT}, {LOCATION}, {POLICY}, এবং {CONSTRAINTS}-এর মতো প্লেসহোল্ডারগুলি প্রতিস্থাপন করুন।
এই টেমপ্লেটগুলি কীভাবে ব্যবহার করবেন
- একটি উচ্চ-স্তরের লক্ষ্য দিয়ে শুরু করুন, তারপরে সেন্সর চেক এবং পুনরুদ্ধারের আচরণ সহ ধাপগুলি গণনা করুন।
- সীমাবদ্ধতা অন্তর্ভুক্ত করুন: সুরক্ষা, গতি/যথার্থতা, পরিবেশের অনুমান এবং ফলব্যাক কৌশল।
- স্টেট ফিডব্যাক চ্যানেল সরবরাহ করুন (যেমন, দৃষ্টি সাফল্যের মানদণ্ড, ফোর্স/টর্ক থ্রেশহোল্ড)।
- ধাপে ধাপে মাইক্রোম্যানেজমেন্টের চেয়ে ঘোষণামূলক লক্ষ্যগুলিকে বেশি গুরুত্ব দিন; মডেলটিকে পরিকল্পনা করতে এবং মানিয়ে নিতে দিন।
incidentally, আপনি যদি কোনও দল জুড়ে প্রম্পট, লগ এবং পুনরাবৃত্তি পরিচালনা করেন, তবে Sider.AI-এর মতো একটি সাইড প্যানেল সহকারী আপনার ডক্স এবং কোডের পাশাপাশি প্রম্পটগুলি ড্রাফ্ট, পরীক্ষা এবং পরিমার্জন করতে সহায়তা করতে পারে, আপনার রোবোটিক দক্ষতা এবং পদ্ধতির উপর পুনরাবৃত্তি করার সাথে সাথে প্রসঙ্গটি দৃশ্যমান রাখতে পারে। অধ্যায় A — পরিকল্পনা ও গ্রাউন্ডিং (ভিত্তি)
- টাস্ক ব্লুপ্রিন্ট (লক্ষ্য → সীমাবদ্ধতা → পরিকল্পনা → চেক)
- প্রম্পট
"আপনি একটি মোবাইল ম্যানিপুলেটর নিয়ন্ত্রণ করছেন।
লক্ষ্য: {GOAL}।
পরিবেশ: {DESCRIPTION}; পরিচিত বস্তু: {OBJECT_LIST}।
সীমাবদ্ধতা: {CONSTRAINTS}।
আউটপুট: 1) যাচাই করার জন্য অনুমান, 2) উপলব্ধি/অ্যাকশন পদক্ষেপ সহ অর্ডার করা পরিকল্পনা, 3) প্রতিটি ধাপের জন্য সুরক্ষা পরীক্ষা, 4) পুনরুদ্ধারের আচরণ, 5) সমাপ্তির শর্ত এবং সাফল্যের মেট্রিক।"
- কখন ব্যবহার করবেন: যখন কোনও উচ্চ-স্তরের লক্ষ্যকে গার্ডরেল সহ একটি অপারেশনাল প্ল্যানে রূপান্তরিত করা হয়।
- অনিশ্চয়তা কোয়ান্টিফিকেশন সহ উপলব্ধি-প্রথম পরিকল্পনা
- প্রম্পট
"কাজ করার আগে, একটি পর্যবেক্ষণ মডেল তৈরি করুন। {GOAL}-এর জন্য প্রয়োজনীয় পর্যবেক্ষণ, আত্মবিশ্বাসের থ্রেশহোল্ড এবং প্রান্তিক ক্ষেত্রগুলি সনাক্ত করুন। JSON আউটপুট করুন:
{ observations:. বৃহত্তর প্রম্পট এবং এজেন্ট প্যাটার্নের জন্য, Google-এর Gemini কুকবুক এবং এজেন্ট গাইড সহায়ক রেফারেন্স।
উদাহরণ: একটি রান্নাঘরের কাজের জন্য এন্ড-টু-এন্ড প্রম্পট
লক্ষ্য: একটি সাধারণ সালাদ তৈরি করুন এবং এটি প্যাক করে নিয়ে যান।
প্রম্পট
"আপনি একটি সমান্তরাল গ্রিপার এবং টুল-চেঞ্জার সহ একটি 7-DOF মোবাইল ম্যানিপুলেটর নিয়ন্ত্রণ করছেন।
লক্ষ্য: লেটুস, টমেটো, শসা এবং ড্রেসিং দিয়ে একটি সালাদ তৈরি এবং প্যাক করুন।
পরিবেশ: সিঙ্ক, কাটিং বোর্ড, শেফ ছুরি, সালাদ বাটি, লাঞ্চ ধারক সহ রান্নাঘরের দ্বীপ। মানুষ উপস্থিত থাকতে পারে।
সীমাবদ্ধতা: মানুষের 0.5 মিটারের মধ্যে কোনও ব্লেড নয়। কাটার সময় ছাড়া ছুরির ধার সবসময় ঢাকা থাকবে। গ্রিপার ফোর্স ≤ 15 N। স্লাইসের পুরুত্ব 3–4 মিমি। পৃষ্ঠতল স্যানিটাইজ করা।
আউটপুট:
- যাচাই করার জন্য অনুমান (সরঞ্জাম, উপাদান, আলো),
- পর্যায়ক্রমে পরিকল্পনা (ধোয়া → প্রস্তুতি → কাটা → একত্র করা → প্যাক করা),
- প্রতিটি ধাপের সুরক্ষা পরীক্ষা (দৃষ্টি/ফোর্স),
- ত্রুটি পুনরুদ্ধার (পুনরায় ধরা, পুনরায় সনাক্ত করা, পুনরায় পরিষ্কার করা),
- সাফল্যের মেট্রিক (সমান স্লাইসের চাক্ষুষ নিশ্চিতকরণ; ধারক সিল করা; এলাকা পরিষ্কার),
- লগ স্কিমা এবং আগে/পরে ছবি।"
আপনি যা পাবেন: উপলব্ধি গেট, সরঞ্জাম পরিচালনার নিয়ম এবং সুস্পষ্ট সাফল্যের মানদণ্ড সহ একটি দীর্ঘ-অনুভূমিক, সুরক্ষা-সচেতন পদ্ধতি।
সমাপনী চিন্তা
দুর্দান্ত রোবোটিক্স প্রম্পটগুলি বিমান চলাচলের চেকলিস্টের মতো: স্পষ্ট লক্ষ্য, পরিমাপযোগ্য গেট এবং পরিকল্পিত অব্যাহতি। এই 25টি টেমপ্লেটকে বিল্ডিং ব্লক হিসাবে ব্যবহার করুন, তারপরে বাস্তব রান থেকে লগ দিয়ে সেগুলি পরিমার্জন করুন। যেহেতু Gemini Robotics 1.5 এবং ER 1.5 ক্রমাগত এজেন্টিক পরিকল্পনাকে বাস্তব জগতে নিয়ে আসছে, তাই আপনার প্রম্পটগুলি একটি ভাল ডেমো এবং নির্ভরযোগ্য দৈনিক কার্যক্রমের মধ্যে পার্থক্য তৈরি করে।
FAQ
প্রশ্ন 1: Gemini Robotics 1.5 / ER 1.5 কীসের জন্য ব্যবহৃত হয়?
এগুলি হল এমবডিয়েড যুক্তির মডেল যা রোবটকে জটিল, বহু-ধাপের কাজগুলিতে উপলব্ধি, পরিকল্পনা এবং কাজ করতে দেয়—যেমন আইটেম বাছাই করা, খাবার প্রস্তুত করা বা সুবিধা পরিচালনা করা। তারা গ্রাউন্ডিং, সুরক্ষা এবং অভিযোজিত পরিকল্পনার উপর জোর দেয়।
প্রশ্ন 2: আমি কীভাবে বহু-ধাপের রোবোটিক কাজের জন্য প্রম্পট লিখব?
লক্ষ্য, পরিবেশ এবং সীমাবদ্ধতা উল্লেখ করুন। যাচাই করার জন্য অনুমান, সুরক্ষা পরীক্ষা, পুনরুদ্ধারের আচরণ এবং সাফল্যের মেট্রিক জিজ্ঞাসা করুন। আপনি নীতি এবং থ্রেশহোল্ড প্রয়োগ করার সময় মডেলটিকে ধাপগুলির পরিকল্পনা করতে দিন।
প্রশ্ন 3: এই প্রম্পটগুলি কি অনিশ্চয়তা এবং ত্রুটিগুলি পরিচালনা করতে পারে?
হ্যাঁ। আত্মবিশ্বাসের থ্রেশহোল্ড, ত্রুটি স্বাক্ষর এবং ফলব্যাক শাখা অন্তর্ভুক্ত করুন। স্বাভাবিক, কম-আত্মবিশ্বাস এবং ব্যর্থতার পথ সহ স্টেট মেশিন ডিজাইন করা অসংগঠিত সেটিংসে নির্ভরযোগ্যতা উন্নত করে।
প্রশ্ন 4: আমাকে কি সঠিক ট্র্যাজেক্টোরি নির্দিষ্ট করতে হবে?
সাধারণত না। উচ্চ-স্তরের উদ্দেশ্য, স্পষ্ট সীমাবদ্ধতা (ফোর্স, ক্লিয়ারেন্স, গতি) এবং যাচাইকরণ গেট সরবরাহ করুন। মডেলটি সেই সীমাবদ্ধতাগুলির সাথে সঙ্গতি রেখে ট্র্যাজেক্টোরি তৈরি করতে পারে।
প্রশ্ন 5: আমি অফিসিয়াল ডক্স এবং উদাহরণ কোথায় পাব?
Google DeepMind-এর Gemini Robotics পৃষ্ঠা এবং ER 1.5-এর জন্য বিকাশকারী ওভারভিউ, সাথে বৃহত্তর প্রম্পটিং এবং এজেন্ট প্যাটার্নের জন্য Gemini কুকবুক এবং এজেন্ট গাইড দেখুন।