Menyusun Tugas Robot Multi-Langkah dengan Penuh Percaya Diri
Jika Anda dapat menjelaskan suatu tugas dengan jelas, kemungkinan besar robot Anda dapat melakukannya. Itulah janji dari Gemini Robotics 1.5 dan ER 1.5—model yang dibangun untuk penalaran berdasar dan terwujud yang mengubah tujuan tingkat tinggi menjadi rencana aksi multi-langkah yang andal di dunia fisik. Di bawah ini adalah 25 templat prompt yang terbukti—yang diatur berdasarkan tujuan—yang membantu Anda menyusun alur kerja multi-langkah yang kuat untuk robotika dunia nyata.
Catatan gaya: Praktis & berorientasi solusi. Setiap templat menyertakan struktur, pagar pengaman yang direkomendasikan, dan variabel opsional. Ganti placeholder seperti {OBJECT}, {LOCATION}, {POLICY}, dan {CONSTRAINTS} dengan konteks Anda.
Cara Menggunakan Templat Ini
- Mulailah dengan tujuan tingkat tinggi, lalu sebutkan langkah-langkah dengan pemeriksaan sensor dan perilaku pemulihan.
- Sertakan batasan: keselamatan, kecepatan/presisi, asumsi lingkungan, dan strategi fallback.
- Sediakan saluran umpan balik status (misalnya, kriteria keberhasilan visi, ambang batas gaya/torsi).
- Lebih suka tujuan deklaratif daripada manajemen mikro langkah demi langkah yang rapuh; biarkan model merencanakan dan beradaptasi.
Ngomong-ngomong, jika Anda mengatur prompt, log, dan iterasi di seluruh tim, asisten panel samping seperti Sider.AI dapat membantu Anda menyusun, menguji, dan menyempurnakan prompt di samping dokumen dan kode Anda, menjaga konteks tetap terlihat saat Anda melakukan iterasi pada keterampilan dan prosedur robot Anda. Bagian A — Perencanaan & Pengukuran (Dasar)
- Cetak Biru Tugas (Tujuan → Batasan → Rencana → Pemeriksaan)
- Prompt
"Anda mengendalikan manipulator seluler.
Tujuan: {GOAL}.
Lingkungan: {DESCRIPTION}; objek yang diketahui: {OBJECT_LIST}.
Batasan: {CONSTRAINTS}.
Output: 1) Asumsi untuk diverifikasi, 2) Rencana yang diurutkan dengan langkah-langkah persepsi/aksi, 3) Pemeriksaan keselamatan per langkah, 4) Perilaku pemulihan, 5) Kondisi penghentian dan metrik keberhasilan."
- Gunakan saat: Mengonversi tujuan tingkat tinggi menjadi rencana operasional dengan pagar pengaman.
- Rencana Berbasis Persepsi dengan Kuantifikasi Ketidakpastian
- Prompt
"Sebelum bertindak, bangun model observasi. Identifikasi observasi yang diperlukan, ambang batas kepercayaan, dan kasus ekstrem untuk {GOAL}. Output JSON:
{ observations:. Untuk pola prompt dan agen yang lebih luas, buku masak Gemini dan panduan agen Google adalah referensi yang bermanfaat.
Contoh: Prompt Ujung-ke-Ujung untuk Tugas Dapur
Tujuan: Siapkan salad sederhana dan kemas untuk dibawa pergi.
Prompt
"Anda mengendalikan manipulator seluler 7-DOF dengan gripper paralel dan pengubah alat.
Tujuan: Siapkan dan kemas salad dengan selada, tomat, mentimun, dan saus.
Lingkungan: Pulau dapur dengan wastafel, talenan, pisau koki, mangkuk salad, wadah makan siang. Manusia mungkin ada di sekitar.
Batasan: Tidak ada bilah dalam jarak 0,5 m dari manusia. Mata pisau selalu tersarung kecuali saat memotong. Gaya gripper ≤ 15 N. Ketebalan irisan 3–4 mm. Permukaan disanitasi.
Output:
- Asumsi untuk diverifikasi (alat, bahan, pencahayaan),
- Rencanakan dalam fase (cuci → persiapan → potong → susun → kemas),
- Pemeriksaan keselamatan per langkah (visi/gaya),
- Pemulihan kesalahan (pegangan ulang, relokasi, pembersihan ulang),
- Metrik keberhasilan (konfirmasi visual irisan yang rata; wadah tertutup; area bersih),
- Skema log dan foto sebelum/sesudah."
Apa yang akan Anda dapatkan: Prosedur jangka panjang yang sadar akan keselamatan dengan gerbang persepsi, aturan penanganan alat, dan kriteria keberhasilan yang jelas.
Pemikiran Penutup
Prompt robotika yang hebat dibaca seperti daftar periksa dari penerbangan: tujuan yang jelas, gerbang yang terukur, dan pelarian yang direncanakan. Gunakan 25 templat ini sebagai blok bangunan, lalu perbaiki dengan log dari pengujian yang sebenarnya. Karena Gemini Robotics 1.5 dan ER 1.5 terus membawa perencanaan agentik ke dunia fisik, prompt Anda adalah perbedaan antara demo yang bagus dan operasi harian yang dapat diandalkan.
FAQ
P1:Untuk apa Gemini Robotics 1.5 / ER 1.5 digunakan?
Mereka adalah model penalaran terwujud yang memungkinkan robot memahami, merencanakan, dan bertindak di seluruh tugas multi-langkah yang kompleks di dunia fisik—seperti memilih item, menyiapkan makanan, atau operasi fasilitas. Mereka menekankan pendasaran, keselamatan, dan perencanaan adaptif.
P2:Bagaimana cara menulis prompt untuk tugas robot multi-langkah?
Nyatakan tujuan, lingkungan, dan batasan. Mintalah asumsi untuk diverifikasi, pemeriksaan keselamatan, perilaku pemulihan, dan metrik keberhasilan. Biarkan model merencanakan langkah-langkah sementara Anda memberlakukan kebijakan dan ambang batas.
P3:Bisakah prompt ini menangani ketidakpastian dan kesalahan?
Ya. Sertakan ambang batas kepercayaan, tanda tangan kesalahan, dan cabang fallback. Merancang mesin status dengan jalur nominal, kepercayaan rendah, dan kegagalan meningkatkan keandalan dalam pengaturan yang tidak terstruktur.
P4:Apakah saya perlu menentukan lintasan yang tepat?
Biasanya tidak. Berikan tujuan tingkat tinggi, batasan yang jelas (gaya, jarak bebas, kecepatan), dan gerbang verifikasi. Model dapat menghasilkan lintasan yang konsisten dengan batasan tersebut.
P5:Di mana saya dapat menemukan dokumen dan contoh resmi?
Lihat halaman Gemini Robotics Google DeepMind dan ikhtisar pengembang untuk ER 1.5, ditambah buku masak Gemini dan panduan agen untuk pembuatan prompt dan pola agen yang lebih luas.