Pendahuluan: Seni Membuat Prompt untuk Model yang Kecil Namun Bertenaga
Jika Anda pernah berharap AI Anda terasa lebih seperti rekan tim yang berpikir cepat daripada konsultan yang lambat dan bertele-tele, Claude Haiku 4.5 adalah model untuk Anda. Model ini dirancang untuk kecepatan, latensi rendah, dan efisiensi biaya—ideal untuk iterasi cepat, beban kerja bervolume tinggi, dan umpan balik yang ketat. Namun, inilah yang menarik: mendapatkan hasil luar biasa dari Haiku 4.5 bukan tentang menulis prompt yang lebih panjang. Ini tentang menulis prompt yang lebih tajam. Dalam panduan ini, kita akan mengupas strategi prompt yang secara konsisten menghasilkan output yang jelas dan andal dari Claude Haiku 4.5—dan menunjukkan cara menyesuaikannya untuk segala hal mulai dari pengkodean hingga pembuatan konten dan analisis ringan.
Apa yang membuat Claude Haiku 4.5 berbeda—dan mengapa ini penting untuk pembuatan prompt
Claude Haiku 4.5 berada di tingkatan “model kecil”, dibangun untuk kecepatan dan skala sambil mempertahankan penalaran yang kuat untuk tugas sehari-hari. Hal ini mengubah cara Anda membuat prompt:
- Anda akan mendapatkan hasil terbaik dengan instruksi yang terstruktur dan eksplisit.
- Prompt pendek dan berbobot lebih baik daripada prompt panjang yang bertele-tele.
- Penalaran terbatas langkah (“berpikir langkah demi langkah dalam 3–5 langkah”) membantunya tetap fokus.
- Model ini sangat bagus untuk draf cepat, perancangan, dan dukungan keputusan dengan batasan yang jelas.
Haiku 4.5 dirancang agar hemat biaya dalam skala besar, yang membuatnya sempurna untuk mengatur alur kerja multi-giliran, transformasi konten massal, dan pembuatan augmented-retrieval (RAG) di mana latensi menjadi penting.
Catatan gaya: Artikel ini menggunakan pendekatan Praktis & Berorientasi Solusi—dioptimalkan untuk penggunaan langsung dalam proyek nyata.
Aturan utama untuk prompt Claude Haiku 4.5
- Tulis prompt sesingkat mungkin yang tetap menghilangkan ambiguitas
- Buruk: “Rangkum laporan ini.”
- Lebih baik: “Rangkum laporan ini untuk seorang manajer produk. 5 poin. Sertakan: risiko, dependensi, langkah selanjutnya. Maksimal 120 kata.”
Mengapa ini berhasil: Haiku 4.5 berkembang ketika batasan Anda jelas. Tentukan audiens, format, panjang, dan elemen penting apa pun.
- Jaga agar peran dan tujuan tetap eksplisit dalam pengaturan gaya sistem
- Contoh: “Anda adalah asisten teknis yang ringkas. Tujuan: (1) menjawab secara akurat, (2) meminimalkan token, (3) menunjukkan garis besar penalaran 3 langkah hanya jika diminta.”
Mengapa ini berhasil: Peran + tujuan yang jelas memandu decoding, mengurangi penyimpangan, dan meningkatkan pengulangan lintas panggilan.
- Pilih daftar periksa daripada ungkapan terbuka
- Contoh untuk tinjauan kode: “Tinjau untuk: (a) kebenaran, (b) keamanan, (c) keterbacaan, (d) cakupan pengujian. Output: lulus/gagal per item dengan justifikasi 1–2 baris.”
Mengapa ini berhasil: Daftar periksa memampatkan tugas kompleks menjadi subtugas yang andal dan dapat diverifikasi.
- Gunakan pemikiran terbatas langkah
- Contoh: “Berpikir dalam maksimal 4 langkah, lalu sajikan hanya jawaban akhir.”
Mengapa ini berhasil: Anda mendapatkan penalaran yang terfokus tanpa verbositas yang tak terkendali.
- Tuntut output terstruktur (selalu!)
- Contoh: “Kembalikan JSON dengan kunci: decision, rationale, risks, next_steps. Tidak ada teks tambahan.”
Mengapa ini berhasil: Struktur memungkinkan otomatisasi hilir, mencegah basa-basi, dan menjaga biaya tetap dapat diprediksi.
- Jangkarkan model dengan contoh
- Contoh beberapa tembakan harus: pendek, representatif, dan sesuai dengan gaya yang Anda inginkan.
- Pola: Instruksi → 1–2 contoh ringkas → Input baru.
- Kiat: Pertahankan contoh khusus domain (misalnya, suara merek Anda, gaya kode Anda).
- Batasi nada, panjang, dan format
- “Nada: netral-profesional.”
- “Format: 5 poin, masing-masing ≤18 kata.”
- Untuk kode: “Target: Python 3.11, Pydantic v2. Gunakan petunjuk tipe. Sertakan pengujian 1 blok.”
- Ajari cara mengatakan “Saya tidak tahu”
- Tambahkan: “Jika data hilang atau ambigu, ajukan satu pertanyaan klarifikasi terlebih dahulu. Jika masih tidak yakin, katakan 'tidak diketahui'.”
Mengapa ini berhasil: Mengurangi jawaban salah yang percaya diri dan menjaga loop tetap efisien.
- Gunakan pengambilan dan berikan cuplikan yang relevan, bukan seluruh korpus
- Berikan hanya 1–3 potongan relevan teratas.
- Pra-pangkas boilerplate untuk memaksimalkan kepadatan sinyal.
- Beri label cuplikan: [Kebijakan], [Kutipan], [Email], [Spesifikasi].
- Pisahkan kebijakan dari tugas
- Kebijakan: “Jangan pernah mengeluarkan PII, jaga agar tetap di bawah 150 token, sebutkan sumber jika disediakan.”
- Tugas pengguna: “Rangkum rangkaian email untuk prospek penjualan.”
Mengapa ini berhasil: Arsitektur prompt yang lebih bersih, perawatan yang lebih mudah.
Pola prompt yang secara konsisten berhasil
Pola A: “Brief yang Ketat”
Gunakan saat Anda membutuhkan kecepatan dan konsistensi untuk tugas rutin.
Template:
- Peran: “Anda adalah seorang [peran].”
- Tujuan: “Tujuan Anda adalah untuk [tujuan].”
- Batasan: audiens, panjang, nada, format.
- Rubrik evaluasi: 2–4 kriteria poin.
- Pembatas input: “Input dimulai/diakhiri dengan ===.”
- Skema output: “Kembalikan [format]. Tidak ada teks tambahan.”
Pola B: “Kritik lalu Buat”
Untuk draf berkualitas lebih tinggi dengan token tambahan minimal.
- Langkah 1 (internal): “Diam-diam menilai relevansi, celah, dan risiko dalam 3 poin.”
- Langkah 2 (output): “Hasilkan draf yang menyelesaikan masalah tersebut.”
- Untuk menjaga output tetap bersih, tentukan: “Jangan tunjukkan kritik; hanya terapkan saja.”
Pola C: “Bandingkan dan Pilih”
Gunakan saat pemilihan adalah tugasnya.
- “Mengingat opsi A–D, skor pada: akurasi (40), kejelasan (30), kepatuhan (30). Kembalikan pemenang dan rasional 2 kalimat.”
Pola D: “Rantai Pemeriksaan”
Untuk keamanan, kepatuhan, atau kepatuhan kebijakan.
- “Sebelum menjawab, verifikasi: (1) diizinkan oleh kebijakan, (2) dalam ruang lingkup, (3) tidak ada informasi yang hilang. Jika ada yang gagal, berhenti dan ajukan 1 pertanyaan klarifikasi.”
Pola E: “Delta-Edit”
Untuk mengedit teks yang ada.
- “Kembalikan hanya diff minimal: 'Ubah X menjadi Y karena Z.' Pertahankan gaya yang ada. Maksimal 8 perubahan.”
Pola F: “Perancah Kode”
- “Hasilkan baseline minimal yang dapat dijalankan dengan TODO. Sertakan pengujian. Pertahankan fungsi ≤30 baris. Tambahkan docstring dan petunjuk tipe.”
Contoh berdampak tinggi untuk alur kerja sehari-hari
Ringkasan konten
Prompt:
“Anda adalah seorang analis ringkas. Rangkum laporan berikut untuk seorang pemimpin produk.
- Output: 5 poin (≤18 kata setiap poin) untuk: hasil, risiko, dependensi, langkah selanjutnya, metrik.
- Jika data hilang, tulis 'tidak diketahui' untuk poin itu.
===
[Tempel laporan]
===”
Penyusunan email
Prompt:
“Anda adalah asisten profesional. Buat draf balasan yang: singkat, hangat, tegas. Sertakan: (1) apresiasi, (2) 1 keputusan yang jelas, (3) 1 permintaan.
- Maksimal 120 kata. Tidak ada tanda tangan salam; Saya akan menambahkannya.”
Pembuatan SQL dari skema
Prompt:
“Anda adalah asisten SQL. Mengingat skema Postgres, tulis satu kueri.
- Batasan: ANSI SQL, tidak ada CTE kecuali diperlukan, gunakan indeks jika tersirat.
- Output: blok kode saja. Kemudian penjelasan 1 kalimat.
Skema:
===
[Skema]
===
Tugas: [Pertanyaan]”
Tinjauan kode
Prompt:
“Anda adalah peninjau kode yang sadar keamanan.
- Periksa: kebenaran, keamanan, keterbacaan, pengujian.
- Output: array JSON dari temuan dengan bidang: severity, file, line, issue, fix.
- Maksimal 6 temuan. Jika tidak ada, kembalikan [].
===
[Diff atau file]
===”
Menjawab pertanyaan RAG
Prompt:
“Anda adalah responden yang beralasan. Gunakan HANYA sumber yang disediakan.
- Sebutkan ID sumber dalam kurung seperti [S1]. Jika jawabannya tidak ada di sumber, katakan 'tidak ditemukan di sumber'.
- Output: 2–4 kalimat; kemudian 3 poin berlabel 'Kutipan'.
Sumber:
[S1] …
[S2] …
Pertanyaan: …”
Rubrik evaluasi untuk dimasukkan ke dalam prompt
- Akurasi pertama: “Hukum klaim yang tidak didukung. Lebih suka 'tidak diketahui' daripada menebak.”
- Keringkasan: “Jawaban lebih dari 150 token tidak sesuai.”
- Struktur: “Jawaban yang gagal tidak sesuai dengan skema JSON.”
- Keamanan: “Tolak tugas yang menyertakan kredensial, rahasia, atau PII.”
Trik untuk keandalan dan latensi rendah
- Gunakan pembatas eksplisit (===, <<<json>>>). Mencegah kebocoran yang tidak disengaja antar bagian.
- Beri label semuanya. Haiku 4.5 menghormati label seperti [Konteks], [Kebijakan], [Tugas], [Output].
- Tentukan anggaran token: “Targetkan 120–180 token; jangan pernah melebihi 220.”
- Lebih suka kata-kata sederhana. Hindari bahasa kiasan kecuali diperlukan.
- Hindari instruksi multi-hop dalam satu kalimat; bagi menjadi langkah-langkah bernomor.
Kesalahan umum—dan cara memperbaikinya
- Kesalahan: Tujuan yang tidak jelas.
Perbaikan: Nyatakan tujuan + audiens + batasan.
- Kesalahan: Konteks yang terlalu panjang.
Perbaikan: Berikan hanya 1–3 cuplikan yang paling relevan.
- Kesalahan: Output yang tidak terstruktur.
Perbaikan: Mandatkan skema JSON atau poin.
- Kesalahan: Sumber yang dihalusinasi.
Perbaikan: Instruksikan: “Sebutkan hanya sumber yang disediakan; jika tidak, katakan 'tidak ditemukan di sumber'.”
- Kesalahan: Jawaban yang tidak tegas.
Perbaikan: Berikan rubrik keputusan dan minta satu pilihan.
Lanjutan: Membangun pustaka prompt untuk Haiku 4.5
- Buat makro yang dapat digunakan kembali (misalnya, Nada: Netral, Output: Skema JSON A, Keamanan: Dasar).
- Versikan prompt dengan nama semantik (email_draft_v3_compact).
- Varian AB-test: ubah satu variabel pada satu waktu (format vs. nada vs. rubrik).
- Pertahankan “museum kegagalan” dari prompt yang menghasilkan hasil buruk dan mengapa.
Kapan memilih Haiku 4.5 vs. model yang lebih besar
- Pilih Haiku 4.5 saat Anda membutuhkan: kecepatan, kontrol biaya, perutean tugas bervolume tinggi, output terstruktur, atau loop iteratif.
- Pilih model yang lebih besar saat Anda membutuhkan: penalaran multi-hop yang mendalam, sintesis baru di seluruh dokumen yang berisik, atau pembuatan kode kompleks di seluruh basis kode yang besar.
- Pola hibrida: Gunakan Haiku 4.5 untuk triage, chunk, dan draf; eskalasi kasus sulit ke model yang lebih besar.
Ngomong-ngomong: Jika Anda mengatur pembuatan prompt multi-langkah, ruang kerja AI yang mendukung templat yang disimpan, memori multi-giliran per proyek, dan pengaturan RAG yang mudah dapat secara dramatis mengurangi waktu iterasi. Alat yang memungkinkan Anda membakukan peran, batasan, dan skema output di seluruh prompt membantu Anda menskalakan praktik terbaik ini di seluruh tim.
Salin-tempel templat prompt yang dapat Anda adaptasi hari ini
- Brief ultra-ringkas
“Anda adalah seorang [peran]. Tujuan: [tujuan].
Audiens: [audiens]. Format: [format]. Panjang: [N kata/token].
Batasan: [aturan].
Kembalikan hanya output akhir.”
- Memo keputusan
“Anda adalah seorang analis produk. Buat draf memo keputusan.
Sertakan bagian: Konteks (2 kalimat), Opsi (3 poin), Risiko (3 poin), Rekomendasi (1 paragraf), Langkah selanjutnya (3 poin). Panjang ≤180 kata.”
- Klarifikasi lalu jawab
“Anda adalah asisten yang berhati-hati. Jika tugas kekurangan 1 informasi penting, ajukan 1 pertanyaan klarifikasi. Jika tidak, jawab langsung dalam ≤120 kata.”
- Pemeriksa QA JSON
“Anda adalah seorang verifikator. Validasi jawaban berikut terhadap pertanyaan.
Kembalikan JSON: { valid: boolean, reason: string, missing: string[] }.”
- Responden beralasan yang aman
“Anda beralasan. Gunakan hanya sumber yang disediakan. Jika tidak didukung, katakan 'tidak diketahui'. Sebutkan ID sumber dalam kurung.”
Poin-poin penting
- Spesifik, bukan panjang: kompres maksud dan batasan.
- Struktur menang: minta skema, daftar, atau JSON.
- Batasi pemikiran: batasi langkah, token, dan ruang lingkup.
- Lebih suka contoh: beberapa tembakan yang pendek dan ditargetkan.
- Pisahkan kebijakan dari tugas: prompt modular berskala lebih baik.
- Gunakan Haiku 4.5 untuk tugas terstruktur, bervolume tinggi, dan sensitif terhadap kecepatan—dan eskalasi hanya jika diperlukan.
Langkah selanjutnya
- Ubah tugas frekuensi tertinggi Anda menjadi templat prompt.
- Tambahkan daftar periksa dan skema output ke setiap prompt.
- AB-uji dua versi setiap prompt selama seminggu dan adopsi pemenangnya.
- Bangun “pustaka prompt” ringan yang dapat digunakan kembali oleh seluruh tim Anda.
FAQ
P1:Prompt apa yang paling baik digunakan dengan Claude Haiku 4.5?
Prompt pendek dan spesifik dengan peran, batasan, dan output terstruktur yang eksplisit. Gunakan daftar periksa, batas langkah, dan skema JSON untuk meningkatkan akurasi dan konsistensi.
P2:Bagaimana cara mengurangi halusinasi dengan Haiku 4.5?
Dasari model hanya dengan cuplikan relevan teratas dan minta kutipan dari sumber yang disediakan. Jika bukti tidak ada, instruksikan untuk mengatakan “tidak diketahui.”
P3:Haruskah saya menggunakan contoh beberapa tembakan dengan Haiku 4.5?
Ya—berikan 1–2 contoh ringkas yang sesuai dengan gaya dan struktur yang Anda inginkan. Pertahankan contoh khusus domain dan lebih pendek dari output yang Anda harapkan.
P4:Kapan saya harus memilih Haiku 4.5 daripada model yang lebih besar?
Pilih Haiku 4.5 untuk tugas cepat dan hemat biaya yang mendapat manfaat dari struktur: ringkasan, jawaban RAG, daftar periksa tinjauan kode, dan penyusunan. Gunakan model yang lebih besar untuk penalaran multi-hop yang lebih dalam.
P5:Apa format output ideal untuk alur kerja otomatisasi?
JSON atau poin terstruktur ketat. Tentukan kunci yang tepat, batas panjang, dan aturan kepatuhan sehingga output masuk dengan rapi ke dalam sistem hilir.