Panimula: Ang sining ng pag-prompt sa isang maliit ngunit makapangyarihang modelo
Kung nais mo na ang iyong AI ay mas parang isang mabilis mag-isip na kasamahan sa koponan kaysa sa isang mabagal at mabulaklak na consultant, ang Claude Haiku 4.5 ang iyong modelo. Ito ay ginawa para sa bilis, mababang latency, at pagiging epektibo sa gastos—perpekto para sa mabilisang pag-ulit, malakihang workloads, at mahigpit na feedback loops. Ngunit narito ang twist: ang pagkuha ng pambihirang resulta mula sa Haiku 4.5 ay hindi tungkol sa pagsulat ng mas mahahabang prompts. Ito ay tungkol sa pagsulat ng mas matalas na prompts. Sa gabay na ito, aalamin natin ang mga estratehiya sa pag-prompt na patuloy na nagbibigay ng malinaw at maaasahang outputs mula sa Claude Haiku 4.5—at ipapakita namin sa iyo kung paano ito iakma sa lahat mula sa coding hanggang sa pagbuo ng nilalaman at magaan na pagsusuri.
Ano ang nagpapaiba sa Claude Haiku 4.5—at bakit mahalaga ito sa pag-prompt
Ang Claude Haiku 4.5 ay nasa “maliit na modelo” na tier, na binuo para sa bilis at sukat habang pinapanatili ang malakas na pangangatwiran para sa pang-araw-araw na gawain. Binabago nito kung paano ka mag-prompt:
- Makakakuha ka ng pinakamahusay na resulta sa pamamagitan ng nakabalangkas at malinaw na mga tagubilin.
- Ang maikli at high-signal na prompts ay mas mahusay kaysa sa mahaba at paligoy-ligoy na prompts.
- Ang step-bounded reasoning (“mag-isip nang sunud-sunod sa 3–5 hakbang”) ay nakakatulong upang manatili itong nakatuon.
- Mahusay ito para sa mabilisang drafts, scaffolding, at pagsuporta sa pagpapasya na may malinaw na mga limitasyon.
Ang Haiku 4.5 ay idinisenyo upang maging cost-effective sa malaking sukat, kaya perpekto ito para sa pag-orchestrate ng multi-turn workflows, bulk content transformations, at retrieval-augmented generation (RAG) kung saan mahalaga ang latency.
Tandaan sa estilo: Ang artikulong ito ay gumagamit ng Practical & Solution-Oriented na diskarte—na-optimize para sa agarang paggamit sa mga totoong proyekto.
Ang mga pangunahing patakaran para sa mga Claude Haiku 4.5 prompts
- Isulat ang pinakamaikling prompt na nag-aalis pa rin ng kalabuan
- Hindi Maganda: “Ibuod ang ulat na ito.”
- Mas Maganda: “Ibuod ang ulat na ito para sa isang product manager. 5 bullets. Isama ang: mga panganib, dependencies, susunod na hakbang. Max 120 salita.”
Bakit ito gumagana: Ang Haiku 4.5 ay umuunlad kapag malinaw ang iyong mga limitasyon. Tukuyin ang audience, format, haba, at anumang dapat-mayroon na mga elemento.
- Panatilihing malinaw ang mga roles at layunin sa system-style setup
- Halimbawa: “Ikaw ay isang maikli at teknikal na assistant. Mga Layunin: (1) sagutin nang tumpak, (2) i-minimize ang mga tokens, (3) ipakita lamang ang 3-step reasoning outline kapag hiniling.”
Bakit ito gumagana: Ang malinaw na role + mga layunin ay gumagabay sa decoding, binabawasan ang paglihis, at pinapabuti ang repeatability sa mga tawag.
- Mas gusto ang mga checklist kaysa sa open-ended na paglalahad
- Halimbawa para sa code review: “Suriin para sa: (a) kawastuhan, (b) seguridad, (c) pagiging madaling basahin, (d) saklaw ng pagsubok. Output: pass/fail sa bawat item na may 1–2 linya ng pagbibigay-katwiran.”
Bakit ito gumagana: Sinasaklaw ng mga checklist ang mga kumplikadong gawain sa maaasahan at nabe-verify na mga subtask.
- Gumamit ng step-bounded thinking
- Halimbawa: “Mag-isip nang hanggang 4 na hakbang, pagkatapos ay ipakita lamang ang isang panghuling sagot.”
Bakit ito gumagana: Nakakakuha ka ng nakatuong pangangatwiran nang walang runaway verbosity.
- Hilingin ang nakabalangkas na mga output (palagi!)
- Halimbawa: “Ibalik ang JSON na may mga keys: decision, rationale, risks, next_steps. Walang dagdag na teksto.”
Bakit ito gumagana: Ang istraktura ay nagbibigay-daan sa downstream automation, pinipigilan ang fluff, at pinapanatiling predictable ang mga gastos.
- I-anchor ang modelo sa pamamagitan ng mga exemplar
- Ang mga few-shot examples ay dapat na: maikli, representative, at naaayon sa iyong ninanais na estilo.
- Pattern: Instruction → 1–2 compact exemplars → Bagong input.
- Tip: Panatilihing domain-specific ang mga exemplar (hal., iyong brand voice, iyong code style).
- Limitahan ang tono, haba, at format
- “Tono: neutral-professional.”
- “Format: 5 bullets, bawat isa ≤18 salita.”
- Para sa code: “Target: Python 3.11, Pydantic v2. Gumamit ng type hints. Magsama ng 1-block na pagsubok.”
- Turuan ito kung paano sabihin ang “Hindi ko alam”
- Idagdag: “Kung kulang ang data o may kalabuan, magtanong muna ng isang naglilinaw na tanong. Kung hindi pa rin tiyak, sabihin ang ‘unknown’.”
Bakit ito gumagana: Binabawasan ang mga confident na maling sagot at pinapanatiling mahusay ang mga loops.
- Gumamit ng retrieval at ipasa ang mga nauugnay na snippets, hindi buong corpora
- Magbigay lamang ng nangungunang 1–3 nauugnay na chunks.
- I-pre-trim ang boilerplate upang i-maximize ang signal density.
- I-label ang mga snippets: [Policy], [Excerpt], [Email], [Spec].
- Paghiwalayin ang patakaran mula sa gawain
- Patakaran: “Huwag kailanman mag-output ng PII, panatilihin sa ilalim ng 150 tokens, banggitin ang mga pinagmulan kung ibinigay.”
- Gawain ng gumagamit: “Ibuod ang email chain para sa sales lead.”
Bakit ito gumagana: Mas malinis na prompt architecture, mas madaling pagpapanatili.
Mga pattern ng prompt na patuloy na gumagana
Pattern A: Ang “Mahigpit na Brief”
Gamitin kapag kailangan mo ng bilis at pagkakapare-pareho para sa mga routine na gawain.
Template:
- Role: “Ikaw ay isang [role].”
- Layunin: “Ang iyong layunin ay [layunin].”
- Mga Limitasyon: audience, haba, tono, format.
- Evaluation rubric: 2–4 bullet criteria.
- Input delimiter: “Ang input ay nagsisimula/nagtatapos sa ===.”
- Output schema: “Ibalik ang [format]. Walang dagdag na teksto.”
Pattern B: “Pumuna pagkatapos Lumikha”
Para sa mas mataas na kalidad na mga drafts na may kaunting dagdag na tokens.
- Hakbang 1 (internal): “Tahimik na tasahin ang kaugnayan, mga puwang, at mga panganib sa 3 bullets.”
- Hakbang 2 (output): “Gumawa ng draft na lumulutas sa mga isyung iyon.”
- Upang panatilihing malinis ang output, tukuyin ang: “Huwag ipakita ang critique; ilapat lamang ito.”
Pattern C: “Paghambingin-at-Pumili”
Gamitin kapag ang pagpili ang gawain.
- “Sa mga opsyon na A–D, puntos sa: accuracy (40), clarity (30), compliance (30). Ibalik ang panalo at isang 2-pangungusap na rationale.”
Pattern D: “Chain of Checks”
Para sa kaligtasan, pagsunod, o pagsunod sa patakaran.
- “Bago sumagot, i-verify ang: (1) pinapayagan ng patakaran, (2) nasa loob ng saklaw, (3) walang kulang na impormasyon. Kung may nabigo, huminto at magtanong ng 1 naglilinaw na tanong.”
Pattern E: “Delta-Edit”
Para sa mga pag-edit sa umiiral na teksto.
- “Ibalik lamang ang minimal na diff: ‘Baguhin ang X sa Y dahil sa Z.’ Panatilihin ang umiiral na estilo. Max 8 pagbabago.”
Pattern F: “Code Scaffold”
- “Bumuo ng isang minimal, runnable baseline na may mga TODOs. Isama ang mga pagsubok. Panatilihin ang mga function ≤30 linya. Magdagdag ng mga docstrings at type hints.”
Mga halimbawa ng mataas na epekto para sa pang-araw-araw na workflows
Pagbubuod ng nilalaman
Prompt:
“Ikaw ay isang maikling analyst. Ibuod ang sumusunod na ulat para sa isang product leader.
- Output: 5 bullets (≤18 salita bawat isa) para sa: resulta, mga panganib, dependencies, susunod na hakbang, metrics.
- Kung kulang ang data, isulat ang ‘unknown’ para sa bullet na iyon.
===
[I-paste ang ulat]
===”
Pagdraft ng email
Prompt:
“Ikaw ay isang propesyonal na assistant. Gumawa ng isang reply na: maikli, mainit, mapagpasyahan. Isama ang: (1) pagpapahalaga, (2) 1 malinaw na desisyon, (3) 1 hiling.
- Max 120 salita. Walang greeting sign-offs; idadagdag ko ang mga ito.”
SQL generation mula sa schema
Prompt:
“Ikaw ay isang SQL assistant. Sa isang Postgres schema, sumulat ng isang query.
- Mga Limitasyon: ANSI SQL, walang CTEs maliban kung kinakailangan, gumamit ng mga indexes kung ipinahiwatig.
- Output: code block lamang. Pagkatapos ay 1-pangungusap na paliwanag.
Schema:
===
[Schema]
===
Gawain: [Tanong]”
Code review
Prompt:
“Ikaw ay isang security-conscious code reviewer.
- Suriin: kawastuhan, seguridad, pagiging madaling basahin, mga pagsubok.
- Output: JSON array ng mga findings na may mga field: severity, file, line, issue, fix.
- Max 6 findings. Kung wala, ibalik ang [].
===
[Diff o file]
===”
RAG question answering
Prompt:
“Ikaw ay isang grounded responder. Gamitin LAMANG ang mga pinagkunan na ibinigay.
- Banggitin ang mga source ID sa brackets tulad ng [S1]. Kung ang sagot ay wala sa mga pinagkunan, sabihin ang ‘hindi nakita sa mga pinagkunan.’
- Output: 2–4 na pangungusap; pagkatapos ay 3 bullets na may label na ‘Citations.’
Sources:
[S1] …
[S2] …
Tanong: …”
Mga rubrics ng pagsusuri upang i-bake sa mga prompt
- Kawastuhan muna: “Parusahan ang mga hindi suportadong pahayag. Mas gusto ang ‘unknown’ kaysa sa panghuhula.”
- Kaigsian: “Ang mga sagot na higit sa 150 tokens ay hindi sumusunod.”
- Istruktura: “Bagsak ang mga sagot na hindi tumutugma sa JSON schema.”
- Kaligtasan: “Tanggihan ang mga gawain na may kasamang mga kredensyal, mga lihim, o PII.”
Mga trick para sa pagiging maaasahan at mababang latency
- Gumamit ng malinaw na mga delimiter (===, <<<json>>>). Pinipigilan ang aksidenteng pagtagas sa pagitan ng mga seksyon.
- I-label ang lahat. Iginagalang ng Haiku 4.5 ang mga label tulad ng [Context], [Policy], [Task], [Output].
- Tukuyin ang mga token budgets: “Target 120–180 tokens; huwag kailanman lumampas sa 220.”
- Mas gusto ang mga simpleng salita. Iwasan ang matalinghagang pananalita maliban kung kinakailangan.
- Iwasan ang mga multi-hop na tagubilin sa isang solong pangungusap; hatiin sa mga may bilang na hakbang.
Mga karaniwang pitfalls—at kung paano ayusin ang mga ito
- Pitfall: Malabong mga layunin.
Ayusin: Ipahayag ang layunin + audience + mga limitasyon.
- Pitfall: Masyadong mahabang konteksto.
Ayusin: Ipasa lamang ang 1–3 pinaka-kaugnay na snippets.
- Pitfall: Hindi nakabalangkas na mga output.
Ayusin: I-mandate ang JSON o bullet schema.
- Pitfall: Mga guni-guning pinagmulan.
Ayusin: Ituro: “Banggitin lamang ang mga ibinigay na pinagmulan; kung hindi, sabihin ang ‘hindi nakita sa mga pinagmulan.’”
- Pitfall: Mga hindi mapagpasyang sagot.
Ayusin: Magbigay ng isang decision rubric at mangailangan ng isang solong pagpipilian.
Advanced: Pagbuo ng isang prompt library para sa Haiku 4.5
- Lumikha ng mga reusable na macros (hal., Tone: Neutral, Output: JSON Schema A, Safety: Basic).
- Bersyon ng mga prompt na may semantic na mga pangalan (email_draft_v3_compact).
- AB-test variants: baguhin ang isang variable sa isang pagkakataon (format vs. tono vs. rubric).
- Magpanatili ng isang “failure museum” ng mga prompt na nagbunga ng masamang resulta at kung bakit.
Kung kailan pipiliin ang Haiku 4.5 vs. mas malalaking modelo
- Piliin ang Haiku 4.5 kapag kailangan mo ng: bilis, pagkontrol sa gastos, high-volume task routing, nakabalangkas na mga output, o iterative loops.
- Pumili ng mas malalaking modelo kapag kailangan mo ng: malalim na multi-hop reasoning, nobelang synthesis sa mga noisy na dokumento, o kumplikadong code generation sa malalaking codebases.
- Hybrid pattern: Gumamit ng Haiku 4.5 upang i-triage, i-chunk, at i-draft; i-escalate ang mga mahirap na kaso sa isang mas malaking modelo.
Sa pagkakataong ito: Kung nag-o-orchestrate ka ng multi-step prompting, ang isang AI workspace na sumusuporta sa mga naka-save na template, multi-turn memory bawat proyekto, at madaling RAG setup ay maaaring lubos na mabawasan ang oras ng pag-ulit. Ang mga tool na nagbibigay-daan sa iyong i-standardize ang mga role, limitasyon, at output schemas sa mga prompt ay tumutulong sa iyong palawakin ang mga pinakamahusay na kasanayang ito sa buong koponan.
Copy-paste prompt templates na maaari mong iakma ngayon
- Ultra-compact brief
“Ikaw ay isang [role]. Layunin: [layunin].
Audience: [audience]. Format: [format]. Haba: [N salita/tokens].
Mga Limitasyon: [mga patakaran].
Ibalik lamang ang panghuling output.”
- Decision memo
“Ikaw ay isang product analyst. Gumawa ng isang decision memo.
Isama ang mga seksyon: Konteksto (2 pangungusap), Mga Opsyon (3 bullets), Mga Panganib (3 bullets), Rekomendasyon (1 talata), Mga susunod na hakbang (3 bullets). Haba ≤180 salita.”
- Linawin-pagkatapos-sumagot
“Ikaw ay isang maingat na assistant. Kung ang gawain ay kulang sa 1 kritikal na impormasyon, magtanong ng 1 naglilinaw na tanong. Kung hindi, sumagot nang direkta sa ≤120 salita.”
- JSON QA checker
“Ikaw ay isang verifier. I-validate ang sumusunod na sagot laban sa tanong.
Ibalik ang JSON: { valid: boolean, reason: string, missing: string[] }.”
- Ligtas na grounded responder
“Ikaw ay grounded. Gamitin lamang ang mga ibinigay na pinagmulan. Kung hindi suportado, sabihin ang ‘unknown.’ Banggitin ang mga source ID sa brackets.”
Mga pangunahing takeaways
- Maging tiyak, hindi mahaba: i-compress ang intensyon at mga limitasyon.
- Nananalo ang istruktura: humiling ng mga schemas, mga listahan, o JSON.
- Limitahan ang pag-iisip: limitahan ang mga hakbang, tokens, at saklaw.
- Mas gusto ang mga exemplar: maikli, naka-target na few-shots.
- Paghiwalayin ang patakaran mula sa gawain: mas mahusay na sumusukat ang mga modular prompts.
- Gumamit ng Haiku 4.5 para sa mga gawaing speed-sensitive, high-volume, at nakabalangkas—at i-escalate lamang kung kinakailangan.
Mga susunod na hakbang
- Gawing prompt templates ang iyong mga gawaing may pinakamataas na frequency.
- Magdagdag ng mga checklist at output schemas sa bawat prompt.
- AB-test ang dalawang bersyon ng bawat prompt sa loob ng isang linggo at gamitin ang panalo.
- Bumuo ng isang magaan na “prompt library” na maaaring magamit muli ng iyong buong koponan.
FAQ
Q1:Anong mga prompts ang pinakamahusay na gumagana sa Claude Haiku 4.5?
Maikli, tiyak na mga prompt na may malinaw na mga role, limitasyon, at nakabalangkas na mga output. Gumamit ng mga checklist, limitasyon sa hakbang, at JSON schemas upang mapataas ang accuracy at consistency.
Q2:Paano ko mababawasan ang mga hallucinations sa Haiku 4.5?
I-ground ang modelo gamit lamang ang nangungunang mga nauugnay na snippets at mangailangan ng mga citations mula sa mga ibinigay na pinagmulan. Kung kulang ang ebidensya, ituro ito upang sabihin ang “unknown.”
Q3:Dapat ba akong gumamit ng few-shot examples sa Haiku 4.5?
Oo—magbigay ng 1–2 compact exemplars na tumutugma sa iyong ninanais na estilo at istraktura. Panatilihing domain-specific ang mga halimbawa at mas maikli kaysa sa iyong inaasahang mga output.
Q4:Kailan ko dapat piliin ang Haiku 4.5 sa isang mas malaking modelo?
Piliin ang Haiku 4.5 para sa mabilis, cost-sensitive na mga gawain na nakikinabang mula sa istraktura: pagbubuod, RAG answers, code review checklists, at pagdraft. Gumamit ng mas malalaking modelo para sa mas malalim na multi-hop reasoning.
Q5:Ano ang ideal na format ng output para sa automation workflows?
JSON o mahigpit na nakabalangkas na bullets. Tukuyin ang eksaktong mga keys, mga limitasyon sa haba, at mga panuntunan sa pagsunod upang ang mga output ay maayos na mailagay sa mga downstream system.