Introducció: L'art de fer prompts a un model petit però potent
Si mai has desitjat que la teva IA se sentís més com un company d'equip de pensament ràpid que com un consultor lent i verbós, Claude Haiku 4.5 és el teu model. Està dissenyat per a la velocitat, la baixa latència i l'eficiència de costos, ideal per a la iteració ràpida, les càrregues de treball d'alt volum i els bucles de retroalimentació ajustats. Però aquí hi ha el truc: obtenir resultats excepcionals de Haiku 4.5 no es tracta d'escriure prompts més llargs. Es tracta d'escriure'ls més precisos. En aquesta guia, desglossarem estratègies de prompt que produeixen constantment resultats nítids i fiables de Claude Haiku 4.5, i et mostrarem com adaptar-los a tot, des de la codificació fins a la generació de contingut i l'anàlisi lleugera.
Què fa que Claude Haiku 4.5 sigui diferent i per què és important per als prompts
Claude Haiku 4.5 se situa en el nivell de "model petit", creat per a la velocitat i l'escala tot conservant un raonament sòlid per a les tasques diàries. Això canvia la manera de fer els prompts:
- Obtindràs els millors resultats amb instruccions estructurades i explícites.
- Els prompts curts i d'alt senyal superen els llargs i serpentejants.
- El raonament limitat per passos ("pensa pas a pas en 3-5 passos") l'ajuda a mantenir-se enfocat.
- És ideal per a esborranys ràpids, scaffolding i suport de decisions amb restriccions clares.
Haiku 4.5 està dissenyat per ser rendible a escala, cosa que el fa perfecte per orquestrar fluxos de treball de múltiples torns, transformacions de contingut massives i generació augmentada per recuperació (RAG) on la latència importa.
Nota d'estil: aquest article utilitza un enfocament pràctic i orientat a solucions, optimitzat per a un ús immediat en projectes reals.
Les regles d'or per als prompts de Claude Haiku 4.5
- Escriu el prompt més curt que encara elimini l'ambigüitat
- Dolent: "Resumeix aquest informe."
- Millor: "Resumeix aquest informe per a un gestor de producte. 5 punts. Inclou: riscos, dependències, passos següents. Màxim 120 paraules." Per què funciona: Haiku 4.5 prospera quan les teves restriccions són nítides. Especifica l'audiència, el format, la longitud i qualsevol element imprescindible.
- Mantén els rols i els objectius explícits en la configuració d'estil de sistema
- Exemple: "Ets un assistent tècnic concís. Objectius: (1) respondre amb precisió, (2) minimitzar els tokens, (3) mostrar un esquema de raonament de 3 passos només quan se sol·liciti." Per què funciona: un rol clar + objectius guia la descodificació, redueix la deriva i millora la repetibilitat entre les trucades.
- Prefereix les llistes de verificació a la redacció oberta
- Exemple per a la revisió de codi: "Revisa per: (a) correcció, (b) seguretat, (c) llegibilitat, (d) cobertura de proves. Sortida: aprovat/suspès per element amb justificació d'1-2 línies." Per què funciona: les llistes de verificació comprimeixen tasques complexes en subtasques fiables i verificables.
- Utilitza el pensament limitat per passos
- Exemple: "Pensa en un màxim de 4 passos, després presenta només una resposta final." Per què funciona: obtens un raonament enfocat sense verbositat descontrolada.
- Exigeix sortides estructurades (sempre!)
- Exemple: "Retorna JSON amb claus: decision, rationale, risks, next_steps. Sense text addicional." Per què funciona: l'estructura permet l'automatització posterior, evita la palla i manté els costos predictibles.
- Ancoreu el model amb exemplars
- Els exemples de pocs trets haurien de ser: curts, representatius i conformes al teu estil desitjat.
- Patró: Instrucció → 1-2 exemplars compactes → Nova entrada.
- Consell: Mantén els exemplars específics del domini (p. ex., la veu de la teva marca, el teu estil de codi).
- Restringeix el to, la longitud i el format
- "To: neutral-professional."
- "Longitud: 80-120 paraules."
- "Format: 5 punts, cadascun ≤18 paraules."
- Per al codi: "Objectiu: Python 3.11, Pydantic v2. Utilitza indicacions de tipus. Inclou una prova d'1 bloc."
- Ensenya-li a dir "No ho sé"
- Afegeix: "Si falten dades o hi ha ambigüitat, fes primer una única pregunta aclaridora. Si encara no estàs segur, digues 'desconegut'." Per què funciona: redueix les respostes incorrectes segures i manté els bucles eficients.
- Utilitza la recuperació i passa fragments rellevants, no corpus sencers
- Proporciona només els 1-3 fragments rellevants principals.
- Pre-retalla la plantilla per maximitzar la densitat del senyal.
- Etiqueta els fragments: [Política], [Fragment], [Correu electrònic], [Especificació].
- Separa la política de la tasca
- Política: "No emetis mai PII, mantén-te per sota de 150 tokens, cita les fonts si es proporcionen."
- Tasca de l'usuari: "Resumeix la cadena de correu electrònic per al responsable de vendes." Per què funciona: arquitectura de prompt més neta, manteniment més fàcil.
Patrons de prompt que funcionen constantment
Patró A: El "Brief Ajustat"
Utilitza'l quan necessitis velocitat i consistència per a tasques rutinàries.
Plantilla:
- Objectiu: "El teu objectiu és [objectiu]."
- Restriccions: audiència, longitud, to, format.
- Rúbrica d'avaluació: 2-4 criteris de punts.
- Delimitador d'entrada: "L'entrada comença/acaba amb ===."
- Esquema de sortida: "Retorna [format]. Sense text addicional."
Patró B: "Critica i després Crea"
Per a esborranys de més qualitat amb un mínim de tokens addicionals.
- Pas 1 (intern): "Avalua silenciosament la rellevància, les llacunes i els riscos en 3 punts."
- Pas 2 (sortida): "Produeix l'esborrany que resol aquests problemes."
- Per mantenir la sortida neta, especifica: "No mostris la crítica; només aplica-la."
Patró C: "Compara i Escull"
Utilitza'l quan la selecció és la tasca.
- "Donades les opcions A-D, puntua en: precisió (40), claredat (30), compliment (30). Retorna el guanyador i una justificació de 2 frases."
Patró D: "Cadena de Verificacions"
Per a seguretat, compliment o adhesió a la política.
- "Abans de respondre, verifica: (1) permès per la política, (2) dins de l'àmbit, (3) sense informació que falta. Si algun falla, atura't i fes 1 pregunta aclaridora."
Patró E: "Delta-Edita"
Per a edicions al text existent.
- "Retorna només la diferència mínima: 'Canvia X a Y perquè Z.' Mantén l'estil existent. Màxim 8 canvis."
Patró F: "Scaffold de Codi"
- "Genera una línia de base mínima i executable amb TODOs. Inclou proves. Mantén les funcions ≤30 línies. Afegeix docstrings i indicacions de tipus."
Exemples d'alt impacte per a fluxos de treball diaris
Resum de contingut
Prompt:
"Ets un analista concís. Resumeix el següent informe per a un líder de producte.
- Sortida: 5 punts (≤18 paraules cadascun) per a: resultat, riscos, dependències, passos següents, mètriques.
- Si falten dades, escriu 'desconegut' per a aquest punt.
===
[Enganxa l'informe]
==="
Redacció de correu electrònic
Prompt:
"Ets un assistent professional. Redacta una resposta que sigui: breu, càlida, decisiva. Inclou: (1) agraïment, (2) 1 decisió clara, (3) 1 petició.
- Màxim 120 paraules. Sense salutacions de tancament; les afegiré."
Generació SQL a partir de l'esquema
Prompt:
"Ets un assistent SQL. Donat un esquema de Postgres, escriu una única consulta.
- Restriccions: ANSI SQL, sense CTEs tret que sigui necessari, utilitza índexs on s'impliqui.
- Sortida: bloc de codi només. Després explicació d'1 frase.
Esquema:
===
[Esquema]
===
Tasca: [Pregunta]"
Revisió de codi
Prompt:
"Ets un revisor de codi conscient de la seguretat.
- Comprova: correcció, seguretat, llegibilitat, proves.
- Sortida: Matriu JSON de troballes amb camps: severitat, fitxer, línia, problema, solució.
- Màxim 6 troballes. Si no n'hi ha cap, retorna [].
===
[Diff o fitxer]
==="
Pregunta i resposta RAG
Prompt:
"Ets un respondedor fonamentat. Utilitza NOMÉS les fonts proporcionades.
- Cita els ID de la font entre claudàtors com [S1]. Si la resposta no està a les fonts, digues 'no trobat a les fonts'.
- Sortida: 2-4 frases; després 3 punts etiquetats 'Cites.'
Fonts:
[S1] …
[S2] …
Pregunta: …"
Rúbriques d'avaluació per integrar en els prompts
- Precisió primer: "Penalitza les afirmacions no admeses. Prefereix 'desconegut' a endevinar."
- Brevitat: "Les respostes de més de 150 tokens no són conformes."
- Estructura: "Suspèn les respostes que no coincideixin amb l'esquema JSON."
- Seguretat: "Rebutja les tasques que incloguin credencials, secrets o PII."
Trucs per a la fiabilitat i la baixa latència
- Utilitza delimitadors explícits (===, <<<json>>>). Evita el sagnat accidental entre seccions.
- Etiqueta-ho tot. Haiku 4.5 respecta les etiquetes com [Context], [Política], [Tasca], [Sortida].
- Especifica pressupostos de tokens: "Objectiu 120-180 tokens; mai superis els 220."
- Prefereix paraules senzilles. Evita el llenguatge figurat tret que sigui necessari.
- Evita les instruccions de diversos salts en una sola frase; divideix-les en passos numerats.
Errors comuns i com solucionar-los
- Error: Objectius vagues.
Solució: Indica l'objectiu + l'audiència + les restriccions.
- Error: Context massa llarg.
Solució: Passa només els 1-3 fragments més rellevants.
- Error: Sortides no estructurades.
Solució: Obliga l'esquema JSON o de punts.
- Error: Fonts al·lucinades.
Solució: Instrucció: "Cita només les fonts proporcionades; en cas contrari, digues 'no trobat a les fonts'."
- Error: Respostes indecises.
Solució: Proporciona una rúbrica de decisió i requereix una única elecció.
Avançat: Construcció d'una biblioteca de prompts per a Haiku 4.5
- Crea macros reutilitzables (p. ex., To: Neutral, Sortida: Esquema JSON A, Seguretat: Bàsica).
- Versions de prompts amb noms semàntics (email_draft_v3_compact).
- Variants de prova AB: canvia una variable alhora (format vs. to vs. rúbrica).
- Mantén un "museu de fracassos" de prompts que van produir mals resultats i per què.
Quan triar Haiku 4.5 vs. models més grans
- Tria Haiku 4.5 quan necessitis: velocitat, control de costos, encaminament de tasques d'alt volum, sortides estructurades o bucles iteratius.
- Tria models més grans quan necessitis: raonament profund de diversos salts, síntesi nova entre documents sorollosos o generació de codi complexa a través de grans bases de codi.
- Patró híbrid: Utilitza Haiku 4.5 per a la selecció, la divisió i la redacció; augmenta els casos difícils a un model més gran.
Per cert: Si estàs orquestrant prompts de diversos passos, un espai de treball d'IA que admeti plantilles desades, memòria de múltiples torns per projecte i una configuració RAG fàcil pot reduir dràsticament el temps d'iteració. Les eines que et permeten estandarditzar els rols, les restriccions i els esquemes de sortida entre els prompts t'ajuden a escalar aquestes pràctiques recomanades a tot l'equip.
Plantilles de prompt de copiar i enganxar que pots adaptar avui
- Brief ultracompacte
"Ets un [rol]. Objectiu: [objectiu].
Audiència: [audiència]. Format: [format]. Longitud: [N paraules/tokens].
Restriccions: [regles].
Retorna només la sortida final."
- Nota de decisió
"Ets un analista de producte. Redacta una nota de decisió.
Inclou seccions: Context (2 frases), Opcions (3 punts), Riscos (3 punts), Recomanació (1 paràgraf), Pasos següents (3 punts). Longitud ≤180 paraules."
- Aclareix i després respon
"Ets un assistent atent. Si la tasca manca d'1 element d'informació crític, fes 1 pregunta aclaridora. En cas contrari, respon directament en ≤120 paraules."
- Comprovador de control de qualitat JSON
"Ets un verificador. Valida la següent resposta amb la pregunta.
Retorna JSON: { valid: boolean, reason: string, missing: string[] }."
- Responedor fonamentat segur
"Estàs fonamentat. Utilitza només les fonts proporcionades. Si no està admès, digues 'desconegut'. Cita els ID de la font entre claudàtors."
Conclusions clau
- Sigues específic, no llarg: comprimeix la intenció i les restriccions.
- L'estructura guanya: exigeix esquemes, llistes o JSON.
- Limita el pensament: limita els passos, els tokens i l'àmbit.
- Prefereix els exemplars: pocs trets curts i orientats.
- Separa la política de la tasca: els prompts modulars s'escalen millor.
- Utilitza Haiku 4.5 per a tasques sensibles a la velocitat, d'alt volum i estructurades, i augmenta només quan sigui necessari.
Pasos següents
- Converteix les teves tasques de més freqüència en plantilles de prompt.
- Afegeix llistes de verificació i esquemes de sortida a cada prompt.
- Prova AB de dues versions de cada prompt durant una setmana i adopta el guanyador.
- Construeix una "biblioteca de prompts" lleugera que tot el teu equip pugui reutilitzar.
Preguntes freqüents
P1:Quins prompts funcionen millor amb Claude Haiku 4.5?
Prompts curts i específics amb rols explícits, restriccions i sortides estructurades. Utilitza llistes de verificació, límits de passos i esquemes JSON per augmentar la precisió i la consistència.
P2:Com redueixo les al·lucinacions amb Haiku 4.5?
Fonamenta el model només amb els fragments rellevants principals i requereix cites de les fonts proporcionades. Si falta evidència, indica-li que digui "desconegut".
P3:Hauria d'utilitzar exemples de pocs trets amb Haiku 4.5?
Sí: proporciona 1-2 exemplars compactes que coincideixin amb el teu estil i estructura desitjats. Mantén els exemples específics del domini i més curts que les teves sortides esperades.
P4:Quan hauria de triar Haiku 4.5 en lloc d'un model més gran?
Tria Haiku 4.5 per a tasques ràpides i sensibles als costos que es beneficiïn de l'estructura: resum, respostes RAG, llistes de verificació de revisió de codi i redacció. Utilitza models més grans per a un raonament més profund de diversos salts.
P5:Quin és el format de sortida ideal per als fluxos de treball d'automatització?
JSON o punts estretament estructurats. Defineix les claus exactes, els límits de longitud i les regles de compliment perquè les sortides s'introdueixin perfectament en els sistemes posteriors.