Introdução: A arte de solicitar a um modelo pequeno, porém poderoso
Se você sempre desejou que sua IA se parecesse mais com um companheiro de equipe de raciocínio rápido do que com um consultor lento e prolixo, Claude Haiku 4.5 é o seu modelo. Ele foi projetado para velocidade, baixa latência e baixo custo – ideal para iteração rápida, cargas de trabalho de alto volume e loops de feedback apertados. Mas aqui está o truque: obter resultados excepcionais do Haiku 4.5 não se trata de escrever prompts mais longos. Trata-se de escrever prompts mais nítidos. Neste guia, vamos descompactar estratégias de prompt que produzem consistentemente saídas nítidas e confiáveis do Claude Haiku 4.5 – e mostrar como adaptá-las a tudo, desde codificação até geração de conteúdo e análise leve.
O que torna o Claude Haiku 4.5 diferente – e por que isso é importante para o prompting
Claude Haiku 4.5 está na camada de “modelo pequeno”, construído para velocidade e escala, mantendo um forte raciocínio para tarefas cotidianas. Isso muda a forma como você solicita:
- Você obterá os melhores resultados com instruções estruturadas e explícitas.
- Prompts curtos e de alto sinal superam os longos e sinuosos.
- O raciocínio limitado por etapas (“pense passo a passo em 3 a 5 etapas”) ajuda a mantê-lo focado.
- É ótimo para rascunhos rápidos, andaimes e suporte à decisão com restrições claras.
O Haiku 4.5 foi projetado para ser econômico em escala, o que o torna perfeito para orquestrar fluxos de trabalho de várias etapas, transformações de conteúdo em massa e geração aumentada de recuperação (RAG) onde a latência é importante.
Observação de estilo: este artigo usa uma abordagem prática e orientada para soluções – otimizada para uso imediato em projetos reais.
As regras de ouro para prompts do Claude Haiku 4.5
- Escreva o prompt mais curto que ainda remove a ambiguidade
- Ruim: “Resuma este relatório.”
- Melhor: “Resuma este relatório para um gerente de produto. 5 marcadores. Inclua: riscos, dependências, próximas etapas. Máximo de 120 palavras.”
Por que funciona: o Haiku 4.5 prospera quando suas restrições são nítidas. Especifique o público, o formato, a duração e quaisquer elementos obrigatórios.
- Mantenha as funções e os objetivos explícitos na configuração no estilo do sistema
- Exemplo: “Você é um assistente técnico conciso. Objetivos: (1) responder com precisão, (2) minimizar tokens, (3) mostrar um esboço de raciocínio de 3 etapas somente quando solicitado.”
Por que funciona: uma função + objetivos claros orientam a decodificação, reduzem o desvio e melhoram a repetibilidade entre as chamadas.
- Prefira listas de verificação em vez de frases abertas
- Exemplo para revisão de código: “Revisar para: (a) correção, (b) segurança, (c) legibilidade, (d) cobertura de teste. Saída: aprovação/reprovação por item com justificativa de 1 a 2 linhas.”
Por que funciona: as listas de verificação compactam tarefas complexas em subtarefas confiáveis e verificáveis.
- Use o pensamento limitado por etapas
- Exemplo: “Pense em até 4 etapas e, em seguida, apresente apenas uma resposta final.”
Por que funciona: você obtém um raciocínio focado sem verbosidade descontrolada.
- Exija saídas estruturadas (sempre!)
- Exemplo: “Retorne JSON com as chaves: decision, rationale, risks, next_steps. Sem texto extra.”
Por que funciona: a estrutura permite a automação downstream, evita o excesso e mantém os custos previsíveis.
- Ancore o modelo com exemplares
- Exemplos de few-shot devem ser: curtos, representativos e em conformidade com o estilo desejado.
- Padrão: Instrução → 1–2 exemplares compactos → Nova entrada.
- Dica: mantenha os exemplares específicos do domínio (por exemplo, a voz da sua marca, seu estilo de código).
- Restrinja o tom, o comprimento e o formato
- “Tom: neutro-profissional.”
- “Comprimento: 80–120 palavras.”
- “Formato: 5 marcadores, cada um ≤18 palavras.”
- Para código: “Alvo: Python 3.11, Pydantic v2. Use dicas de tipo. Inclua um teste de 1 bloco.”
- Ensine-o a dizer “Eu não sei”
- Adicione: “Se faltarem dados ou houver ambiguidade, faça primeiro uma única pergunta para esclarecer. Se ainda estiver incerto, diga 'desconhecido'.”
Por que funciona: reduz respostas erradas confiantes e mantém os loops eficientes.
- Use a recuperação e passe trechos relevantes, não corpos inteiros
- Forneça apenas os 1–3 blocos relevantes principais.
- Pré-corte o clichê para maximizar a densidade do sinal.
- Rotule os trechos: [Política], [Excerto], [E-mail], [Especificação].
- Separe a política da tarefa
- Política: “Nunca produza PII, mantenha menos de 150 tokens, cite as fontes se fornecidas.”
- Tarefa do usuário: “Resuma a cadeia de e-mail para o lead de vendas.”
Por que funciona: arquitetura de prompt mais limpa, manutenção mais fácil.
Padrões de prompt que funcionam consistentemente
Padrão A: O “Briefing Preciso”
Use quando precisar de velocidade e consistência para tarefas de rotina.
Modelo:
- Função: “Você é um(a) [função].”
- Objetivo: “Seu objetivo é [objetivo].”
- Restrições: público, duração, tom, formato.
- Rubrica de avaliação: 2–4 critérios de marcadores.
- Delimitador de entrada: “A entrada começa/termina com ===.”
- Esquema de saída: “Retorne [formato]. Sem texto extra.”
Padrão B: “Criticar e depois Criar”
Para rascunhos de maior qualidade com tokens extras mínimos.
- Etapa 1 (interna): “Avalie silenciosamente a relevância, as lacunas e os riscos em 3 marcadores.”
- Etapa 2 (saída): “Produza o rascunho que resolve esses problemas.”
- Para manter a saída limpa, especifique: “Não mostre a crítica; apenas aplique-a.”
Padrão C: “Comparar e Escolher”
Use quando a seleção for a tarefa.
- “Dadas as opções A–D, pontue em: precisão (40), clareza (30), conformidade (30). Retorne o vencedor e um justificativa de 2 frases.”
Padrão D: “Cadeia de Verificações”
Para segurança, conformidade ou adesão à política.
- “Antes de responder, verifique: (1) permitido pela política, (2) dentro do escopo, (3) sem informações ausentes. Se algum falhar, pare e faça 1 pergunta para esclarecer.”
Padrão E: “Delta-Edit”
Para edições em texto existente.
- “Retorne apenas a diferença mínima: ‘Altere X para Y porque Z.’ Mantenha o estilo existente. Máximo de 8 alterações.”
Padrão F: “Andaime de Código”
- “Gere uma linha de base mínima e executável com TODOs. Inclua testes. Mantenha as funções ≤30 linhas. Adicione docstrings e dicas de tipo.”
Exemplos de alto impacto para fluxos de trabalho diários
Resumo de conteúdo
Prompt:
“Você é um analista conciso. Resuma o seguinte relatório para um líder de produto.
- Saída: 5 marcadores (≤18 palavras cada) para: resultado, riscos, dependências, próximas etapas, métricas.
- Se faltarem dados, escreva 'desconhecido' para esse marcador.
===
[Colar relatório]
===”
Rascunho de e-mail
Prompt:
“Você é um assistente profissional. Elabore uma resposta que seja: breve, calorosa, decisiva. Inclua: (1) agradecimento, (2) 1 decisão clara, (3) 1 pedido.
- Máximo de 120 palavras. Sem assinaturas de saudação; eu os adicionarei.”
Geração de SQL a partir do esquema
Prompt:
“Você é um assistente de SQL. Dado um esquema Postgres, escreva uma única consulta.
- Restrições: ANSI SQL, sem CTEs, a menos que necessário, use índices onde estiverem implícitos.
- Saída: bloco de código apenas. Em seguida, explicação de 1 frase.
Esquema:
===
[Esquema]
===
Tarefa: [Pergunta]”
Revisão de código
Prompt:
“Você é um revisor de código preocupado com a segurança.
- Verifique: correção, segurança, legibilidade, testes.
- Saída: matriz JSON de descobertas com os campos: gravidade, arquivo, linha, problema, correção.
- Máximo de 6 descobertas. Se nenhum, retorne [].
===
[Diff ou arquivo]
===”
Perguntas e respostas do RAG
Prompt:
“Você é um respondedor fundamentado. Use APENAS as fontes fornecidas.
- Cite os IDs das fontes entre colchetes como [S1]. Se a resposta não estiver nas fontes, diga 'não encontrado nas fontes'.
- Saída: 2–4 frases; então 3 marcadores rotulados como 'Citações'.
Fontes:
[S1] …
[S2] …
Pergunta: …”
Rubricas de avaliação para integrar aos prompts
- Precisão primeiro: “Punir alegações não suportadas. Prefira 'desconhecido' em vez de adivinhar.”
- Brevidade: “Respostas com mais de 150 tokens são não conformes.”
- Estrutura: “Falhar nas respostas que não correspondem ao esquema JSON.”
- Segurança: “Rejeitar tarefas que incluam credenciais, segredos ou PII.”
Truques para confiabilidade e baixa latência
- Use delimitadores explícitos (===, <<<json>>>). Impede o sangramento acidental entre as seções.
- Rotule tudo. O Haiku 4.5 respeita rótulos como [Contexto], [Política], [Tarefa], [Saída].
- Especifique orçamentos de token: “Alvo 120–180 tokens; nunca exceda 220.”
- Prefira palavras simples. Evite linguagem figurativa, a menos que necessário.
- Evite instruções de vários saltos em uma única frase; divida em etapas numeradas.
Armadilhas comuns — e como corrigi-las
- Armadilha: metas vagas.
Correção: Declare o objetivo + público + restrições.
- Armadilha: contexto excessivamente longo.
Correção: Passe apenas os 1–3 trechos mais relevantes.
- Armadilha: saídas não estruturadas.
Correção: Exija JSON ou esquema de marcadores.
- Armadilha: fontes alucinadas.
Correção: Instrua: “Cite apenas as fontes fornecidas; caso contrário, diga 'não encontrado nas fontes'.”
- Armadilha: respostas indecisas.
Correção: Forneça uma rubrica de decisão e exija uma única escolha.
Avançado: Construindo uma biblioteca de prompts para Haiku 4.5
- Crie macros reutilizáveis (por exemplo, Tom: Neutro, Saída: Esquema JSON A, Segurança: Básico).
- Versione os prompts com nomes semânticos (email_draft_v3_compact).
- Variantes de teste AB: altere uma variável por vez (formato vs. tom vs. rubrica).
- Mantenha um “museu de falhas” de prompts que produziram resultados ruins e por quê.
Quando escolher Haiku 4.5 em vez de modelos maiores
- Escolha Haiku 4.5 quando precisar de: velocidade, controle de custos, roteamento de tarefas de alto volume, saídas estruturadas ou loops iterativos.
- Escolha modelos maiores quando precisar de: raciocínio profundo de vários saltos, síntese inovadora em documentos ruidosos ou geração de código complexo em grandes bases de código.
- Padrão híbrido: use Haiku 4.5 para triagem, divisão e rascunho; encaminhe casos difíceis para um modelo maior.
A propósito: se você estiver orquestrando prompts de várias etapas, um espaço de trabalho de IA que suporte modelos salvos, memória de várias etapas por projeto e configuração fácil de RAG pode reduzir drasticamente o tempo de iteração. Ferramentas que permitem padronizar funções, restrições e esquemas de saída em prompts ajudam você a dimensionar essas práticas recomendadas em toda a equipe.
Modelos de prompt de copiar e colar que você pode adaptar hoje
- Briefing ultracompacto
“Você é um(a) [função]. Objetivo: [objetivo].
Público: [público]. Formato: [formato]. Comprimento: [N palavras/tokens].
Restrições: [regras].
Retorne apenas a saída final.”
- Memorando de decisão
“Você é um analista de produto. Elabore um memorando de decisão.
Inclua as seções: Contexto (2 frases), Opções (3 marcadores), Riscos (3 marcadores), Recomendação (1 parágrafo), Próximas etapas (3 marcadores). Comprimento ≤180 palavras.”
- Esclarecer e depois responder
“Você é um assistente cuidadoso. Se a tarefa carecer de 1 informação crítica, faça 1 pergunta para esclarecer. Caso contrário, responda diretamente em ≤120 palavras.”
- Verificador de QA JSON
“Você é um verificador. Valide a seguinte resposta em relação à pergunta.
Retorne JSON: { valid: boolean, reason: string, missing: string[] }.”
- Respondente fundamentado seguro
“Você é fundamentado. Use apenas as fontes fornecidas. Se não for suportado, diga 'desconhecido'. Cite os IDs das fontes entre colchetes.”
Principais conclusões
- Seja específico, não longo: comprima a intenção e as restrições.
- A estrutura vence: exija esquemas, listas ou JSON.
- Limite o pensamento: limite as etapas, os tokens e o escopo.
- Prefira exemplares: poucos disparos curtos e direcionados.
- Separe a política da tarefa: prompts modulares dimensionam melhor.
- Use o Haiku 4.5 para tarefas estruturadas, de alto volume e sensíveis à velocidade — e encaminhe apenas quando necessário.
Próximas etapas
- Transforme suas tarefas de maior frequência em modelos de prompt.
- Adicione listas de verificação e esquemas de saída a cada prompt.
- Teste AB em duas versões de cada prompt por uma semana e adote o vencedor.
- Construa uma “biblioteca de prompts” leve para toda a sua equipe reutilizar.
FAQ
Q1:Quais prompts funcionam melhor com Claude Haiku 4.5?
Prompts curtos e específicos com funções, restrições e saídas estruturadas explícitas. Use listas de verificação, limites de etapas e esquemas JSON para aumentar a precisão e a consistência.
Q2:Como reduzo as alucinações com o Haiku 4.5?
Fundamente o modelo apenas com os principais trechos relevantes e exija citações das fontes fornecidas. Se a evidência estiver faltando, instrua-o a dizer “desconhecido”.
Q3:Devo usar exemplos de few-shot com o Haiku 4.5?
Sim — forneça 1–2 exemplares compactos que correspondam ao estilo e estrutura desejados. Mantenha os exemplos específicos do domínio e mais curtos do que as saídas esperadas.
Q4:Quando devo escolher Haiku 4.5 em vez de um modelo maior?
Escolha Haiku 4.5 para tarefas rápidas e sensíveis a custos que se beneficiam da estrutura: resumo, respostas RAG, listas de verificação de revisão de código e elaboração. Use modelos maiores para raciocínio mais profundo de vários saltos.
Q5:Qual é o formato de saída ideal para fluxos de trabalho de automação?
JSON ou marcadores rigidamente estruturados. Defina chaves exatas, limites de comprimento e regras de conformidade para que as saídas se encaixem perfeitamente nos sistemas downstream.