Sider.ai
  • Chat
  • Wisebase
  • Ferramentas
  • Extensão
  • Clientes
  • Preços
Baixe Agora
Conecte-se

Aprenda mais rápido, pense mais profundamente e cresça de forma mais inteligente com o Sider.

Produtos
Aplicativos
  • Extensões
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Ferramentas
  • Criador de SitesNew
  • Slides de IANew
  • Redator de Ensaios com IA
  • Nano Banana Pro
  • Nano Banana Infographic
  • Gerador de Imagens com IA
  • Gerador de Brainrot Italiano
  • Removedor de Fundo
  • Trocador de Fundo
  • Borracha de Fotos
  • Removedor de Texto
  • Inpaint
  • Aprimorador de Imagem
  • Criar
  • Tradutor com IA
  • Tradutor de Imagens
  • Tradutor de PDF
Sider
  • Contate-nos
  • Central de Ajuda
  • Baixar
  • Preços
  • Plano de Educação
  • Novidades
  • Blog
  • Comunidade
  • Parceiros
  • Afiliado
  • Convidar
©2026 Todos os Direitos Reservados
Termos de Uso
Política de Privacidade
  • Página inicial
  • Blogue
  • Ferramentas de IA
  • Como Usar o ComfyUI: Um Guia Prático e Passo a Passo para Iniciantes

Como Usar o ComfyUI: Um Guia Prático e Passo a Passo para Iniciantes

Atualizado em 24 de set de 2025

9 min


Como Usar o ComfyUI: Um Guia Prático e Passo a Passo para Iniciantes

Se você já ouviu dizer que o ComfyUI é “baseado em nós e super poderoso”, mas se sentiu intimidado por todas as caixas e fios, você não está sozinho. A boa notícia: depois de aprender alguns conceitos básicos – checkpoints, encoders, samplers e decoders – você estará construindo fluxos de trabalho de imagem como um profissional. Este guia prático explica como usar o ComfyUI desde a instalação até suas primeiras imagens SDXL, além de fluxos de trabalho para ControlNet, LoRAs e ajuste de qualidade/desempenho.
Ao final, você saberá exatamente como usar o ComfyUI para fazer gerações de imagens consistentes, repetíveis e flexíveis, sem adivinhação.

O Que É ComfyUI e Por Que Usá-lo?

ComfyUI é uma interface visual, baseada em nós para Stable Diffusion que permite que você projete seu pipeline de imagem passo a passo. Em vez de um único botão “Gerar”, você conecta nós – cada um lidando com uma tarefa distinta, como carregar um modelo, codificar texto, amostrar latentes ou decodificar a imagem final. É rápido, modular e transparente – perfeito para aprendizado, experimentação e fluxos de trabalho de produção.

Início Rápido: Instale e Execute o ComfyUI

  • Windows/macOS/Linux: Siga o repositório oficial e os guias de instalação da comunidade. Você pode usar a instalação manual (Python + dependências) ou métodos empacotados, dependendo da sua plataforma e GPU. O wiki do ComfyUI fornece a configuração passo a passo para Windows, macOS (incluindo Apple Silicon) e Linux.
  • Modelos: Coloque seus checkpoints do Stable Diffusion (por exemplo, SDXL base/refiner ou SD 1.5) na pasta models/checkpoints. Coloque os arquivos VAE em models/vae, LoRAs em models/loras, modelos ControlNet em models/controlnet.
  • Execução: Execute o script de início para seu SO; o ComfyUI é aberto em seu navegador. A tela é onde você conectará os nós.
Dica: Mantenha seus drivers de GPU e o kit de ferramentas CUDA atualizados para obter o melhor desempenho.

Conceito Básico: O Fluxo de Trabalho Mínimo de Texto para Imagem

O fluxo básico de texto para imagem do ComfyUI (estilo SD 1.5) se parece com isto:
  1. Carregue o modelo
  • Nó: Checkpoint Loader
  • Saída: Componentes UNet, CLIP e VAE
  1. Codifique prompts
  • Nó: CLIP Text Encode (Positive)
  • Nó: CLIP Text Encode (Negative)
  • Saída: Incorporações de condicionamento para orientação
  1. Gere latentes
  • Nó: KSampler
  • Entradas: UNet, condicionamento positivo/negativo, seed, steps, sampler (por exemplo, DPM++ 2M Karras) e escala CFG
  • Saída: Imagem latente
  1. Decodifique a imagem
  • Nó: VAE Decode
  • Saída: Imagem
  1. Salve a saída
  • Nó: Save Image
Este gráfico básico – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – é a base para quase tudo que você fará no ComfyUI.

Fluxo de Trabalho SDXL: Base + (Opcional) Refinador

O SDXL usa codificadores de texto duplos e geralmente se beneficia de uma passagem de refinador.
  • Carregue a Base SDXL: Use um checkpoint compatível com SDXL. Muitos modelos SDXL incluem dois codificadores CLIP (para contexto grande/pequeno). Alimente prompts positivos e negativos.
  • KSampler (Base): Gere latentes em 1024×1024 (ou seu alvo). Salve latentes ou imagens decodificadas.
  • Refinador Opcional: Carregue o checkpoint do Refinador SDXL e execute uma passagem KSampler adicional condicionada na saída base e, em seguida, decodifique com VAE.
Este processo de dois estágios pode melhorar significativamente os detalhes e a coerência em resoluções mais altas.

Mão na Massa: Construa Seu Primeiro Gráfico ComfyUI

  • Comece com um modelo: Na barra lateral, carregue um exemplo integrado de texto para imagem.
  • Substitua o checkpoint: Selecione seu modelo SDXL ou SD 1.5.
  • Escreva seu prompt: Use os nós CLIP Positivo e Negativo. Exemplo:
  • Positivo: “retrato cinematográfico, iluminação suave de estúdio, lente de 85mm, altamente detalhado, granulação de filme”
  • Negativo: “embaçado, baixa resolução, deformado, dedos extras, marca d'água”
  • Configurações do KSampler:
  • Steps: 20–35 para equilíbrio de velocidade/qualidade
  • Sampler: DPM++ 2M Karras (confiável) ou Euler a (rápido)
  • CFG: 4,5–7,5 (quanto mais alto, mais o prompt é forçado, mas pode sobresaturar)
  • Seed: Corrija para reprodutibilidade; varie para exploração
  • Resolução: Para SD 1.5, comece em 512×512 ou 768×768. Para SDXL, 1024×1024 funciona bem.
  • Decodifique e Salve: Adicione VAE Decode → Save Image. Clique em Queue Prompt para gerar.

Entendendo os Nós Principais (Em Português Claro)

  • Checkpoint Loader: Carrega seu modelo de difusão (UNet), codificador(es) de texto (CLIP) e VAE. Pense nisso como seu “motor + cérebro de linguagem + tradutor de imagem”.
  • CLIP Text Encode: Converte seu prompt em incorporações numéricas que o modelo entende. Use codificadores de texto positivos e negativos.
  • KSampler: O coração da síntese de imagem. Ele remove o ruído latente guiado pelo seu prompt e método de sampler em um número de steps.
  • VAE Decode: Traduz latentes finais em uma imagem visualizável. Trocar VAEs altera a fidelidade de cor/contraste.
  • Save Image: Escreve a saída no disco com metadados para que você possa recriar os resultados posteriormente.
Para um mergulho mais profundo nesses blocos de construção, veja detalhamentos amigáveis para iniciantes e explicações de nós.

Power-Ups: LoRA, ControlNet e Image-to-Image

Use LoRA para Controle de Estilo ou Assunto

  • Adicione um nó LoRA Loader e conecte-o ao seu branch de modelo.
  • Força: Comece em torno de 0,6–0,8; ajuste com base na intensidade do estilo ou overfitting.
  • LoRAs Múltiplos: Encadear ou mesclar, mas observe os conflitos; diminua as forças ao empilhar.

Adicione ControlNet para Composição Precisa

  • Os nós ControlNet permitem que você direcione a composição usando um mapa de entrada (Canny, Depth, OpenPose, etc.).
  • Fluxo típico: Carregue o modelo ControlNet → Pré-processe sua imagem guia (por exemplo, borda Canny) → Alimente o condicionamento ControlNet no KSampler junto com seu condicionamento de texto.
  • Peso: 0,5–1,2 é um bom começo. Muito alto pode dominar seu prompt.

Image-to-Image ou Inpainting

  • Substitua o ruído inicial por um latente de imagem via VAE Encode.
  • Ajuste a força de denoise no KSampler para controlar o quanto da imagem original permanece.
  • Para inpainting, use uma entrada de máscara e um pipeline de sampler com reconhecimento de inpaint.

Ajuste de Qualidade: Prompts, CFG, Samplers e Seeds

  • Engenharia de prompt: Use descritores concisos, não parágrafos. A ordem importa menos do que a clareza, mas mantenha os atributos críticos na frente.
  • Escala CFG:
  • Baixa (3–5): Mais criativo, menos aderência ao prompt
  • Média (6–8): Equilibrado
  • Alta (9–12): Forte aderência, pode criar artefatos
  • Escolha do sampler:
  • DPM++ 2M Karras: Limpo, confiável
  • Euler a: Rápido e expressivo, ótimo para visualizações
  • UniPC / Heun / DDIM: Vale a pena testar; os resultados variam de acordo com o modelo
  • Seeds:
  • Seed fixo = resultados reproduzíveis
  • Vary seed = explore a diversidade

Dicas de Desempenho para Renders Suaves

  • Orçamento de VRAM: Diminua a resolução, steps ou tamanho do lote se você atingir OOM. SDXL em 1024×1024 pode exigir 8–12 GB de VRAM, dependendo dos nós.
  • Precisão de meia precisão: Ative fp16 onde suportado para grandes economias de memória com perda de qualidade insignificante.
  • Tiling e upscalers latentes: Gere menor, então upscale via um nó upscaler latente ou modelo upscaler de imagem para economizar VRAM.
  • Caching: Reutilize codificações CLIP e VAEs decodificados entre execuções quando os prompts não mudarem.
  • Evite branches desnecessários: Nós extras desconectados ainda consomem memória quando executados na mesma fila.

Organizando Fluxos de Trabalho Como um Profissional

  • Agrupe nós: Use quadros/rótulos para organizar seções (Prompt, Modelo, Sampler, Output, etc.).
  • Painéis de parâmetros: Crie nós de “controle” (por exemplo, caixas de prompt vazias, sliders) na parte superior para facilitar o ajuste.
  • Salvar/compartilhar: Exporte seu JSON de fluxo de trabalho e mantenha uma nota de modelos usados para reprodutibilidade.
  • Versionamento: Mantenha gráficos separados para SD 1.5, SDXL e pipelines de especialidade (anime, fotoreal, depth-to-image, etc.).

Solução de Problemas Comuns

  • Imagens pretas ou em branco:
  • VAE errado ou VAE Decode ausente
  • Denoise muito baixo (por exemplo, <0,2 em img2img)
  • Cores desbotadas:
  • Tente outro VAE; alguns VAEs melhoram o contraste notavelmente
  • Diminua CFG ou altere o sampler
  • Nada muda entre as execuções:
  • Seed é fixo; ative randomize ou defina um novo seed
  • Sem memória (OOM):
  • Reduza a resolução, steps ou tamanho do lote; mude para fp16
  • Feche outros aplicativos de GPU; simplifique as pilhas ControlNet/LoRA
  • Modelo não encontrado / nó vermelho:
  • Verifique os caminhos dos arquivos e as pastas do modelo; confirme as extensões dos arquivos

Aprenda Mais Rápido Com Fluxos de Trabalho Pré-Construídos

Vídeos passo a passo e séries para iniciantes podem acelerar sua curva de aprendizado com gráficos prontos para serem executados que você pode pausar e dissecar. Tutoriais escritos e wikis fornecem explicações de nós e steps de instalação atualizados para mantê-lo atualizado.

Avançado: Modularizando e Estendendo Seus Gráficos

  • API/Nós externos: Alguns tutoriais cobrem a conexão do ComfyUI a serviços externos de IA por meio de nós especiais, permitindo pipelines híbridos e descarregando tarefas pesadas.
  • Bibliotecas e extensões de nós: Explore nós da comunidade para schedulers, upscalers e pré-processamento (pose, depth, segmentation). Sempre verifique a compatibilidade com sua versão do ComfyUI.
  • Refinadores SDXL e samplers encadeados: Execute denoising em etapas (base → refinador) ou até mesmo vários samplers para combinação estilística.

Vale a Pena Notar: Acelerando o Prompting Com Sider.AI

Se você frequentemente itera em prompts, referências ou descrições, você pode querer um ajudante para fazer brainstorming e refinar variações. A propósito, Sider.AI pode ajudá-lo a redigir rapidamente prompts estruturados, gerar listas de prompts negativos e resumir seus experimentos de fluxo de trabalho para que você não perca o controle entre as execuções. Você pode experimentá-lo aqui:

Um Fluxo de Trabalho Inicial SDXL Simples (Copie Este Padrão)

  • Checkpoint Loader (SDXL Base)
  • CLIP Text Encode (Positive) — “foto de produto ultra detalhada, iluminação softbox, lente de 50mm, superfície reflexiva”
  • CLIP Text Encode (Negative) — “baixa resolução, motion blur, marca d'água, desordem de fundo”
  • KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, seed fixo
  • VAE Decode → Save Image
Complementos opcionais:
  • Passe de refinador com checkpoint SDXL Refiner em 10–15 steps
  • ControlNet (Depth) com uma silhueta de objeto simples para layout
  • LoRA em 0,6 para uma marca ou estilo de arte específico

Principais Conclusões

  • O poder do ComfyUI vem de sua transparência – construa seu pipeline nó por nó.
  • A cadeia principal de texto para imagem é simples: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
  • O SDXL se beneficia de codificadores duplos e uma passagem de refinador opcional para detalhes.
  • LoRAs e ControlNet oferecem controle de estilo e precisão de composição.
  • Ajuste CFG, sampler e seed para qualidade e consistência; gerencie VRAM com fp16 e resoluções sensatas.
  • Organize fluxos de trabalho e versione-os para iteração indolor.

Próximos Passos

  1. Instale o ComfyUI seguindo as instruções do repo/wiki e execute um fluxo de trabalho de amostra.
  1. Reconstrua a cadeia mínima do zero para consolidar o básico.
  1. Adicione ControlNet e um LoRA, então teste A/B as configurações de sampler e CFG.
  1. Salve e compartilhe seu JSON de fluxo de trabalho com notas sobre modelos, seeds e parâmetros.
Gere feliz – e bem-vindo ao mundo calmo e controlável do ComfyUI.

FAQ

Q1: Como instalo e executo o ComfyUI no Windows, macOS ou Linux? Siga o repo oficial e o wiki da comunidade para steps específicos da plataforma, locais de pastas de modelo e dependências. Após a instalação, execute o servidor local e abra o ComfyUI em seu navegador para começar a conectar nós.
Q2: Qual é o fluxo de trabalho ComfyUI mais simples para texto para imagem? Carregue um checkpoint, codifique prompts positivos e negativos com CLIP, execute um KSampler, decodifique com VAE e, em seguida, salve a imagem. Esta cadeia é a base de como usar o ComfyUI de forma eficaz para a maioria das gerações.
Q3: Como uso o SDXL no ComfyUI? Use um checkpoint SDXL com codificadores de texto duplos e, opcionalmente, adicione uma passagem de refinador para obter melhores detalhes. Execute em 1024×1024 com CFG balanceado (em torno de 5–7) e um sampler eficiente como DPM++ 2M Karras.
Q4: Posso adicionar ControlNet e LoRA no mesmo fluxo de trabalho ComfyUI? Sim. Carregue seus nós LoRA e ControlNet, conecte-os às condições do modelo e do KSampler e ajuste os pesos (por exemplo, 0,6–0,8 para LoRA, ~0,5–1,2 para ControlNet). Observe o uso de VRAM e reduza a resolução ou steps se você atingir OOM.
Q5: Por que minhas imagens ComfyUI são de baixo contraste ou desbotadas? Tente um VAE diferente, diminua CFG ou mude os samplers. Alguns VAEs produzem cores e contrastes mais fiéis; pequenos ajustes podem corrigir resultados desbotados rapidamente.

Artigos Recentes
Como Dominar o ChatPDF: Insights Mais Rápidos de Documentos Complexos

Como Dominar o ChatPDF: Insights Mais Rápidos de Documentos Complexos

A melhor alternativa ao X Auto-Translation para documentos rápidos e precisos

A melhor alternativa ao X Auto-Translation para documentos rápidos e precisos

Tradução por IA da Samsung Indisponível no Irã? Soluções Práticas

Tradução por IA da Samsung Indisponível no Irã? Soluções Práticas

Ferramentas de tradução persa: um guia prático para um trabalho mais rápido e preciso

Ferramentas de tradução persa: um guia prático para um trabalho mais rápido e preciso

A Melhor Alternativa ao Grok para Pesquisas Profundas e Citadas

A Melhor Alternativa ao Grok para Pesquisas Profundas e Citadas

As 15 principais funcionalidades do gerador de imagens de IA que você realmente usará

As 15 principais funcionalidades do gerador de imagens de IA que você realmente usará