How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Como Usar o ComfyUI: Um Guia Prático e Passo a Passo para Iniciantes

Se você já ouviu dizer que o ComfyUI é “baseado em nós e super poderoso”, mas se sentiu intimidado por todas as caixas e fios, você não está sozinho. A boa notícia: depois de aprender alguns conceitos básicos – checkpoints, encoders, samplers e decoders – você estará construindo fluxos de trabalho de imagem como um profissional. Este guia prático explica como usar o ComfyUI desde a instalação até suas primeiras imagens SDXL, além de fluxos de trabalho para ControlNet, LoRAs e ajuste de qualidade/desempenho.

Ao final, você saberá exatamente como usar o ComfyUI para fazer gerações de imagens consistentes, repetíveis e flexíveis, sem adivinhação.

O Que É ComfyUI e Por Que Usá-lo?

ComfyUI é uma interface visual, baseada em nós para Stable Diffusion que permite que você projete seu pipeline de imagem passo a passo. Em vez de um único botão “Gerar”, você conecta nós – cada um lidando com uma tarefa distinta, como carregar um modelo, codificar texto, amostrar latentes ou decodificar a imagem final. É rápido, modular e transparente – perfeito para aprendizado, experimentação e fluxos de trabalho de produção.

Início Rápido: Instale e Execute o ComfyUI

Windows/macOS/Linux: Siga o repositório oficial e os guias de instalação da comunidade. Você pode usar a instalação manual (Python + dependências) ou métodos empacotados, dependendo da sua plataforma e GPU. O wiki do ComfyUI fornece a configuração passo a passo para Windows, macOS (incluindo Apple Silicon) e Linux.

Modelos: Coloque seus checkpoints do Stable Diffusion (por exemplo, SDXL base/refiner ou SD 1.5) na pasta models/checkpoints. Coloque os arquivos VAE em models/vae, LoRAs em models/loras, modelos ControlNet em models/controlnet.

Execução: Execute o script de início para seu SO; o ComfyUI é aberto em seu navegador. A tela é onde você conectará os nós.

Dica: Mantenha seus drivers de GPU e o kit de ferramentas CUDA atualizados para obter o melhor desempenho.

Conceito Básico: O Fluxo de Trabalho Mínimo de Texto para Imagem

O fluxo básico de texto para imagem do ComfyUI (estilo SD 1.5) se parece com isto:

Carregue o modelo

Nó: Checkpoint Loader

Saída: Componentes UNet, CLIP e VAE

Codifique prompts

Nó: CLIP Text Encode (Positive)

Nó: CLIP Text Encode (Negative)

Saída: Incorporações de condicionamento para orientação

Gere latentes

Nó: KSampler

Entradas: UNet, condicionamento positivo/negativo, seed, steps, sampler (por exemplo, DPM++ 2M Karras) e escala CFG

Saída: Imagem latente

Decodifique a imagem

Nó: VAE Decode

Saída: Imagem

Salve a saída

Nó: Save Image

Este gráfico básico – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – é a base para quase tudo que você fará no ComfyUI.

Fluxo de Trabalho SDXL: Base + (Opcional) Refinador

O SDXL usa codificadores de texto duplos e geralmente se beneficia de uma passagem de refinador.

Carregue a Base SDXL: Use um checkpoint compatível com SDXL. Muitos modelos SDXL incluem dois codificadores CLIP (para contexto grande/pequeno). Alimente prompts positivos e negativos.

KSampler (Base): Gere latentes em 1024×1024 (ou seu alvo). Salve latentes ou imagens decodificadas.

Refinador Opcional: Carregue o checkpoint do Refinador SDXL e execute uma passagem KSampler adicional condicionada na saída base e, em seguida, decodifique com VAE.

Este processo de dois estágios pode melhorar significativamente os detalhes e a coerência em resoluções mais altas.

Mão na Massa: Construa Seu Primeiro Gráfico ComfyUI

Comece com um modelo: Na barra lateral, carregue um exemplo integrado de texto para imagem.

Substitua o checkpoint: Selecione seu modelo SDXL ou SD 1.5.

Escreva seu prompt: Use os nós CLIP Positivo e Negativo. Exemplo:

Positivo: “retrato cinematográfico, iluminação suave de estúdio, lente de 85mm, altamente detalhado, granulação de filme”

Negativo: “embaçado, baixa resolução, deformado, dedos extras, marca d'água”

Configurações do KSampler:

Steps: 20–35 para equilíbrio de velocidade/qualidade

Sampler: DPM++ 2M Karras (confiável) ou Euler a (rápido)

CFG: 4,5–7,5 (quanto mais alto, mais o prompt é forçado, mas pode sobresaturar)

Seed: Corrija para reprodutibilidade; varie para exploração

Resolução: Para SD 1.5, comece em 512×512 ou 768×768. Para SDXL, 1024×1024 funciona bem.

Decodifique e Salve: Adicione VAE Decode → Save Image. Clique em Queue Prompt para gerar.

Entendendo os Nós Principais (Em Português Claro)

Checkpoint Loader: Carrega seu modelo de difusão (UNet), codificador(es) de texto (CLIP) e VAE. Pense nisso como seu “motor + cérebro de linguagem + tradutor de imagem”.

CLIP Text Encode: Converte seu prompt em incorporações numéricas que o modelo entende. Use codificadores de texto positivos e negativos.

KSampler: O coração da síntese de imagem. Ele remove o ruído latente guiado pelo seu prompt e método de sampler em um número de steps.

VAE Decode: Traduz latentes finais em uma imagem visualizável. Trocar VAEs altera a fidelidade de cor/contraste.

Save Image: Escreve a saída no disco com metadados para que você possa recriar os resultados posteriormente.

Para um mergulho mais profundo nesses blocos de construção, veja detalhamentos amigáveis para iniciantes e explicações de nós.

Power-Ups: LoRA, ControlNet e Image-to-Image

Use LoRA para Controle de Estilo ou Assunto

Adicione um nó LoRA Loader e conecte-o ao seu branch de modelo.

Força: Comece em torno de 0,6–0,8; ajuste com base na intensidade do estilo ou overfitting.

LoRAs Múltiplos: Encadear ou mesclar, mas observe os conflitos; diminua as forças ao empilhar.

Adicione ControlNet para Composição Precisa

Os nós ControlNet permitem que você direcione a composição usando um mapa de entrada (Canny, Depth, OpenPose, etc.).

Fluxo típico: Carregue o modelo ControlNet → Pré-processe sua imagem guia (por exemplo, borda Canny) → Alimente o condicionamento ControlNet no KSampler junto com seu condicionamento de texto.

Peso: 0,5–1,2 é um bom começo. Muito alto pode dominar seu prompt.

Image-to-Image ou Inpainting

Substitua o ruído inicial por um latente de imagem via VAE Encode.

Ajuste a força de denoise no KSampler para controlar o quanto da imagem original permanece.

Para inpainting, use uma entrada de máscara e um pipeline de sampler com reconhecimento de inpaint.

Ajuste de Qualidade: Prompts, CFG, Samplers e Seeds

Engenharia de prompt: Use descritores concisos, não parágrafos. A ordem importa menos do que a clareza, mas mantenha os atributos críticos na frente.

Escala CFG:

Baixa (3–5): Mais criativo, menos aderência ao prompt

Média (6–8): Equilibrado

Alta (9–12): Forte aderência, pode criar artefatos

Escolha do sampler:

DPM++ 2M Karras: Limpo, confiável

Euler a: Rápido e expressivo, ótimo para visualizações

UniPC / Heun / DDIM: Vale a pena testar; os resultados variam de acordo com o modelo

Seeds:

Seed fixo = resultados reproduzíveis

Vary seed = explore a diversidade

Dicas de Desempenho para Renders Suaves

Orçamento de VRAM: Diminua a resolução, steps ou tamanho do lote se você atingir OOM. SDXL em 1024×1024 pode exigir 8–12 GB de VRAM, dependendo dos nós.

Precisão de meia precisão: Ative fp16 onde suportado para grandes economias de memória com perda de qualidade insignificante.

Tiling e upscalers latentes: Gere menor, então upscale via um nó upscaler latente ou modelo upscaler de imagem para economizar VRAM.

Caching: Reutilize codificações CLIP e VAEs decodificados entre execuções quando os prompts não mudarem.

Evite branches desnecessários: Nós extras desconectados ainda consomem memória quando executados na mesma fila.

Organizando Fluxos de Trabalho Como um Profissional

Agrupe nós: Use quadros/rótulos para organizar seções (Prompt, Modelo, Sampler, Output, etc.).

Painéis de parâmetros: Crie nós de “controle” (por exemplo, caixas de prompt vazias, sliders) na parte superior para facilitar o ajuste.

Salvar/compartilhar: Exporte seu JSON de fluxo de trabalho e mantenha uma nota de modelos usados para reprodutibilidade.

Versionamento: Mantenha gráficos separados para SD 1.5, SDXL e pipelines de especialidade (anime, fotoreal, depth-to-image, etc.).

Solução de Problemas Comuns

Imagens pretas ou em branco:

VAE errado ou VAE Decode ausente

Denoise muito baixo (por exemplo, <0,2 em img2img)

Cores desbotadas:

Tente outro VAE; alguns VAEs melhoram o contraste notavelmente

Diminua CFG ou altere o sampler

Nada muda entre as execuções:

Seed é fixo; ative randomize ou defina um novo seed

Sem memória (OOM):

Reduza a resolução, steps ou tamanho do lote; mude para fp16

Feche outros aplicativos de GPU; simplifique as pilhas ControlNet/LoRA

Modelo não encontrado / nó vermelho:

Verifique os caminhos dos arquivos e as pastas do modelo; confirme as extensões dos arquivos

Aprenda Mais Rápido Com Fluxos de Trabalho Pré-Construídos

Vídeos passo a passo e séries para iniciantes podem acelerar sua curva de aprendizado com gráficos prontos para serem executados que você pode pausar e dissecar. Tutoriais escritos e wikis fornecem explicações de nós e steps de instalação atualizados para mantê-lo atualizado.

Avançado: Modularizando e Estendendo Seus Gráficos

API/Nós externos: Alguns tutoriais cobrem a conexão do ComfyUI a serviços externos de IA por meio de nós especiais, permitindo pipelines híbridos e descarregando tarefas pesadas.

Bibliotecas e extensões de nós: Explore nós da comunidade para schedulers, upscalers e pré-processamento (pose, depth, segmentation). Sempre verifique a compatibilidade com sua versão do ComfyUI.

Refinadores SDXL e samplers encadeados: Execute denoising em etapas (base → refinador) ou até mesmo vários samplers para combinação estilística.

Vale a Pena Notar: Acelerando o Prompting Com Sider.AI

Se você frequentemente itera em prompts, referências ou descrições, você pode querer um ajudante para fazer brainstorming e refinar variações. A propósito, Sider.AI pode ajudá-lo a redigir rapidamente prompts estruturados, gerar listas de prompts negativos e resumir seus experimentos de fluxo de trabalho para que você não perca o controle entre as execuções. Você pode experimentá-lo aqui:

Um Fluxo de Trabalho Inicial SDXL Simples (Copie Este Padrão)

Checkpoint Loader (SDXL Base)

CLIP Text Encode (Positive) — “foto de produto ultra detalhada, iluminação softbox, lente de 50mm, superfície reflexiva”

CLIP Text Encode (Negative) — “baixa resolução, motion blur, marca d'água, desordem de fundo”

KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, seed fixo

VAE Decode → Save Image

Complementos opcionais:

Passe de refinador com checkpoint SDXL Refiner em 10–15 steps

ControlNet (Depth) com uma silhueta de objeto simples para layout

LoRA em 0,6 para uma marca ou estilo de arte específico

Principais Conclusões

O poder do ComfyUI vem de sua transparência – construa seu pipeline nó por nó.

A cadeia principal de texto para imagem é simples: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

O SDXL se beneficia de codificadores duplos e uma passagem de refinador opcional para detalhes.

LoRAs e ControlNet oferecem controle de estilo e precisão de composição.

Ajuste CFG, sampler e seed para qualidade e consistência; gerencie VRAM com fp16 e resoluções sensatas.

Organize fluxos de trabalho e versione-os para iteração indolor.

Próximos Passos

Instale o ComfyUI seguindo as instruções do repo/wiki e execute um fluxo de trabalho de amostra.

Reconstrua a cadeia mínima do zero para consolidar o básico.

Adicione ControlNet e um LoRA, então teste A/B as configurações de sampler e CFG.

Salve e compartilhe seu JSON de fluxo de trabalho com notas sobre modelos, seeds e parâmetros.

Gere feliz – e bem-vindo ao mundo calmo e controlável do ComfyUI.

FAQ

Q1: Como instalo e executo o ComfyUI no Windows, macOS ou Linux? Siga o repo oficial e o wiki da comunidade para steps específicos da plataforma, locais de pastas de modelo e dependências. Após a instalação, execute o servidor local e abra o ComfyUI em seu navegador para começar a conectar nós.

Q2: Qual é o fluxo de trabalho ComfyUI mais simples para texto para imagem? Carregue um checkpoint, codifique prompts positivos e negativos com CLIP, execute um KSampler, decodifique com VAE e, em seguida, salve a imagem. Esta cadeia é a base de como usar o ComfyUI de forma eficaz para a maioria das gerações.

Q3: Como uso o SDXL no ComfyUI? Use um checkpoint SDXL com codificadores de texto duplos e, opcionalmente, adicione uma passagem de refinador para obter melhores detalhes. Execute em 1024×1024 com CFG balanceado (em torno de 5–7) e um sampler eficiente como DPM++ 2M Karras.

Q4: Posso adicionar ControlNet e LoRA no mesmo fluxo de trabalho ComfyUI? Sim. Carregue seus nós LoRA e ControlNet, conecte-os às condições do modelo e do KSampler e ajuste os pesos (por exemplo, 0,6–0,8 para LoRA, ~0,5–1,2 para ControlNet). Observe o uso de VRAM e reduza a resolução ou steps se você atingir OOM.

Q5: Por que minhas imagens ComfyUI são de baixo contraste ou desbotadas? Tente um VAE diferente, diminua CFG ou mude os samplers. Alguns VAEs produzem cores e contrastes mais fiéis; pequenos ajustes podem corrigir resultados desbotados rapidamente.