How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Come usare ComfyUI: una guida pratica passo dopo passo per principianti

Se hai sentito dire che ComfyUI è "basato su nodi e super potente", ma ti senti intimidito da tutte le caselle e i cavi, non sei il solo. La buona notizia è che, una volta appresi alcuni concetti fondamentali (checkpoint, encoder, sampler e decoder), creerai flussi di lavoro per immagini come un professionista. Questa guida pratica ti illustra come utilizzare ComfyUI dall'installazione alle tue prime immagini SDXL, oltre a flussi di lavoro per ControlNet, LoRA e ottimizzazione di qualità/prestazioni.

Alla fine, saprai esattamente come utilizzare ComfyUI per realizzare generazioni di immagini coerenti, ripetibili e flessibili senza congetture.

Cos'è ComfyUI e perché usarlo?

ComfyUI è un'interfaccia visiva basata su nodi per Stable Diffusion che ti consente di progettare la tua pipeline di immagini passo dopo passo. Invece di un singolo pulsante "Genera", connetti i nodi, ognuno dei quali gestisce un'attività distinta come il caricamento di un modello, la codifica del testo, il campionamento dei latenti o la decodifica dell'immagine finale. È veloce, modulare e trasparente, perfetto per l'apprendimento, la sperimentazione e i flussi di lavoro di produzione.

Guida rapida: installa e avvia ComfyUI

Windows/macOS/Linux: segui il repository ufficiale e le guide di installazione della community. Puoi utilizzare l'installazione manuale (Python + dipendenze) o metodi in pacchetto a seconda della piattaforma e della GPU. La wiki di ComfyUI fornisce la configurazione passo dopo passo per Windows, macOS (incluso Apple Silicon) e Linux.

Modelli: posiziona i tuoi checkpoint di Stable Diffusion (ad esempio, SDXL base/refiner o SD 1.5) nella cartella models/checkpoints. Inserisci i file VAE in models/vae, i LoRA in models/loras, i modelli ControlNet in models/controlnet.

Avvio: esegui lo script di avvio per il tuo sistema operativo; ComfyUI si apre nel browser. La canvas è il luogo in cui collegherai i nodi.

Suggerimento: mantieni aggiornati i driver della GPU e il toolkit CUDA per ottenere le migliori prestazioni.

Concetto fondamentale: il flusso di lavoro minimo da testo a immagine

Il flusso di base da testo a immagine di ComfyUI (stile SD 1.5) si presenta così:

Carica il modello

Nodo: Checkpoint Loader

Output: componenti UNet, CLIP e VAE

Codifica i prompt

Nodo: CLIP Text Encode (Positive)

Nodo: CLIP Text Encode (Negative)

Output: embedding di condizionamento per la guida

Genera latenti

Nodo: KSampler

Input: UNet, condizionamento positivo/negativo, seed, steps, sampler (ad esempio, DPM++ 2M Karras) e CFG scale

Output: immagine latente

Decodifica l'immagine

Nodo: VAE Decode

Output: immagine

Salva l'output

Nodo: Save Image

Questo grafico di base (Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save) è il fondamento di quasi tutto ciò che farai in ComfyUI.

Flusso di lavoro SDXL: Base + (opzionale) Refiner

SDXL utilizza doppi encoder di testo e spesso beneficia di un passaggio di rifinitura.

Carica SDXL Base: utilizza un checkpoint compatibile con SDXL. Molti template SDXL includono due encoder CLIP (per contesto grande/piccolo). Inserisci sia prompt positivi che negativi.

KSampler (Base): genera latenti a 1024×1024 (o la tua target). Salva i latenti o le immagini decodificate.

Refiner opzionale: carica il checkpoint SDXL Refiner ed esegui un ulteriore passaggio KSampler condizionato all'output di base, quindi decodifica con VAE.

Questo processo a due stadi può migliorare significativamente i dettagli e la coerenza a risoluzioni più elevate.

Esercitazione pratica: costruisci il tuo primo grafico ComfyUI

Inizia da un template: nella barra laterale, carica un esempio predefinito da testo a immagine.

Sostituisci il checkpoint: seleziona il tuo modello SDXL o SD 1.5.

Scrivi il tuo prompt: utilizza i nodi CLIP Positive e Negative. Esempio:

Positive: “ritratto cinematografico, luce soffusa da studio, obiettivo 85 mm, molto dettagliato, grana della pellicola”

Negative: “sfocato, bassa risoluzione, deformato, dita extra, filigrana”

Impostazioni KSampler:

Steps: 20–35 per equilibrio velocità/qualità

Sampler: DPM++ 2M Karras (affidabile) o Euler a (veloce)

CFG: 4.5–7.5 (più alto spinge di più il prompt, ma può sovrasaturare)

Seed: fissalo per la riproducibilità; varialo per l'esplorazione

Risoluzione: per SD 1.5, inizia a 512×512 o 768×768. Per SDXL, 1024×1024 funziona bene.

Decodifica e salva: aggiungi VAE Decode → Save Image. Clicca su Queue Prompt per generare.

Comprensione dei nodi chiave (in parole semplici)

Checkpoint Loader: carica il tuo modello di diffusione (UNet), l'encoder(i) di testo (CLIP) e il VAE. Pensalo come il tuo “motore + cervello linguistico + traduttore di immagini”.

CLIP Text Encode: converte il tuo prompt in embedding numerici che il modello comprende. Utilizza sia encoder di testo positivi che negativi.

KSampler: il cuore della sintesi dell'immagine. Riduce il rumore latente guidato dal tuo prompt e dal metodo sampler attraverso un numero di passaggi.

VAE Decode: traduce i latenti finali in un'immagine visualizzabile. La sostituzione dei VAE modifica la fedeltà del colore/contrasto.

Save Image: scrive l'output su disco con i metadati in modo da poter ricreare i risultati in seguito.

Per un approfondimento su questi elementi costitutivi, consulta riepiloghi adatti ai principianti e spiegazioni dei nodi.

Potenziamenti: LoRA, ControlNet e da immagine a immagine

Usa LoRA per il controllo dello stile o del soggetto

Aggiungi un nodo LoRA Loader e collegalo al ramo del tuo modello.

Intensità: inizia intorno a 0.6–0.8; regola in base all'intensità dello stile o all'overfitting.

LoRA multipli: concatenare o unire, ma fai attenzione ai conflitti; riduci le intensità quando impili.

Aggiungi ControlNet per una composizione precisa

I nodi ControlNet ti consentono di guidare la composizione utilizzando una mappa di input (Canny, Depth, OpenPose, ecc.).

Flusso tipico: carica il modello ControlNet → Preelabora l'immagine guida (ad esempio, bordo Canny) → Inserisci il condizionamento ControlNet in KSampler insieme al condizionamento del testo.

Peso: 0.5–1.2 è un buon inizio. Troppo alto può sopraffare il tuo prompt.

Da immagine a immagine o Inpainting

Sostituisci il rumore iniziale con un latente immagine tramite VAE Encode.

Regola l'intensità del denoise in KSampler per controllare la quantità di immagine originale che rimane.

Per l'inpainting, usa un input mask e una pipeline sampler consapevole dell'inpainting.

Ottimizzazione della qualità: prompt, CFG, sampler e seed

Ingegneria del prompt: usa descrittori concisi, non paragrafi. L'ordine conta meno della chiarezza, ma mantieni gli attributi critici in primo piano.

CFG scale:

Basso (3–5): più creativo, meno aderenza al prompt

Medio (6–8): bilanciato

Alto (9–12): forte aderenza, può creare artefatti

Scelta del sampler:

DPM++ 2M Karras: pulito, affidabile

Euler a: veloce ed espressivo, ottimo per le anteprime

UniPC / Heun / DDIM: vale la pena testarli; i risultati variano in base al modello

Seed:

Seed fisso = risultati riproducibili

Varia seed = esplora la diversità

Suggerimenti sulle prestazioni per rendering fluidi

Budget VRAM: riduci la risoluzione, gli steps o la dimensione del batch se raggiungi l'OOM. SDXL a 1024×1024 può richiedere 8–12 GB di VRAM a seconda dei nodi.

Precisione dimezzata: abilita fp16 dove supportato per un grande risparmio di memoria con una perdita di qualità trascurabile.

Tiling e upscaler latenti: genera più piccolo, quindi esegui l'upscale tramite un nodo upscaler latente o un modello upscaler di immagini per risparmiare VRAM.

Caching: riutilizza le codifiche CLIP e i VAE decodificati tra le esecuzioni quando i prompt non cambiano.

Evita rami non necessari: i nodi scollegati extra consumano ancora memoria quando vengono eseguiti nella stessa coda.

Organizzazione dei flussi di lavoro come un professionista

Raggruppa i nodi: usa frame/etichette per organizzare le sezioni (Prompt, Modello, Sampler, Output, ecc.).

Pannelli dei parametri: crea nodi di “controllo” (ad esempio, caselle prompt vuote, cursori) nella parte superiore per una facile ottimizzazione.

Salva/condividi: esporta il tuo JSON del flusso di lavoro e tieni una nota dei modelli utilizzati per la riproducibilità.

Controllo delle versioni: mantieni grafici separati per SD 1.5, SDXL e pipeline speciali (anime, fotorealistico, profondità-immagine, ecc.).

Risoluzione dei problemi comuni

Immagini nere o vuote:

VAE errato o VAE Decode mancante

Denoise troppo basso (ad esempio, <0.2 in img2img)

Colori sbiaditi:

Prova un altro VAE; alcuni VAE migliorano notevolmente il contrasto

Riduci CFG o cambia sampler

Nulla cambia tra le esecuzioni:

Il seed è fisso; abilita la randomizzazione o imposta un nuovo seed

Memoria insufficiente (OOM):

Riduci la risoluzione, gli steps o la dimensione del batch; passa a fp16

Chiudi altre app GPU; semplifica gli stack ControlNet/LoRA

Modello non trovato/nodo rosso:

Verifica i percorsi dei file e le cartelle del modello; conferma le estensioni dei file

Impara più velocemente con flussi di lavoro predefiniti

I tutorial video e le serie per principianti possono accelerare la tua curva di apprendimento con grafici pronti all'uso che puoi mettere in pausa e sezionare. Tutorial scritti e wiki forniscono spiegazioni sui nodi e passaggi di installazione aggiornati per tenerti aggiornato.

Avanzato: modularizzazione ed estensione dei tuoi grafici

API/Nodi esterni: alcuni tutorial trattano la connessione di ComfyUI a servizi AI esterni tramite nodi speciali, abilitando pipeline ibride e scaricando attività pesanti.

Librerie di nodi ed estensioni: esplora i nodi della community per scheduler, upscaler e pre-elaborazione (posa, profondità, segmentazione). Controlla sempre la compatibilità con la tua versione di ComfyUI.

Rifinitori SDXL e sampler concatenati: esegui il denoising a stadi (base → refiner) o anche sampler multipli per la fusione stilistica.

Vale la pena notare: accelerare il prompting con Sider.AI

Se iteri frequentemente su prompt, riferimenti o descrizioni, potresti volere un aiutante per fare brainstorming e affinare le variazioni. A proposito, Sider.AI può aiutarti a redigere rapidamente prompt strutturati, generare elenchi di prompt negativi e riepilogare i tuoi esperimenti di flusso di lavoro in modo da non perdere traccia tra le esecuzioni. Puoi provarlo qui:

Un semplice flusso di lavoro SDXL di base (copia questo schema)

Checkpoint Loader (SDXL Base)

CLIP Text Encode (Positive) — “foto del prodotto ultra dettagliata, illuminazione softbox, obiettivo 50 mm, superficie riflettente”

CLIP Text Encode (Negative) — “bassa risoluzione, motion blur, filigrana, disordine di sfondo”

KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, seed fisso

VAE Decode → Save Image

Componenti aggiuntivi opzionali:

Passaggio di rifinitura con checkpoint SDXL Refiner a 10–15 steps

ControlNet (Depth) con una semplice silhouette dell'oggetto per il layout

LoRA a 0.6 per un marchio specifico o uno stile artistico

Punti chiave

La potenza di ComfyUI deriva dalla sua trasparenza: costruisci la tua pipeline nodo per nodo.

La catena di base da testo a immagine è semplice: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

SDXL beneficia di doppi encoder e di un passaggio di rifinitura opzionale per i dettagli.

LoRA e ControlNet ti offrono controllo dello stile e precisione della composizione.

Ottimizza CFG, sampler e seed per qualità e coerenza; gestisci la VRAM con fp16 e risoluzioni sensate.

Organizza i flussi di lavoro e controlla le versioni per un'iterazione indolore.

Passaggi successivi

Installa ComfyUI seguendo le istruzioni del repository/wiki e avvia un flusso di lavoro di esempio.

Ricostruisci la catena minima da zero per consolidare le basi.

Aggiungi ControlNet e un LoRA, quindi esegui test A/B delle impostazioni di sampler e CFG.

Salva e condividi il tuo JSON del flusso di lavoro con note su modelli, seed e parametri.

Buona generazione e benvenuto nel mondo calmo e controllabile di ComfyUI.

FAQ

D1: Come installo ed eseguo ComfyUI su Windows, macOS o Linux? Segui il repository ufficiale e la wiki della community per i passaggi specifici della piattaforma, le posizioni delle cartelle del modello e le dipendenze. Dopo l'installazione, avvia il server locale e apri ComfyUI nel tuo browser per iniziare a collegare i nodi.

D2: Qual è il flusso di lavoro ComfyUI più semplice per la generazione di immagini da testo? Carica un checkpoint, codifica prompt positivi e negativi con CLIP, esegui un KSampler, decodifica con VAE, quindi salva l'immagine. Questa catena è il fondamento di come utilizzare ComfyUI in modo efficace per la maggior parte delle generazioni.

D3: Come utilizzo SDXL in ComfyUI? Utilizza un checkpoint SDXL con doppi encoder di testo, quindi aggiungi facoltativamente un passaggio di rifinitura per dettagli migliori. Esegui a 1024×1024 con CFG bilanciato (circa 5–7) e un sampler efficiente come DPM++ 2M Karras.

D4: Posso aggiungere ControlNet e LoRA nello stesso flusso di lavoro ComfyUI? Sì. Carica i tuoi nodi LoRA e ControlNet, collegali al modello e ai condizionamenti KSampler e ottimizza i pesi (ad esempio, 0.6–0.8 per LoRA, ~0.5–1.2 per ControlNet). Osserva l'utilizzo della VRAM e riduci la risoluzione o gli steps se raggiungi l'OOM.

D5: Perché le mie immagini ComfyUI hanno un contrasto basso o sono sbiadite? Prova un VAE diverso, riduci CFG o cambia sampler. Alcuni VAE producono colori e contrasto più fedeli; piccole modifiche possono risolvere rapidamente i risultati sbiaditi.