How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Kako koristiti ComfyUI: Praktični vodič korak po korak za početnike

Ako ste čuli da je ComfyUI “baziran na čvorovima i super moćan”, ali ste se osjećali zastrašeno zbog svih kutija i žica, niste jedini. Dobra vijest: kada naučite nekoliko ključnih koncepata—checkpointovi, encoderi, sampleri i decoderi—gradit ćete image workflowove kao profesionalac. Ovaj praktični vodič provest će vas kroz korištenje ComfyUI-a od instalacije do vaših prvih SDXL slika, plus workflowovi za ControlNet, LoRA i podešavanje kvalitete/performansi.

Do kraja ćete točno znati kako koristiti ComfyUI za dosljedne, ponovljive i fleksibilne generacije slika bez nagađanja.

Što je ComfyUI i zašto ga koristiti?

ComfyUI je vizualno sučelje za Stable Diffusion bazirano na čvorovima koje vam omogućuje da korak po korak dizajnirate svoj image pipeline. Umjesto jednog gumba “Generiraj”, spajate čvorove—svaki obrađuje zaseban zadatak kao što je učitavanje modela, kodiranje teksta, uzorkovanje latenta ili dekodiranje konačne slike. Brz je, modularan i transparentan—savršen za učenje, eksperimentiranje i produkcijske workflowove.

Brzi početak: Instalirajte i pokrenite ComfyUI

Windows/macOS/Linux: Slijedite službeni repo i vodiče za instalaciju zajednice. Možete koristiti ručnu instalaciju (Python + dependencies) ili pakirane metode, ovisno o vašoj platformi i GPU-u. ComfyUI wiki pruža korak po korak postavljanje za Windows, macOS (uključujući Apple Silicon) i Linux.

Modeli: Postavite svoje Stable Diffusion checkpointove (npr. SDXL base/refiner ili SD 1.5) u mapu models/checkpoints. Stavite VAE datoteke u models/vae, LoRA-e u models/loras, ControlNet modele u models/controlnet.

Pokretanje: Pokrenite start script za svoj OS; ComfyUI se otvara u vašem pregledniku. Platno je mjesto gdje ćete spajati čvorove.

Savjet: Održavajte svoje GPU drivere i CUDA toolkit ažurnima za najbolje performanse.

Ključni koncept: Minimalni Text‑to‑Image Workflow

Osnovni text-to-image flow (stil SD 1.5) u ComfyUI izgleda ovako:

Učitavanje modela

Čvor: Checkpoint Loader

Izlaz: UNet, CLIP i VAE komponente

Kodiranje promptova

Čvor: CLIP Text Encode (Positive)

Čvor: CLIP Text Encode (Negative)

Izlaz: Conditioning embeddings za usmjeravanje

Generiranje latenta

Čvor: KSampler

Ulazi: UNet, pozitivni/negativni conditioning, seed, steps, sampler (npr. DPM++ 2M Karras) i CFG scale

Izlaz: Latent image

Dekodiranje slike

Čvor: VAE Decode

Izlaz: Image

Spremanje izlaza

Čvor: Save Image

Ovaj osnovni graf—Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save—temelj je za gotovo sve što ćete raditi u ComfyUI.

SDXL Workflow: Base + (opcionalno) Refiner

SDXL koristi dual text encodere i često ima koristi od refiner passa.

Učitavanje SDXL Base: Koristite SDXL‑kompatibilni checkpoint. Mnogi SDXL predlošci uključuju dva CLIP encodera (za veliki/mali kontekst). Uključite i pozitivne i negativne promptove.

KSampler (Base): Generirajte latente na 1024×1024 (ili vašoj ciljanoj rezoluciji). Spremite latente ili dekodirane slike.

Opcionalni Refiner: Učitajte SDXL Refiner checkpoint i pokrenite dodatni KSampler pass uvjetovan na base output, zatim dekodirajte s VAE.

Ovaj dvostupanjski proces može značajno poboljšati detalje i koherentnost pri višim rezolucijama.

Praktični rad: Izgradite svoj prvi ComfyUI graf

Počnite s predloškom: U bočnoj traci učitajte ugrađeni primjer text-to-image.

Zamijenite checkpoint: Odaberite svoj SDXL ili SD 1.5 model.

Napišite svoj prompt: Koristite Positive i Negative CLIP čvorove. Primjer:

Pozitivan: “cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain”

Negativan: “blurry, low-res, deformed, extra fingers, watermark”

KSampler postavke:

Steps: 20–35 za ravnotežu brzine/kvalitete

Sampler: DPM++ 2M Karras (pouzdan) ili Euler a (brz)

CFG: 4.5–7.5 (viši jače gura prompt, ali može prezasićiti)

Seed: Popravite ga za ponovljivost; varirajte za istraživanje

Rezolucija: Za SD 1.5, počnite na 512×512 ili 768×768. Za SDXL, 1024×1024 radi dobro.

Dekodiranje i spremanje: Dodajte VAE Decode → Save Image. Kliknite Queue Prompt za generiranje.

Razumijevanje ključnih čvorova (jednostavnim jezikom)

Checkpoint Loader: Učitava vaš diffusion model (UNet), text encoder(e) (CLIP) i VAE. Zamislite ga kao svoj “motor + jezični mozak + prevoditelj slika”.

CLIP Text Encode: Pretvara vaš prompt u numeričke embeddinge koje model razumije. Koristite i pozitivne i negativne text encodere.

KSampler: Srce sinteze slike. On uklanja šum iz latentnog šuma vođen vašim promptom i metodom uzorkovanja kroz određeni broj koraka.

VAE Decode: Prebacuje konačne latente u vidljivu sliku. Zamjena VAE-ova mijenja vjernost boje/kontrasta.

Save Image: Zapisuje izlaz na disk s metapodacima kako biste kasnije mogli ponovno stvoriti rezultate.

Za dublje poniranje u ove građevne blokove, pogledajte jednostavne raščlambe za početnike i objašnjenja čvorova.

Pojačanja: LoRA, ControlNet i Image‑to‑Image

Koristite LoRA za kontrolu stila ili subjekta

Dodajte LoRA Loader čvor i spojite ga na svoju granu modela.

Snaga: Počnite oko 0.6–0.8; prilagodite na temelju intenziteta stila ili prekomjernog prilagođavanja.

Višestruke LoRA-e: Lančano povezivanje ili spajanje, ali pazite na sukobe; smanjite snagu pri slaganju.

Dodajte ControlNet za preciznu kompoziciju

ControlNet čvorovi omogućuju vam da usmjeravate kompoziciju pomoću ulazne karte (Canny, Depth, OpenPose, itd.).

Tipičan flow: Učitavanje ControlNet modela → Predobrada vaše vodilice (npr. Canny edge) → Uključite ControlNet conditioning u KSampler zajedno s vašim text conditioningom.

Težina: 0.5–1.2 je dobar početak. Previsoka vrijednost može nadjačati vaš prompt.

Image‑to‑Image ili Inpainting

Zamijenite početni šum latentom slike putem VAE Encode.

Prilagodite jačinu denoise u KSampleru kako biste kontrolirali koliko originalne slike ostaje.

Za inpainting koristite mask input i inpaint‑aware sampler pipeline.

Podešavanje kvalitete: Promptovi, CFG, Sampleri i Seedovi

Prompt engineering: Koristite sažete deskriptore, a ne odlomke. Redoslijed je manje važan od jasnoće, ali zadržite kritične atribute sprijeda.

CFG scale:

Nizak (3–5): Kreativniji, manje pridržavanje prompta

Srednji (6–8): Uravnotežen

Visok (9–12): Snažno pridržavanje, može stvoriti artefakte

Izbor samplera:

DPM++ 2M Karras: Čist, pouzdan

Euler a: Brz i ekspresivan, odličan za preglede

UniPC / Heun / DDIM: Vrijedno testiranja; rezultati variraju ovisno o modelu

Seedovi:

Fiksni seed = ponovljivi rezultati

Varirajući seed = istraživanje raznolikosti

Savjeti za performanse za glatke rendere

VRAM budgeting: Smanjite rezoluciju, steps ili batch size ako naiđete na OOM. SDXL na 1024×1024 može zahtijevati 8–12 GB VRAM ovisno o čvorovima.

Polovična preciznost: Omogućite fp16 gdje je podržano za velike uštede memorije uz zanemariv gubitak kvalitete.

Tiling i latent upscaleri: Generirajte manje, zatim povećajte putem latent upscaler čvora ili image upscaler modela kako biste uštedjeli VRAM.

Caching: Ponovno koristite CLIP encodiranje i dekodirane VAE-ove kroz više pokretanja kada se promptovi ne mijenjaju.

Izbjegavajte nepotrebne grane: Dodatni nepovezani čvorovi i dalje troše memoriju kada se izvršavaju u istom redu.

Organiziranje workflowova kao profesionalac

Grupirajte čvorove: Koristite okvire/oznake za organiziranje odjeljaka (Prompt, Model, Sampler, Output, itd.).

Paneli parametara: Stvorite “control” čvorove (npr. prazne prompt kutije, klizače) na vrhu za jednostavno podešavanje.

Spremi/podijeli: Izvezite svoj workflow JSON i zadržite bilješku korišteni modeli za ponovljivost.

Versioning: Zadržite zasebne grafove za SD 1.5, SDXL i specijalizirane pipelineove (anime, fotorealistični, depth-to-image, itd.).

Rješavanje uobičajenih problema

Crne ili prazne slike:

Pogrešan VAE ili nedostaje VAE Decode

Denoise prenizak (npr. <0.2 u img2img)

Ispirane boje:

Isprobajte drugi VAE; neki VAE-ovi primjetno poboljšavaju kontrast

Smanjite CFG ili promijenite sampler

Ništa se ne mijenja kroz pokretanja:

Seed je fiksiran; omogućite randomize ili postavite novi seed

Nedostatak memorije (OOM):

Smanjite rezoluciju, steps ili batch size; prebacite se na fp16

Zatvorite druge GPU aplikacije; pojednostavite ControlNet/LoRA stackove

Model nije pronađen / crveni čvor:

Provjerite putanje datoteka i mape modela; potvrdite ekstenzije datoteka

Učite brže s unaprijed izgrađenim workflowovima

Video vodiči i serije za početnike mogu ubrzati vašu krivulju učenja s grafovima spremnim za pokretanje koje možete pauzirati i secirati. Pisani vodiči i wikiji pružaju objašnjenja čvorova i ažurirane korake instalacije kako biste bili u tijeku.

Napredno: Modularizacija i proširenje vaših grafova

API/Vanjski čvorovi: Neki vodiči pokrivaju povezivanje ComfyUI s vanjskim AI uslugama putem posebnih čvorova, omogućujući hibridne pipelineove i prebacivanje teških zadataka.

Node libraries i proširenja: Istražite čvorove zajednice za schedulere, upscalere i predobradu (pose, depth, segmentation). Uvijek provjerite kompatibilnost s vašom verzijom ComfyUI.

SDXL refineri i chained sampleri: Pokrenite staged denoising (base → refiner) ili čak višestruke samplere za stilsko miješanje.

Vrijedi napomenuti: Ubrzavanje promptanja s Sider.AI

Ako često ponavljate promptove, reference ili opise, možda ćete htjeti pomoćnika za razmišljanje i usavršavanje varijacija. Usput, Sider.AI vam može pomoći da brzo izradite strukturirane promptove, generirate popise negativnih promptova i sažete svoje workflow eksperimente kako ne biste izgubili trag između pokretanja. Možete ga isprobati ovdje:

Jednostavan SDXL početni workflow (kopirajte ovaj uzorak)

Checkpoint Loader (SDXL Base)

CLIP Text Encode (Positive) — “ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface”

CLIP Text Encode (Negative) — “low-res, motion blur, watermark, background clutter”

KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, fiksni seed

VAE Decode → Save Image

Opcionalni dodaci:

Refiner pass s SDXL Refiner checkpointom na 10–15 steps

ControlNet (Depth) s jednostavnom siluetom objekta za layout

LoRA na 0.6 za određeni brand ili umjetnički stil

Ključne točke

Snaga ComfyUI-a dolazi iz njegove transparentnosti—izgradite svoj pipeline čvor po čvor.

Osnovni text‑to‑image lanac je jednostavan: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

SDXL ima koristi od dual encodera i opcionalnog refiner passa za detalje.

LoRA-e i ControlNet vam daju kontrolu stila i preciznost kompozicije.

Podesite CFG, sampler i seed za kvalitetu i dosljednost; upravljajte VRAM-om s fp16 i razumnim rezolucijama.

Organizirajte workflowove i verzije ih za bezbolno ponavljanje.

Sljedeći koraci

Instalirajte ComfyUI slijedeći upute u repozitoriju/wikiju i pokrenite primjer workflowa.

Ponovno izgradite minimalni lanac od nule kako biste učvrstili osnove.

Dodajte ControlNet i LoRA, zatim A/B testirajte postavke samplera i CFG.

Spremite i podijelite svoj workflow JSON s bilješkama o modelima, seedovima i parametrima.

Sretno s generiranjem—i dobrodošli u miran, kontroliran svijet ComfyUI-a.

FAQ

P1: Kako instalirati i pokrenuti ComfyUI na Windows, macOS ili Linux? Slijedite službeni repo i wiki zajednice za korake specifične za platformu, lokacije mapa modela i dependencies. Nakon instalacije, pokrenite lokalni server i otvorite ComfyUI u svom pregledniku da biste počeli spajati čvorove.

P2: Koji je najjednostavniji ComfyUI workflow za text-to-image? Učitajte checkpoint, kodirajte pozitivne i negativne promptove s CLIP, pokrenite KSampler, dekodirajte s VAE, a zatim spremite sliku. Ovaj lanac je temelj za učinkovito korištenje ComfyUI za većinu generacija.

P3: Kako koristiti SDXL u ComfyUI? Koristite SDXL checkpoint s dual text encoderima, zatim opcionalno dodajte refiner pass za bolje detalje. Pokrenite na 1024×1024 s uravnoteženim CFG (oko 5–7) i učinkovitim samplerom poput DPM++ 2M Karras.

P4: Mogu li dodati ControlNet i LoRA u istom ComfyUI workflowu? Da. Učitajte svoje LoRA i ControlNet čvorove, spojite ih na model i KSampler conditioninge i podesite težine (npr. 0.6–0.8 za LoRA, ~0.5–1.2 za ControlNet). Pazite na korištenje VRAM-a i smanjite rezoluciju ili steps ako naiđete na OOM.

P5: Zašto su moje ComfyUI slike niskog kontrasta ili isprane? Isprobajte drugi VAE, smanjite CFG ili promijenite samplere. Neki VAE-ovi proizvode vjernije boje i kontrast; male prilagodbe mogu brzo popraviti isprane rezultate.