Kako koristiti ComfyUI: Praktični vodič korak po korak za početnike
Ako ste čuli da je ComfyUI “baziran na čvorovima i super moćan”, ali ste se osjećali zastrašeno zbog svih kutija i žica, niste jedini. Dobra vijest: kada naučite nekoliko ključnih koncepata—checkpointovi, encoderi, sampleri i decoderi—gradit ćete image workflowove kao profesionalac. Ovaj praktični vodič provest će vas kroz korištenje ComfyUI-a od instalacije do vaših prvih SDXL slika, plus workflowovi za ControlNet, LoRA i podešavanje kvalitete/performansi.
Do kraja ćete točno znati kako koristiti ComfyUI za dosljedne, ponovljive i fleksibilne generacije slika bez nagađanja.
Što je ComfyUI i zašto ga koristiti?
ComfyUI je vizualno sučelje za Stable Diffusion bazirano na čvorovima koje vam omogućuje da korak po korak dizajnirate svoj image pipeline. Umjesto jednog gumba “Generiraj”, spajate čvorove—svaki obrađuje zaseban zadatak kao što je učitavanje modela, kodiranje teksta, uzorkovanje latenta ili dekodiranje konačne slike. Brz je, modularan i transparentan—savršen za učenje, eksperimentiranje i produkcijske workflowove.
Brzi početak: Instalirajte i pokrenite ComfyUI
- Windows/macOS/Linux: Slijedite službeni repo i vodiče za instalaciju zajednice. Možete koristiti ručnu instalaciju (Python + dependencies) ili pakirane metode, ovisno o vašoj platformi i GPU-u. ComfyUI wiki pruža korak po korak postavljanje za Windows, macOS (uključujući Apple Silicon) i Linux.
- Modeli: Postavite svoje Stable Diffusion checkpointove (npr. SDXL base/refiner ili SD 1.5) u mapu
models/checkpoints. Stavite VAE datoteke u models/vae, LoRA-e u models/loras, ControlNet modele u models/controlnet.
- Pokretanje: Pokrenite start script za svoj OS; ComfyUI se otvara u vašem pregledniku. Platno je mjesto gdje ćete spajati čvorove.
Savjet: Održavajte svoje GPU drivere i CUDA toolkit ažurnima za najbolje performanse.
Ključni koncept: Minimalni Text‑to‑Image Workflow
Osnovni text-to-image flow (stil SD 1.5) u ComfyUI izgleda ovako:
- Izlaz: UNet, CLIP i VAE komponente
- Čvor: CLIP Text Encode (Positive)
- Čvor: CLIP Text Encode (Negative)
- Izlaz: Conditioning embeddings za usmjeravanje
- Ulazi: UNet, pozitivni/negativni conditioning, seed, steps, sampler (npr. DPM++ 2M Karras) i CFG scale
Ovaj osnovni graf—Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save—temelj je za gotovo sve što ćete raditi u ComfyUI.
SDXL Workflow: Base + (opcionalno) Refiner
SDXL koristi dual text encodere i često ima koristi od refiner passa.
- Učitavanje SDXL Base: Koristite SDXL‑kompatibilni checkpoint. Mnogi SDXL predlošci uključuju dva CLIP encodera (za veliki/mali kontekst). Uključite i pozitivne i negativne promptove.
- KSampler (Base): Generirajte latente na 1024×1024 (ili vašoj ciljanoj rezoluciji). Spremite latente ili dekodirane slike.
- Opcionalni Refiner: Učitajte SDXL Refiner checkpoint i pokrenite dodatni KSampler pass uvjetovan na base output, zatim dekodirajte s VAE.
Ovaj dvostupanjski proces može značajno poboljšati detalje i koherentnost pri višim rezolucijama.
Praktični rad: Izgradite svoj prvi ComfyUI graf
- Počnite s predloškom: U bočnoj traci učitajte ugrađeni primjer text-to-image.
- Zamijenite checkpoint: Odaberite svoj SDXL ili SD 1.5 model.
- Napišite svoj prompt: Koristite Positive i Negative CLIP čvorove. Primjer:
- Pozitivan: “cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain”
- Negativan: “blurry, low-res, deformed, extra fingers, watermark”
- Steps: 20–35 za ravnotežu brzine/kvalitete
- Sampler: DPM++ 2M Karras (pouzdan) ili Euler a (brz)
- CFG: 4.5–7.5 (viši jače gura prompt, ali može prezasićiti)
- Seed: Popravite ga za ponovljivost; varirajte za istraživanje
- Rezolucija: Za SD 1.5, počnite na 512×512 ili 768×768. Za SDXL, 1024×1024 radi dobro.
- Dekodiranje i spremanje: Dodajte VAE Decode → Save Image. Kliknite Queue Prompt za generiranje.
Razumijevanje ključnih čvorova (jednostavnim jezikom)
- Checkpoint Loader: Učitava vaš diffusion model (UNet), text encoder(e) (CLIP) i VAE. Zamislite ga kao svoj “motor + jezični mozak + prevoditelj slika”.
- CLIP Text Encode: Pretvara vaš prompt u numeričke embeddinge koje model razumije. Koristite i pozitivne i negativne text encodere.
- KSampler: Srce sinteze slike. On uklanja šum iz latentnog šuma vođen vašim promptom i metodom uzorkovanja kroz određeni broj koraka.
- VAE Decode: Prebacuje konačne latente u vidljivu sliku. Zamjena VAE-ova mijenja vjernost boje/kontrasta.
- Save Image: Zapisuje izlaz na disk s metapodacima kako biste kasnije mogli ponovno stvoriti rezultate.
Za dublje poniranje u ove građevne blokove, pogledajte jednostavne raščlambe za početnike i objašnjenja čvorova.
Pojačanja: LoRA, ControlNet i Image‑to‑Image
Koristite LoRA za kontrolu stila ili subjekta
- Dodajte LoRA Loader čvor i spojite ga na svoju granu modela.
- Snaga: Počnite oko 0.6–0.8; prilagodite na temelju intenziteta stila ili prekomjernog prilagođavanja.
- Višestruke LoRA-e: Lančano povezivanje ili spajanje, ali pazite na sukobe; smanjite snagu pri slaganju.
Dodajte ControlNet za preciznu kompoziciju
- ControlNet čvorovi omogućuju vam da usmjeravate kompoziciju pomoću ulazne karte (Canny, Depth, OpenPose, itd.).
- Tipičan flow: Učitavanje ControlNet modela → Predobrada vaše vodilice (npr. Canny edge) → Uključite ControlNet conditioning u KSampler zajedno s vašim text conditioningom.
- Težina: 0.5–1.2 je dobar početak. Previsoka vrijednost može nadjačati vaš prompt.
Image‑to‑Image ili Inpainting
- Zamijenite početni šum latentom slike putem VAE Encode.
- Prilagodite jačinu denoise u KSampleru kako biste kontrolirali koliko originalne slike ostaje.
- Za inpainting koristite mask input i inpaint‑aware sampler pipeline.
Podešavanje kvalitete: Promptovi, CFG, Sampleri i Seedovi
- Prompt engineering: Koristite sažete deskriptore, a ne odlomke. Redoslijed je manje važan od jasnoće, ali zadržite kritične atribute sprijeda.
- Nizak (3–5): Kreativniji, manje pridržavanje prompta
- Srednji (6–8): Uravnotežen
- Visok (9–12): Snažno pridržavanje, može stvoriti artefakte
- DPM++ 2M Karras: Čist, pouzdan
- Euler a: Brz i ekspresivan, odličan za preglede
- UniPC / Heun / DDIM: Vrijedno testiranja; rezultati variraju ovisno o modelu
- Fiksni seed = ponovljivi rezultati
- Varirajući seed = istraživanje raznolikosti
Savjeti za performanse za glatke rendere
- VRAM budgeting: Smanjite rezoluciju, steps ili batch size ako naiđete na OOM. SDXL na 1024×1024 može zahtijevati 8–12 GB VRAM ovisno o čvorovima.
- Polovična preciznost: Omogućite fp16 gdje je podržano za velike uštede memorije uz zanemariv gubitak kvalitete.
- Tiling i latent upscaleri: Generirajte manje, zatim povećajte putem latent upscaler čvora ili image upscaler modela kako biste uštedjeli VRAM.
- Caching: Ponovno koristite CLIP encodiranje i dekodirane VAE-ove kroz više pokretanja kada se promptovi ne mijenjaju.
- Izbjegavajte nepotrebne grane: Dodatni nepovezani čvorovi i dalje troše memoriju kada se izvršavaju u istom redu.
Organiziranje workflowova kao profesionalac
- Grupirajte čvorove: Koristite okvire/oznake za organiziranje odjeljaka (Prompt, Model, Sampler, Output, itd.).
- Paneli parametara: Stvorite “control” čvorove (npr. prazne prompt kutije, klizače) na vrhu za jednostavno podešavanje.
- Spremi/podijeli: Izvezite svoj workflow JSON i zadržite bilješku
korišteni modeli za ponovljivost.
- Versioning: Zadržite zasebne grafove za SD 1.5, SDXL i specijalizirane pipelineove (anime, fotorealistični, depth-to-image, itd.).
Rješavanje uobičajenih problema
- Pogrešan VAE ili nedostaje VAE Decode
- Denoise prenizak (npr. <0.2 u img2img)
- Isprobajte drugi VAE; neki VAE-ovi primjetno poboljšavaju kontrast
- Smanjite CFG ili promijenite sampler
- Ništa se ne mijenja kroz pokretanja:
- Seed je fiksiran; omogućite randomize ili postavite novi seed
- Nedostatak memorije (OOM):
- Smanjite rezoluciju, steps ili batch size; prebacite se na fp16
- Zatvorite druge GPU aplikacije; pojednostavite ControlNet/LoRA stackove
- Model nije pronađen / crveni čvor:
- Provjerite putanje datoteka i mape modela; potvrdite ekstenzije datoteka
Učite brže s unaprijed izgrađenim workflowovima
Video vodiči i serije za početnike mogu ubrzati vašu krivulju učenja s grafovima spremnim za pokretanje koje možete pauzirati i secirati. Pisani vodiči i wikiji pružaju objašnjenja čvorova i ažurirane korake instalacije kako biste bili u tijeku.
Napredno: Modularizacija i proširenje vaših grafova
- API/Vanjski čvorovi: Neki vodiči pokrivaju povezivanje ComfyUI s vanjskim AI uslugama putem posebnih čvorova, omogućujući hibridne pipelineove i prebacivanje teških zadataka.
- Node libraries i proširenja: Istražite čvorove zajednice za schedulere, upscalere i predobradu (pose, depth, segmentation). Uvijek provjerite kompatibilnost s vašom verzijom ComfyUI.
- SDXL refineri i chained sampleri: Pokrenite staged denoising (base → refiner) ili čak višestruke samplere za stilsko miješanje.
Vrijedi napomenuti: Ubrzavanje promptanja s Sider.AI
Ako često ponavljate promptove, reference ili opise, možda ćete htjeti pomoćnika za razmišljanje i usavršavanje varijacija. Usput, Sider.AI vam može pomoći da brzo izradite strukturirane promptove, generirate popise negativnih promptova i sažete svoje workflow eksperimente kako ne biste izgubili trag između pokretanja. Možete ga isprobati ovdje: Jednostavan SDXL početni workflow (kopirajte ovaj uzorak)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (Positive) — “ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface”
- CLIP Text Encode (Negative) — “low-res, motion blur, watermark, background clutter”
- KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, fiksni seed
Opcionalni dodaci:
- Refiner pass s SDXL Refiner checkpointom na 10–15 steps
- ControlNet (Depth) s jednostavnom siluetom objekta za layout
- LoRA na 0.6 za određeni brand ili umjetnički stil
Ključne točke
- Snaga ComfyUI-a dolazi iz njegove transparentnosti—izgradite svoj pipeline čvor po čvor.
- Osnovni text‑to‑image lanac je jednostavan: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL ima koristi od dual encodera i opcionalnog refiner passa za detalje.
- LoRA-e i ControlNet vam daju kontrolu stila i preciznost kompozicije.
- Podesite CFG, sampler i seed za kvalitetu i dosljednost; upravljajte VRAM-om s fp16 i razumnim rezolucijama.
- Organizirajte workflowove i verzije ih za bezbolno ponavljanje.
Sljedeći koraci
- Instalirajte ComfyUI slijedeći upute u repozitoriju/wikiju i pokrenite primjer workflowa.
- Ponovno izgradite minimalni lanac od nule kako biste učvrstili osnove.
- Dodajte ControlNet i LoRA, zatim A/B testirajte postavke samplera i CFG.
- Spremite i podijelite svoj workflow JSON s bilješkama o modelima, seedovima i parametrima.
Sretno s generiranjem—i dobrodošli u miran, kontroliran svijet ComfyUI-a.
FAQ
P1: Kako instalirati i pokrenuti ComfyUI na Windows, macOS ili Linux?
Slijedite službeni repo i wiki zajednice za korake specifične za platformu, lokacije mapa modela i dependencies. Nakon instalacije, pokrenite lokalni server i otvorite ComfyUI u svom pregledniku da biste počeli spajati čvorove.
P2: Koji je najjednostavniji ComfyUI workflow za text-to-image?
Učitajte checkpoint, kodirajte pozitivne i negativne promptove s CLIP, pokrenite KSampler, dekodirajte s VAE, a zatim spremite sliku. Ovaj lanac je temelj za učinkovito korištenje ComfyUI za većinu generacija.
P3: Kako koristiti SDXL u ComfyUI?
Koristite SDXL checkpoint s dual text encoderima, zatim opcionalno dodajte refiner pass za bolje detalje. Pokrenite na 1024×1024 s uravnoteženim CFG (oko 5–7) i učinkovitim samplerom poput DPM++ 2M Karras.
P4: Mogu li dodati ControlNet i LoRA u istom ComfyUI workflowu?
Da. Učitajte svoje LoRA i ControlNet čvorove, spojite ih na model i KSampler conditioninge i podesite težine (npr. 0.6–0.8 za LoRA, ~0.5–1.2 za ControlNet). Pazite na korištenje VRAM-a i smanjite rezoluciju ili steps ako naiđete na OOM.
P5: Zašto su moje ComfyUI slike niskog kontrasta ili isprane?
Isprobajte drugi VAE, smanjite CFG ili promijenite samplere. Neki VAE-ovi proizvode vjernije boje i kontrast; male prilagodbe mogu brzo popraviti isprane rezultate.