Ako používať ComfyUI: Praktický sprievodca krok za krokom pre začiatočníkov
Ak ste počuli, že ComfyUI je „uzlový a super výkonný“, ale cítili ste sa zastrašene všetkými tými štvorčekmi a drôtmi, nie ste sami. Dobrá správa: akonáhle sa naučíte niekoľko základných konceptov – checkpointy, enkodéry, samplery a dekodéry – budete vytvárať obrazové pracovné postupy ako profesionál. Tento praktický sprievodca vás prevedie tým, ako používať ComfyUI od inštalácie až po prvé obrázky SDXL, plus pracovné postupy pre ControlNet, LoRA a ladenie kvality/výkonu.
Na konci budete presne vedieť, ako používať ComfyUI na vytváranie konzistentných, opakovateľných a flexibilných generácií obrázkov bez hádania.
Čo je ComfyUI a prečo ho používať?
ComfyUI je vizuálne, uzlové rozhranie pre Stable Diffusion, ktoré vám umožňuje navrhnúť si krok za krokom svoj obrazový pipeline. Namiesto jediného tlačidla „Generovať“ spájate uzly – každý z nich spracováva odlišnú úlohu, ako je načítanie modelu, kódovanie textu, vzorkovanie latentných premenných alebo dekódovanie finálneho obrázka. Je rýchly, modulárny a transparentný – ideálny na učenie, experimentovanie a produkčné pracovné postupy.
Rýchly štart: Inštalácia a spustenie ComfyUI
- Windows/macOS/Linux: Postupujte podľa oficiálneho repozitára a inštalačných príručiek komunity. Môžete použiť manuálnu inštaláciu (Python + závislosti) alebo balíkové metódy v závislosti od vašej platformy a GPU. Wiki ComfyUI poskytuje podrobný návod na inštaláciu pre Windows, macOS (vrátane Apple Silicon) a Linux.
- Modely: Umiestnite svoje Stable Diffusion checkpointy (napr. SDXL base/refiner alebo SD 1.5) do priečinka
models/checkpoints. Vložte súbory VAE do models/vae, LoRA do models/loras, ControlNet modely do models/controlnet.
- Spustenie: Spustite štartovací skript pre váš OS; ComfyUI sa otvorí vo vašom prehliadači. Plátno je miesto, kde budete spájať uzly.
Tip: Udržujte ovládače GPU a CUDA toolkit aktuálne pre najlepší výkon.
Základný koncept: Minimálny pracovný postup Text‑to‑Image
Základný tok text-to-image v ComfyUI (štýl SD 1.5) vyzerá takto:
- Výstup: UNet, CLIP a VAE komponenty
- Uzol: CLIP Text Encode (Positive)
- Uzol: CLIP Text Encode (Negative)
- Výstup: Podmienenie embeddingov pre usmernenie
- Generovanie latentných premenných
- Vstupy: UNet, pozitívne/negatívne podmienenie, seed, kroky, sampler (napr. DPM++ 2M Karras) a CFG scale
Tento základný graf – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – je základom takmer všetkého, čo budete v ComfyUI robiť.
SDXL Workflow: Base + (Optional) Refiner
SDXL používa duálne textové enkodéry a často profituje z refiner pass.
- Načítanie SDXL Base: Použite checkpoint kompatibilný s SDXL. Mnohé šablóny SDXL obsahujú dva CLIP enkodéry (pre veľký/malý kontext). Zadajte pozitívne aj negatívne prompty.
- KSampler (Base): Generujte latentné premenné pri 1024×1024 (alebo vašom cieli). Uložte latentné premenné alebo dekódované obrázky.
- Voliteľný Refiner: Načítajte checkpoint SDXL Refiner a spustite ďalší KSampler pass podmienený na základnom výstupe, potom dekódujte pomocou VAE.
Tento dvojfázový proces môže výrazne zlepšiť detaily a koherenciu pri vyšších rozlíšeniach.
Praktické: Zostavte si svoj prvý graf ComfyUI
- Začnite od šablóny: Na bočnom paneli načítajte vstavaný príklad text-to-image.
- Nahraďte checkpoint: Vyberte svoj model SDXL alebo SD 1.5.
- Napíšte svoj prompt: Použite uzly Positive a Negative CLIP. Príklad:
- Pozitívny: „cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain“
- Negatívny: „blurry, low-res, deformed, extra fingers, watermark“
- Kroky: 20–35 pre rovnováhu rýchlosti/kvality
- Sampler: DPM++ 2M Karras (spoľahlivý) alebo Euler a (rýchly)
- CFG: 4.5–7.5 (vyššie silnejšie tlačí prompt, ale môže presýtiť)
- Seed: Opravte ho pre reprodukovateľnosť; meňte pre prieskum
- Rozlíšenie: Pre SD 1.5 začnite na 512×512 alebo 768×768. Pre SDXL dobre funguje 1024×1024.
- Dekódovanie a uloženie: Pridajte VAE Decode → Save Image. Kliknite na Queue Prompt pre generovanie.
Pochopenie kľúčových uzlov (jednoducho)
- Checkpoint Loader: Načíta váš difúzny model (UNet), textový enkodér(y) (CLIP) a VAE. Predstavte si to ako svoj „motor + jazykový mozog + prekladač obrázkov“.
- CLIP Text Encode: Konvertuje váš prompt na numerické embeddingy, ktorým model rozumie. Použite pozitívne aj negatívne textové enkodéry.
- KSampler: Srdce syntézy obrázkov. Odstraňuje latentný šum vedený vaším promptom a metódou samplera počas určitého počtu krokov.
- VAE Decode: Prekladá finálne latentné premenné na zobraziteľný obrázok. Výmena VAE mení vernosť farieb/kontrastu.
- Save Image: Zapisuje výstup na disk s metadátami, aby ste mohli neskôr znova vytvoriť výsledky.
Pre hlbší ponor do týchto stavebných blokov si pozrite rozdelenia pre začiatočníkov a vysvetlivky uzlov.
Vylepšenia: LoRA, ControlNet a Image‑to‑Image
Použite LoRA pre štýl alebo kontrolu nad objektom
- Pridajte uzol LoRA Loader a pripojte ho k vetve svojho modelu.
- Sila: Začnite okolo 0.6–0.8; upravte na základe intenzity štýlu alebo pretrénovania.
- Viacnásobné LoRA: Zreťazte alebo zlúčte, ale dávajte pozor na konflikty; znížte sily pri stohovaní.
Pridajte ControlNet pre presnú kompozíciu
- Uzly ControlNet vám umožňujú riadiť kompozíciu pomocou vstupnej mapy (Canny, Depth, OpenPose atď.).
- Typický tok: Načítajte model ControlNet → Predspracujte svoj sprievodný obrázok (napr. Canny edge) → Vložte podmienenie ControlNet do KSampler spolu s vaším textovým podmienením.
- Váha: 0.5–1.2 je dobrý začiatok. Príliš vysoká hodnota môže prebiť váš prompt.
Image‑to‑Image alebo Inpainting
- Nahraďte počiatočný šum latentným obrázkom pomocou VAE Encode.
- Upravte silu denoise v KSampler, aby ste kontrolovali, koľko z pôvodného obrázka zostane.
- Pre inpainting použite maskový vstup a pipeline samplera s podporou inpaint.
Ladenie kvality: Prompty, CFG, Samplery a Seedy
- Prompt engineering: Používajte stručné deskriptory, nie odseky. Poradie je menej dôležité ako jasnosť, ale kritické atribúty udržujte vpredu.
- Nízka (3–5): Kreatívnejšia, menej dodržiavania promptu
- Vysoká (9–12): Silné dodržiavanie, môže vytvárať artefakty
- DPM++ 2M Karras: Čistý, spoľahlivý
- Euler a: Rýchly a expresívny, skvelý na náhľady
- UniPC / Heun / DDIM: Stojí za testovanie; výsledky sa líšia v závislosti od modelu
- Pevný seed = reprodukovateľné výsledky
- Zmeniť seed = preskúmať rozmanitosť
Tipy na výkon pre plynulé vykresľovanie
- Rozpočet VRAM: Znížte rozlíšenie, kroky alebo veľkosť dávky, ak dosiahnete OOM. SDXL pri 1024×1024 môže vyžadovať 8–12 GB VRAM v závislosti od uzlov.
- Polovičná presnosť: Povoľte fp16 tam, kde je to podporované, pre veľké úspory pamäte s zanedbateľnou stratou kvality.
- Tiling a latentné upscalery: Generujte menšie, potom zväčšite pomocou uzla latentného upscalera alebo modelu image upscalera, aby ste ušetrili VRAM.
- Caching: Opätovne používajte CLIP kódovania a dekódované VAE medzi spusteniami, keď sa prompty nemenia.
- Vyhnite sa zbytočným vetvám: Extra odpojené uzly stále spotrebúvajú pamäť, keď sa vykonávajú v rovnakej fronte.
Organizovanie pracovných postupov ako profesionál
- Zoskupovanie uzlov: Používajte rámce/štítky na organizovanie sekcií (Prompt, Model, Sampler, Output atď.).
- Parametrové panely: Vytvorte „kontrolné“ uzly (napr. prázdne polia promptov, posúvače) v hornej časti pre jednoduché ladenie.
- Uloženie/zdieľanie: Exportujte svoj workflow JSON a ponechajte si poznámku
použité modely pre reprodukovateľnosť.
- Versioning: Udržujte samostatné grafy pre SD 1.5, SDXL a špecializované pipeline (anime, fotorealistické, depth-to-image atď.).
Riešenie bežných problémov
- Čierne alebo prázdne obrázky:
- Nesprávne VAE alebo chýbajúce VAE Decode
- Príliš nízky denoise (napr. <0.2 v img2img)
- Vyskúšajte iné VAE; niektoré VAE výrazne zlepšujú kontrast
- Znížte CFG alebo zmeňte sampler
- Nič sa nemení medzi spusteniami:
- Seed je pevný; povoľte náhodné nastavenie alebo nastavte nový seed
- Znížte rozlíšenie, kroky alebo veľkosť dávky; prepnite na fp16
- Zatvorte iné aplikácie GPU; zjednodušte ControlNet/LoRA stacky
- Model sa nenašiel / červený uzol:
- Overte cesty k súborom a priečinky modelov; potvrďte prípony súborov
Učte sa rýchlejšie s predpripravenými pracovnými postupmi
Video návody a série pre začiatočníkov môžu urýchliť vašu krivku učenia pomocou grafov pripravených na spustenie, ktoré môžete pozastaviť a rozobrať. Písomné návody a wiki poskytujú vysvetlivky uzlov a aktualizované kroky inštalácie, aby ste boli aktuálni.
Pokročilé: Modularizácia a rozširovanie vašich grafov
- API/Externé uzly: Niektoré návody sa zaoberajú pripojením ComfyUI k externým službám AI prostredníctvom špeciálnych uzlov, čo umožňuje hybridné pipeline a presúvanie náročných úloh.
- Knižnice uzlov a rozšírenia: Preskúmajte komunitné uzly pre plánovače, upscalery a predspracovanie (póza, hĺbka, segmentácia). Vždy skontrolujte kompatibilitu s vašou verziou ComfyUI.
- SDXL refiners a zreťazené samplery: Spustite postupnú redukciu šumu (base → refiner) alebo dokonca viacnásobné samplery pre štylistické prelínanie.
Stojí za zmienku: Urýchlenie promptovania pomocou Sider.AI
Ak často iterujete na promptoch, referenciách alebo popisoch, možno budete chcieť pomocníka na brainstorming a vylepšovanie variácií. Mimochodom, Sider.AI vám môže pomôcť rýchlo navrhnúť štruktúrované prompty, generovať negatívne zoznamy promptov a zhrnúť vaše experimenty s pracovnými postupmi, aby ste nestratili prehľad medzi spusteniami. Môžete si to vyskúšať tu: Jednoduchý SDXL Starter Workflow (Skopírujte tento vzor)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (Positive) — „ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface“
- CLIP Text Encode (Negative) — „low-res, motion blur, watermark, background clutter“
- KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, fixed seed
Voliteľné doplnky:
- Refiner pass s SDXL Refiner checkpoint na 10–15 krokoch
- ControlNet (Depth) s jednoduchou siluetou objektu pre rozloženie
- LoRA na 0.6 pre konkrétnu značku alebo umelecký štýl
Kľúčové poznatky
- Sila ComfyUI pochádza z jeho transparentnosti – zostavte si svoj pipeline uzol po uzle.
- Základný reťazec text‑to‑image je jednoduchý: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL profituje z duálnych enkodérov a voliteľného refiner pass pre detaily.
- LoRA a ControlNet vám dávajú kontrolu nad štýlom a presnosť kompozície.
- Nalaďte CFG, sampler a seed pre kvalitu a konzistenciu; spravujte VRAM pomocou fp16 a rozumných rozlíšení.
- Organizujte pracovné postupy a verzujte ich pre bezbolestnú iteráciu.
Ďalšie kroky
- Nainštalujte ComfyUI podľa pokynov repozitára/wiki a spustite vzorový pracovný postup.
- Znova zostavte minimálny reťazec od nuly, aby ste upevnili základy.
- Pridajte ControlNet a LoRA, potom A/B testujte nastavenia samplera a CFG.
- Uložte a zdieľajte svoj workflow JSON s poznámkami o modeloch, seedoch a parametroch.
Šťastné generovanie – a vitajte v pokojnom, kontrolovateľnom svete ComfyUI.
FAQ
Q1: Ako nainštalujem a spustím ComfyUI v systéme Windows, macOS alebo Linux?
Postupujte podľa oficiálneho repozitára a wiki komunity, kde nájdete kroky špecifické pre platformu, umiestnenia priečinkov modelov a závislosti. Po inštalácii spustite lokálny server a otvorte ComfyUI vo svojom prehliadači, aby ste mohli začať spájať uzly.
Q2: Aký je najjednoduchší pracovný postup ComfyUI pre text-to-image?
Načítajte checkpoint, zakódujte pozitívne a negatívne prompty pomocou CLIP, spustite KSampler, dekódujte pomocou VAE a potom uložte obrázok. Tento reťazec je základom toho, ako efektívne používať ComfyUI pre väčšinu generácií.
Q3: Ako používam SDXL v ComfyUI?
Použite checkpoint SDXL s duálnymi textovými enkodérmi a potom voliteľne pridajte refiner pass pre lepšie detaily. Spustite na 1024×1024 s vyváženým CFG (okolo 5–7) a efektívnym samplerom, ako je DPM++ 2M Karras.
Q4: Môžem pridať ControlNet a LoRA v rovnakom pracovnom postupe ComfyUI?
Áno. Načítajte svoje uzly LoRA a ControlNet, pripojte ich k podmienkam modelu a KSampler a nalaďte váhy (napr. 0.6–0.8 pre LoRA, ~0.5–1.2 pre ControlNet). Sledujte využitie VRAM a znížte rozlíšenie alebo kroky, ak dosiahnete OOM.
Q5: Prečo sú moje obrázky ComfyUI s nízkym kontrastom alebo vyblednuté?
Vyskúšajte iné VAE, znížte CFG alebo prepnite samplery. Niektoré VAE produkujú vernejšie farby a kontrast; malé úpravy môžu rýchlo opraviť vyblednuté výsledky.