Jak používat ComfyUI: Praktický průvodce krok za krokem pro začátečníky
Pokud jste slyšeli, že ComfyUI je „založené na uzlech a super výkonné“, ale cítili jste se zastrašeni všemi těmi boxy a dráty, nejste sami. Dobrá zpráva: jakmile se naučíte několik základních konceptů – checkpoints, encoders, samplers a decoders – budete vytvářet image workflows jako profík. Tento praktický průvodce vás provede tím, jak používat ComfyUI od instalace až po vaše první SDXL obrázky, plus workflows pro ControlNet, LoRAs a ladění kvality/výkonu.
Na konci budete přesně vědět, jak používat ComfyUI k vytváření konzistentních, opakovatelných a flexibilních generací obrázků bez dohadů.
Co je ComfyUI a proč jej používat?
ComfyUI je vizuální rozhraní pro Stable Diffusion založené na uzlech, které vám umožňuje navrhovat image pipeline krok za krokem. Namísto jediného tlačítka „Generate“ propojujete uzly – každý z nich zpracovává odlišný úkol, jako je načítání modelu, kódování textu, sampling latentů nebo dekódování finálního obrázku. Je to rychlé, modulární a transparentní – ideální pro učení, experimentování a produkční workflows.
Rychlý start: Instalace a spuštění ComfyUI
- Windows/macOS/Linux: Postupujte podle oficiálního repozitáře a komunitních instalačních příruček. Můžete použít manuální instalaci (Python + závislosti) nebo balíčkové metody v závislosti na vaší platformě a GPU. ComfyUI wiki poskytuje podrobné nastavení pro Windows, macOS (včetně Apple Silicon) a Linux.
- Modely: Umístěte své Stable Diffusion checkpoints (např. SDXL base/refiner nebo SD 1.5) do složky
models/checkpoints. Vložte VAE soubory do models/vae, LoRAs do models/loras, ControlNet modely do models/controlnet.
- Spuštění: Spusťte startovací skript pro váš OS; ComfyUI se otevře ve vašem prohlížeči. Plátno je místo, kde budete propojovat uzly dohromady.
Tip: Udržujte své GPU ovladače a CUDA toolkit aktuální pro nejlepší výkon.
Základní koncept: Minimální Text‑to‑Image Workflow
Základní text-to-image flow v ComfyUI (styl SD 1.5) vypadá takto:
- Výstup: UNet, CLIP a VAE komponenty
- Uzel: CLIP Text Encode (Positive)
- Uzel: CLIP Text Encode (Negative)
- Výstup: Conditioning embeddings pro guidance
- Vstupy: UNet, pozitivní/negativní conditioning, seed, steps, sampler (např. DPM++ 2M Karras) a CFG scale
Tento základní graf – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – je základem pro téměř vše, co budete v ComfyUI dělat.
SDXL Workflow: Base + (Volitelný) Refiner
SDXL používá duální text encoders a často těží z refiner pass.
- Načtení SDXL Base: Použijte SDXL‑kompatibilní checkpoint. Mnoho SDXL šablon zahrnuje dva CLIP encoders (pro velký/malý kontext). Zadejte pozitivní i negativní prompty.
- KSampler (Base): Generujte latenty při 1024×1024 (nebo váš cíl). Uložte latenty nebo dekódované obrázky.
- Volitelný Refiner: Načtěte SDXL Refiner checkpoint a spusťte další KSampler pass conditioned na base výstup, poté dekódujte pomocí VAE.
Tento dvoufázový proces může výrazně zlepšit detaily a koherenci při vyšších rozlišeních.
Praktické cvičení: Vytvořte svůj první ComfyUI Graph
- Začněte od šablony: V postranním panelu načtěte vestavěný text-to-image příklad.
- Nahraďte checkpoint: Vyberte svůj SDXL nebo SD 1.5 model.
- Napište svůj prompt: Použijte Positive a Negative CLIP uzly. Příklad:
- Positive: “cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain”
- Negative: “blurry, low-res, deformed, extra fingers, watermark”
- Steps: 20–35 pro rovnováhu rychlosti/kvality
- Sampler: DPM++ 2M Karras (spolehlivý) nebo Euler a (rychlý)
- CFG: 4.5–7.5 (vyšší tlačí prompt silněji, ale může přesytit)
- Seed: Opravte jej pro reprodukovatelnost; měňte pro zkoumání
- Rozlišení: Pro SD 1.5 začněte na 512×512 nebo 768×768. Pro SDXL funguje dobře 1024×1024.
- Decode a Save: Přidejte VAE Decode → Save Image. Klikněte na Queue Prompt pro generování.
Pochopení klíčových uzlů (jednoduše)
- Checkpoint Loader: Načte váš diffusion model (UNet), text encoder(y) (CLIP) a VAE. Představte si to jako váš „engine + language brain + image translator.“
- CLIP Text Encode: Převede váš prompt na numerické embeddings, kterým model rozumí. Použijte pozitivní i negativní text encoders.
- KSampler: Srdce image synthesis. Odstraňuje šum latentního šumu vedený vaším promptem a sampler metodou v průběhu několika kroků.
- VAE Decode: Převede finální latenty na zobrazitelný obrázek. Záměna VAEs mění věrnost barev/kontrastu.
- Save Image: Zapíše výstup na disk s metadaty, abyste mohli později znovu vytvořit výsledky.
Pro hlubší ponor do těchto stavebních bloků se podívejte na rozpisky vhodné pro začátečníky a vysvětlení uzlů.
Vylepšení: LoRA, ControlNet a Image‑to‑Image
Použijte LoRA pro kontrolu stylu nebo subjektu
- Přidejte LoRA Loader uzel a připojte jej k vaší model branch.
- Síla: Začněte kolem 0.6–0.8; upravte na základě intenzity stylu nebo overfittingu.
- Více LoRAs: Řetězte nebo slučujte, ale dávejte pozor na konflikty; snižte sílu při stohování.
Přidejte ControlNet pro přesnou kompozici
- ControlNet uzly vám umožňují řídit kompozici pomocí vstupní mapy (Canny, Depth, OpenPose atd.).
- Typický flow: Načtěte ControlNet model → Předzpracujte svůj guide image (např. Canny edge) → Zadejte ControlNet conditioning do KSampler spolu s vaším text conditioning.
- Váha: 0.5–1.2 je dobrý začátek. Příliš vysoká může přemoci váš prompt.
Image‑to‑Image nebo Inpainting
- Nahraďte počáteční šum latentním obrazem pomocí VAE Encode.
- Upravte denoise strength v KSampler pro kontrolu, kolik z původního obrázku zůstane.
- Pro inpainting použijte mask input a inpaint‑aware sampler pipeline.
Ladění kvality: Prompty, CFG, Samplery a Seedy
- Prompt engineering: Používejte stručné deskriptory, ne odstavce. Pořadí je méně důležité než jasnost, ale kritické atributy mějte vpředu.
- Nízká (3–5): Kreativnější, menší adherence k promptu
- Vysoká (9–12): Silná adherence, může vytvářet artefakty
- DPM++ 2M Karras: Čistý, spolehlivý
- Euler a: Rychlý a expresivní, skvělý pro náhledy
- UniPC / Heun / DDIM: Stojí za testování; výsledky se liší podle modelu
- Pevný seed = reprodukovatelné výsledky
- Měnit seed = prozkoumávat rozmanitost
Tipy pro výkon pro plynulé rendery
- VRAM budgeting: Snižte rozlišení, steps nebo batch size, pokud narazíte na OOM. SDXL při 1024×1024 může vyžadovat 8–12 GB VRAM v závislosti na uzlech.
- Half precision: Povolte fp16 tam, kde je podporováno, pro velké úspory paměti s zanedbatelnou ztrátou kvality.
- Tiling a latent upscalers: Generujte menší, poté upscale pomocí latent upscaler uzlu nebo image upscaler modelu pro úsporu VRAM.
- Caching: Opakovaně používejte CLIP encodings a dekódované VAEs mezi spuštěními, když se prompty nemění.
- Vyhněte se zbytečným branches: Extra odpojené uzly stále spotřebovávají paměť, když jsou spuštěny ve stejné frontě.
Organizace Workflows jako profík
- Group nodes: Používejte frames/labels k organizaci sekcí (Prompt, Model, Sampler, Output atd.).
- Parameter panels: Vytvořte „control“ uzly (např. prázdné prompt boxy, slidery) nahoře pro snadné ladění.
- Save/share: Exportujte svůj workflow JSON a uchovávejte si poznámku o
použitých modelech pro reprodukovatelnost.
- Versioning: Uchovávejte oddělené grafy pro SD 1.5, SDXL a speciální pipelines (anime, photoreal, depth-to-image atd.).
Řešení běžných problémů
- Černé nebo prázdné obrázky:
- Špatné VAE nebo chybějící VAE Decode
- Denoise příliš nízké (např. <0.2 v img2img)
- Zkuste jiné VAE; některá VAEs znatelně zlepšují kontrast
- Snižte CFG nebo změňte sampler
- Nic se nemění mezi spuštěními:
- Seed je pevný; povolte randomize nebo nastavte nový seed
- Snižte rozlišení, steps nebo batch size; přepněte na fp16
- Zavřete ostatní GPU aplikace; zjednodušte ControlNet/LoRA stacks
- Model nenalezen / červený uzel:
- Ověřte cesty k souborům a složky modelů; potvrďte přípony souborů
Učte se rychleji s předem vytvořenými Workflows
Video návody a série pro začátečníky mohou urychlit vaši learning curve s ready-to-run grafy, které můžete pozastavit a rozebrat. Písemné tutoriály a wikis poskytují vysvětlení uzlů a aktualizované kroky instalace, abyste byli aktuální.
Pokročilé: Modularizace a rozšíření vašich grafů
- API/Externí uzly: Některé tutoriály se zabývají připojením ComfyUI k externím AI službám prostřednictvím speciálních uzlů, což umožňuje hybridní pipelines a offloading náročných úkolů.
- Node libraries a extensions: Prozkoumejte komunitní uzly pro schedulers, upscalers a preprocessing (pose, depth, segmentation). Vždy zkontrolujte kompatibilitu s vaší ComfyUI verzí.
- SDXL refiners a chained samplers: Spusťte staged denoising (base → refiner) nebo dokonce více samplers pro stylistické blending.
Stojí za zmínku: Urychlení Promptingu pomocí Sider.AI
Pokud často iterujete na promptech, referencích nebo popisech, možná budete chtít parťáka pro brainstorming a vylepšování variací. Mimochodem, Sider.AI vám může pomoci rychle navrhnout strukturované prompty, generovat seznamy negativních promptů a shrnout vaše workflow experimenty, abyste neztratili přehled mezi spuštěními. Můžete si to vyzkoušet zde: Jednoduchý SDXL Starter Workflow (Zkopírujte tento vzor)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (Positive) — “ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface”
- CLIP Text Encode (Negative) — “low-res, motion blur, watermark, background clutter”
- KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, fixed seed
Volitelné add-ons:
- Refiner pass s SDXL Refiner checkpoint při 10–15 steps
- ControlNet (Depth) s jednoduchou siluetou objektu pro layout
- LoRA při 0.6 pro specifickou značku nebo umělecký styl
Klíčové poznatky
- Síla ComfyUI pochází z jeho transparency—vytvořte si pipeline uzel po uzlu.
- Základní text‑to‑image řetězec je jednoduchý: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL těží z duálních encoders a volitelného refiner pass pro detaily.
- LoRAs a ControlNet vám dávají kontrolu nad stylem a přesnost kompozice.
- Laďte CFG, sampler a seed pro kvalitu a konzistenci; spravujte VRAM pomocí fp16 a rozumných rozlišení.
- Organizujte workflows a versionujte je pro bezbolestnou iteraci.
Další kroky
- Nainstalujte ComfyUI podle instrukcí v repo/wiki a spusťte ukázkový workflow.
- Přestavte minimální řetězec od nuly, abyste upevnili základy.
- Přidejte ControlNet a LoRA, poté A/B testujte sampler a CFG nastavení.
- Uložte a sdílejte svůj workflow JSON s poznámkami o modelech, seedech a parametrech.
Šťastné generování – a vítejte v klidném, ovladatelném světě ComfyUI.
FAQ
Q1:Jak nainstaluji a spustím ComfyUI na Windows, macOS nebo Linux?
Postupujte podle oficiálního repozitáře a komunitní wiki pro kroky specifické pro platformu, umístění složek modelů a závislosti. Po instalaci spusťte místní server a otevřete ComfyUI ve svém prohlížeči, abyste mohli začít propojovat uzly.
Q2:Jaký je nejjednodušší ComfyUI workflow pro text-to-image?
Načtěte checkpoint, zakódujte pozitivní a negativní prompty pomocí CLIP, spusťte KSampler, dekódujte pomocí VAE a poté uložte obrázek. Tento řetězec je základem pro efektivní používání ComfyUI pro většinu generací.
Q3:Jak používám SDXL v ComfyUI?
Použijte SDXL checkpoint s duálními text encoders, poté volitelně přidejte refiner pass pro lepší detaily. Spusťte při 1024×1024 s vyváženým CFG (kolem 5–7) a efektivním samplerem, jako je DPM++ 2M Karras.
Q4:Mohu přidat ControlNet a LoRA ve stejném ComfyUI workflow?
Ano. Načtěte své LoRA a ControlNet uzly, připojte je k modelovému a KSampler conditioningu a laďte váhy (např. 0.6–0.8 pro LoRA, ~0.5–1.2 pro ControlNet). Sledujte využití VRAM a snižte rozlišení nebo kroky, pokud narazíte na OOM.
Q5:Proč mají moje ComfyUI obrázky nízký kontrast nebo jsou vybledlé?
Zkuste jiné VAE, snižte CFG nebo přepněte samplery. Některá VAEs produkují věrnější barvy a kontrast; malé úpravy mohou rychle opravit vybledlé výsledky.