Kuidas kasutada ComfyUI-d: praktiline samm-sammult juhend algajatele
Kui oled kuulnud, et ComfyUI on "sõlmedepõhine ja ülimalt võimas", kuid tunned end heidutatuna kõigist kastidest ja juhtmetest, siis sa pole üksi. Hea uudis on see: kui õpid selgeks mõned põhimõisted – kontrollpunktid, kodeerijad, näidised ja dekodeerijad – hakkad pilditöövooge looma nagu professionaal. See praktiline juhend juhatab sind läbi ComfyUI kasutamise alates paigaldamisest kuni esimeste SDXL-piltideni, lisaks töövoogude jaoks ControlNeti, LoRA-de ja kvaliteedi/jõudluse häälestamiseks.
Selle lõpuks tead täpselt, kuidas ComfyUI-d kasutada, et luua järjepidevaid, korratavaid ja paindlikke pildigeneratsioone ilma oletusteta.
Mis on ComfyUI ja miks seda kasutada?
ComfyUI on visuaalne, sõlmedepõhine liides Stable Diffusion jaoks, mis võimaldab sul oma pildikonveieri samm-sammult kujundada. Üheainsa nupu "Genereeri" asemel ühendad sõlmed – igaüks neist tegeleb eraldi ülesandega, nagu mudeli laadimine, teksti kodeerimine, latentsete andmete näidiste võtmine või lõpliku pildi dekodeerimine. See on kiire, modulaarne ja läbipaistev – ideaalne õppimiseks, katsetamiseks ja tootmistöövoogude jaoks.
Kiirkäivitus: installi ja käivita ComfyUI
- Windows/macOS/Linux: järgi ametlikku repositooriumi ja kogukonna installimisjuhiseid. Sa saad kasutada käsitsi installimist (Python + sõltuvused) või pakendatud meetodeid, olenevalt sinu platvormist ja GPU-st. ComfyUI wiki pakub samm-sammult seadistamist Windowsile, macOS-ile (sealhulgas Apple Silicon) ja Linuxile.
- Mudelid: paiguta oma Stable Diffusion kontrollpunktid (nt SDXL baas/viimistleja või SD 1.5) kausta
models/checkpoints. Pane VAE-failid kausta models/vae, LoRA-d kausta models/loras, ControlNeti mudelid kausta models/controlnet.
- Käivitus: käivita oma OS-i jaoks stardiskript; ComfyUI avaneb sinu brauseris. Lõuend on koht, kus sa sõlmed kokku ühendad.
Nipp: hoia oma GPU draiverid ja CUDA tööriistakomplekt parima jõudluse saavutamiseks ajakohasena.
Põhimõiste: minimaalne tekstist-pildiks töövoog
ComfyUI põhiline tekstist-pildiks voog (SD 1.5 stiilis) näeb välja selline:
- Väljund: UNet, CLIP ja VAE komponendid
- Sõlm: CLIP Text Encode (positiivne)
- Sõlm: CLIP Text Encode (negatiivne)
- Väljund: tingimuslikud manused juhiste jaoks
- Genereeri latentsed andmed
- Sisendid: UNet, positiivne/negatiivne tingimuslikkus, seeme, sammud, näidis (nt DPM++ 2M Karras) ja CFG skaala
See põhiline graafik – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – on peaaegu kõige alus, mida sa ComfyUI-s teed.
SDXL töövoog: baas + (valikuline) viimistleja
SDXL kasutab kahte teksti kodeerijat ja saab sageli kasu viimistleja läbimisest.
- Laadi SDXL baas: kasuta SDXL-iga ühilduvat kontrollpunkti. Paljud SDXL mallid sisaldavad kahte CLIP kodeerijat (suure/väikese konteksti jaoks). Sisesta nii positiivsed kui ka negatiivsed viiped.
- KSampler (baas): genereeri latentsed andmed suuruses 1024×1024 (või sinu sihtsuurus). Salvesta latentsed andmed või dekodeeritud pildid.
- Valikuline viimistleja: laadi SDXL viimistleja kontrollpunkt ja käivita täiendav KSampleri läbimine, mis on tingimuslikult seotud baasväljundiga, seejärel dekodeeri VAE-ga.
See kaheastmeline protsess võib oluliselt parandada detaile ja sidusust kõrgematel resolutsioonidel.
Praktiline tegevus: ehita oma esimene ComfyUI graafik
- Alusta mallist: laadi külgribalt sisse ehitatud tekstist-pildiks näide.
- Asenda kontrollpunkt: vali oma SDXL või SD 1.5 mudel.
- Kirjuta oma viip: kasuta positiivseid ja negatiivseid CLIP sõlmi. Näide:
- Positiivne: “filmilik portree, pehme stuudiovalgustus, 85mm objektiiv, väga detailne, filmilint”
- Negatiivne: “udune, madala eraldusvõimega, deformeerunud, lisa sõrmed, vesimärk”
- Sammud: 20–35 kiiruse/kvaliteedi tasakaalu jaoks
- Näidis: DPM++ 2M Karras (usaldusväärne) või Euler a (kiire)
- CFG: 4.5–7.5 (kõrgem surub viipa tugevamalt, kuid võib üleküllastada)
- Seeme: fikseeri see reprodutseeritavuse jaoks; varieeri uurimiseks
- Resolutsioon: SD 1.5 puhul alusta 512×512 või 768×768. SDXL puhul sobib hästi 1024×1024.
- Dekodeeri ja salvesta: lisa VAE Decode → Save Image. Klõpsa Queue Prompt, et genereerida.
Põhisõlmede mõistmine (lihtsas keeles)
- Checkpoint Loader: laadib sinu difusioonimudeli (UNet), teksti kodeerija(d) (CLIP) ja VAE. Mõtle sellele kui sinu “mootor + keeleaju + pildi tõlkija”.
- CLIP Text Encode: teisendab sinu viipa numbrilisteks manusteks, millest mudel aru saab. Kasuta nii positiivseid kui ka negatiivseid teksti kodeerijaid.
- KSampler: pildisünteesi süda. See eemaldab latentse müra, mida juhivad sinu viip ja näidismeetod üle mitmete sammude.
- VAE Decode: tõlgib lõplikud latentsed andmed vaadatavaks pildiks. VAE-de vahetamine muudab värvi/kontrasti täpsust.
- Save Image: kirjutab väljundi kettale koos metaandmetega, et saaksid tulemusi hiljem taastada.
Nende ehitusplokkide sügavamaks uurimiseks vaata algajasõbralikke jaotusi ja sõlmede selgitusi.
Võimsuse suurendajad: LoRA, ControlNet ja pildist-pildiks
Kasuta LoRA-t stiili või subjekti kontrollimiseks
- Lisa LoRA Loader sõlm ja ühenda see oma mudeli haruga.
- Tugevus: alusta umbes 0.6–0.8; kohanda vastavalt stiili intensiivsusele või üleõppimisele.
- Mitu LoRA-t: ahel või ühenda, kuid jälgi konflikte; alanda tugevust virnastamisel.
Lisa ControlNet täpse kompositsiooni jaoks
- ControlNet sõlmed võimaldavad sul juhtida kompositsiooni sisendkaardi (Canny, Depth, OpenPose jne) abil.
- Tüüpiline voog: laadi ControlNet mudel → töötle oma juhendpilt eeltööd (nt Canny serv) → sööda ControlNet tingimuslikkus KSamplerisse koos sinu teksti tingimuslikkusega.
- Kaal: 0.5–1.2 on hea algus. Liiga kõrge võib sinu viipa üle jõu käia.
Pildist-pildiks või sissemaalimine
- Asenda esialgne müra pildi latentsusega VAE Encode kaudu.
- Kohanda müraeemalduse tugevust KSampleris, et kontrollida, kui palju algsest pildist alles jääb.
- Sissemaalimise jaoks kasuta maski sisendit ja sissemaalimisteadlikku näidis konveierit.
Kvaliteedi häälestamine: viiped, CFG, näidised ja seemned
- Viipade inseneritöö: kasuta lühikesi kirjeldusi, mitte lõike. Järjekord on vähem oluline kui selgus, kuid hoia kriitilised atribuudid ees.
- Madal (3–5): loomingulisem, vähem viipade järgimine
- Keskmine (6–8): tasakaalustatud
- Kõrge (9–12): tugev järgimine, võib tekitada artefakte
- DPM++ 2M Karras: puhas, usaldusväärne
- Euler a: kiire ja väljendusrikas, suurepärane eelvaadete jaoks
- UniPC / Heun / DDIM: väärt testimist; tulemused varieeruvad mudeli järgi
- Fikseeritud seeme = reprodutseeritavad tulemused
- Varieeri seemet = uuri mitmekesisust
Jõudlusnipid sujuvaks renderdamiseks
- VRAM eelarvestamine: alanda resolutsiooni, samme või paketi suurust, kui saavutad OOM-i. SDXL suuruses 1024×1024 võib sõltuvalt sõlmedest nõuda 8–12 GB VRAM-i.
- Pooltäpsus: luba fp16, kus see on toetatud, et saavutada suur mälusääst koos tühise kvaliteedikaoga.
- Plaatimine ja latentsed ülesskaleerijad: genereeri väiksemalt, seejärel skaleeri üles latentsõlme või pildi ülesskaleerija mudeli kaudu, et säästa VRAM-i.
- Vahemällu salvestamine: kasuta uuesti CLIP kodeeringuid ja dekodeeritud VAE-sid käivituste vahel, kui viiped ei muutu.
- Väldi tarbetuid harusid: täiendavad lahtiühendatud sõlmed kulutavad ikka veel mälu, kui neid käivitatakse samas järjekorras.
Töövoogude organiseerimine nagu professionaal
- Gruppeeri sõlmed: kasuta raame/silte sektsioonide organiseerimiseks (viip, mudel, näidis, väljund jne).
- Parameetripaneelid: loo "kontroll" sõlmed (nt tühjad viibakastid, liugurid) ülaosas, et neid oleks lihtne häälestada.
- Salvesta/jaga: ekspordi oma töövoo JSON ja hoia
kasutatud mudelite kohta märget reprodutseeritavuse tagamiseks.
- Versioonimine: hoia eraldi graafikuid SD 1.5, SDXL ja eriotstarbeliste konveierite jaoks (anime, fotorealistlik, sügavusest-pildiks jne).
Levinud probleemide tõrkeotsing
- Mustad või tühjad pildid:
- Vale VAE või puuduv VAE Decode
- Müraeemaldus liiga madal (nt <0.2 img2img puhul)
- Proovi teist VAE-d; mõned VAE-d parandavad märgatavalt kontrasti
- Alanda CFG-d või muuda näidist
- Miski ei muutu käivituste vahel:
- Seeme on fikseeritud; luba juhuslikustamine või määra uus seeme
- Vähenda resolutsiooni, samme või paketi suurust; lülitu fp16-le
- Sule teised GPU rakendused; lihtsusta ControlNet/LoRA virnasid
- Mudelit ei leitud / punane sõlm:
- Kontrolli failiteid ja mudelikaustu; kinnita faililaiendid
Õpi kiiremini eelnevalt ehitatud töövoogudega
Video juhendid ja algajate seeriad võivad kiirendada sinu õppimiskõverat valmisolevate graafikutega, mida saad peatada ja lahti võtta. Kirjalikud õpetused ja wikid pakuvad sõlmede selgitusi ja uuendatud paigaldussamme, et sind kursis hoida.
Täpsem: oma graafikute modulariseerimine ja laiendamine
- API/välised sõlmed: mõned õpetused käsitlevad ComfyUI ühendamist väliste AI teenustega spetsiaalsete sõlmede kaudu, võimaldades hübriidseid konveiereid ja raskete ülesannete mahalaadimist.
- Sõlmede raamatukogud ja laiendused: uuri kogukonna sõlmi ajastajate, ülesskaleerijate ja eeltöötluse jaoks (poos, sügavus, segmenteerimine). Kontrolli alati ühilduvust oma ComfyUI versiooniga.
- SDXL viimistlejad ja aheldatud näidised: käivita lavastatud müraeemaldus (baas → viimistleja) või isegi mitu näidist stilistiliseks segamiseks.
Väärib märkimist: viipade koostamise kiirendamine Sider.AI abil
Kui sa korduvalt itereerid viipade, viidete või kirjelduste peal, võid soovida abilist, et ajurünnakuid teha ja variatsioone viimistleda. Muide, Sider.AI saab sind aidata kiiresti koostada struktureeritud viipasid, genereerida negatiivseid viipade loendeid ja võtta kokku sinu töövoo katsetused, et sa ei kaotaks käivituste vahel silmist. Sa saad seda proovida siin: Lihtne SDXL starditöövoog (kopeeri see muster)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (positiivne) – “üli detailne tootefoto, softbox valgustus, 50mm objektiiv, peegeldav pind”
- CLIP Text Encode (negatiivne) – “madala eraldusvõimega, liikumishägu, vesimärk, taustahäired”
- KSampler: 1024×1024, 28 sammu, DPM++ 2M Karras, CFG 5.5, fikseeritud seeme
Valikulised lisad:
- Viimistleja läbimine SDXL Viimistleja kontrollpunktiga 10–15 sammuga
- ControlNet (Depth) lihtsa objekti siluetiga paigutuse jaoks
- LoRA 0.6 juures konkreetse brändi või kunstistiili jaoks
Põhilised järeldused
- ComfyUI võimsus tuleneb selle läbipaistvusest – ehita oma konveier sõlm haaval.
- Põhiline tekstist-pildiks ahel on lihtne: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL saab kasu kahekordsetest kodeerijatest ja valikulisest viimistleja läbimisest detailide jaoks.
- LoRA-d ja ControlNet annavad sulle stiili kontrolli ja kompositsiooni täpsuse.
- Häälesta CFG, näidis ja seeme kvaliteedi ja järjepidevuse jaoks; halda VRAM-i fp16 ja mõistlike resolutsioonidega.
- Organiseeri töövoogusid ja versiooneeri neid valutuks itereerimiseks.
Järgmised sammud
- Installi ComfyUI, järgides repositooriumi/wiki juhiseid, ja käivita näidistöövoog.
- Ehitada minimaalne ahel nullist üles, et põhitõed kinnistada.
- Lisa ControlNet ja LoRA, seejärel A/B testi näidise ja CFG seadeid.
- Salvesta ja jaga oma töövoo JSON-i koos märkmetega mudelite, seemnete ja parameetrite kohta.
Head genereerimist – ja tere tulemast ComfyUI rahulikku, kontrollitavasse maailma.
KKK
K1: Kuidas ma installin ja käivitan ComfyUI Windowsis, macOS-is või Linuxis?
Järgi ametlikku repositooriumi ja kogukonna wikit platvormispetsiifiliste sammude, mudelikaustade asukohtade ja sõltuvuste jaoks. Pärast installimist käivita kohalik server ja ava ComfyUI oma brauseris, et alustada sõlmede ühendamist.
K2: Mis on kõige lihtsam ComfyUI töövoog tekstist-pildiks genereerimiseks?
Laadi kontrollpunkt, kodeeri positiivsed ja negatiivsed viiped CLIP-ga, käivita KSampler, dekodeeri VAE-ga, seejärel salvesta pilt. See ahel on aluseks, kuidas ComfyUI-d enamiku generatsioonide jaoks tõhusalt kasutada.
K3: Kuidas ma saan ComfyUI-s SDXL-i kasutada?
Kasuta SDXL kontrollpunkti koos kahekordsete teksti kodeerijatega, seejärel lisa valikuliselt viimistleja läbimine paremate detailide jaoks. Käivita 1024×1024 juures tasakaalustatud CFG-ga (umbes 5–7) ja tõhusa näidisega nagu DPM++ 2M Karras.
K4: Kas ma saan samas ComfyUI töövoos lisada ControlNet ja LoRA?
Jah. Laadi oma LoRA ja ControlNet sõlmed, ühenda need mudeli ja KSampleri tingimuslikkustega ning häälesta kaale (nt 0.6–0.8 LoRA puhul, ~0.5–1.2 ControlNet puhul). Jälgi VRAM-i kasutust ja vähenda resolutsiooni või samme, kui saavutad OOM-i.
K5: Miks on minu ComfyUI pildid madala kontrastsusega või väljapestud?
Proovi teist VAE-d, alanda CFG-d või vaheta näidiseid. Mõned VAE-d toodavad tõetruumat värvi ja kontrasti; väikesed kohandused võivad väljapestud tulemusi kiiresti parandada.