Kaip naudotis ComfyUI: praktiškas, žingsnis po žingsnio gidas pradedantiesiems
Jei girdėjote, kad ComfyUI yra „mazgais paremta ir itin galinga“ platforma, bet jus baugina visos tos dėžutės ir laidai, nesate vieni. Gera žinia: išmokę keletą pagrindinių sąvokų – kontrolinius taškus, koduotuvus, imtuvus ir dekoduotuvus – kursite vaizdų darbo eigas kaip profesionalas. Šis praktinis vadovas padės jums išmokti naudotis ComfyUI nuo įdiegimo iki pirmųjų SDXL vaizdų, taip pat pateiks darbo eigas, skirtas ControlNet, LoRA ir kokybės/našumo optimizavimui.
Iki pabaigos tiksliai žinosite, kaip naudoti ComfyUI, kad galėtumėte nuosekliai, pakartotinai ir lanksčiai generuoti vaizdus be jokių spėliojimų.
Kas yra ComfyUI ir kodėl ją verta naudoti?
ComfyUI yra vizuali, mazgais paremta Stable Diffusion sąsaja, leidžianti jums žingsnis po žingsnio kurti vaizdų apdorojimo liniją. Vietoj vieno „Generuoti“ mygtuko jūs sujungiate mazgus – kiekvienas jų atlieka atskirą užduotį, pvz., modelio įkėlimą, teksto kodavimą, latentinių duomenų imtį arba galutinio vaizdo dekodavimą. Tai greita, modulinė ir skaidri sistema – puikiai tinkanti mokymuisi, eksperimentams ir gamybos darbo eigoms.
Greitas startas: ComfyUI įdiegimas ir paleidimas
- Windows/macOS/Linux: vadovaukitės oficialia saugykla ir bendruomenės įdiegimo vadovais. Galite naudoti rankinį įdiegimą (Python + priklausomybės) arba supakuotus metodus, priklausomai nuo jūsų platformos ir GPU. ComfyUI wiki pateikia žingsnis po žingsnio diegimo instrukcijas, skirtas Windows, macOS (įskaitant Apple Silicon) ir Linux.
- Modeliai: įdėkite savo Stable Diffusion kontrolinius taškus (pvz., SDXL base/refiner arba SD 1.5) į aplanką
models/checkpoints. Įdėkite VAE failus į models/vae, LoRA į models/loras, ControlNet modelius į models/controlnet.
- Paleidimas: paleiskite paleidimo scenarijų, skirtą jūsų OS; ComfyUI atsidarys jūsų naršyklėje. Drobė yra ta vieta, kur sujungsite mazgus.
Patarimas: norėdami užtikrinti geriausią našumą, nuolat atnaujinkite GPU tvarkykles ir CUDA įrankių rinkinį.
Pagrindinė sąvoka: minimali teksto į vaizdą darbo eiga
Pagrindinė ComfyUI teksto į vaizdą eiga (SD 1.5 stiliaus) atrodo taip:
- Mazgas: Checkpoint Loader
- Išvestis: UNet, CLIP ir VAE komponentai
- Mazgas: CLIP Text Encode (Positive)
- Mazgas: CLIP Text Encode (Negative)
- Išvestis: sąlygojimo įterpiniai gairėms
- Latentinių duomenų generavimas
- Įvestys: UNet, teigiamas/neigiamas sąlygojimas, sėkla, žingsniai, imtuvas (pvz., DPM++ 2M Karras) ir CFG skalė
- Išvestis: latentinis vaizdas
Šis pagrindinis grafikas – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – yra beveik visko, ką darysite ComfyUI, pagrindas.
SDXL darbo eiga: bazinis + (nebūtinas) patobulinimas
SDXL naudoja dvigubus teksto koduotuvus ir dažnai naudinga patobulinimo stadija.
- SDXL bazės įkėlimas: naudokite su SDXL suderinamą kontrolinį tašką. Daugelyje SDXL šablonų yra du CLIP koduotuvai (skirti dideliam/mažam kontekstui). Pateikite ir teigiamus, ir neigiamus įsakymus.
- KSampler (bazinis): generuokite latentinius duomenis 1024 × 1024 (arba jūsų tikslinę) skiriamąją gebą. Išsaugokite latentinius duomenis arba dekoduotus vaizdus.
- Nebūtinas patobulinimas: įkelkite SDXL Refiner kontrolinį tašką ir paleiskite papildomą KSampler etapą, sąlygotą bazinės išvesties, tada dekoduokite naudodami VAE.
Šis dviejų etapų procesas gali žymiai pagerinti detales ir nuoseklumą esant didesnei skiriamajai gebai.
Praktinė veikla: sukurkite savo pirmąjį ComfyUI grafiką
- Pradėkite nuo šablono: šoninėje juostoje įkelkite integruotą teksto į vaizdą pavyzdį.
- Pakeiskite kontrolinį tašką: pasirinkite savo SDXL arba SD 1.5 modelį.
- Parašykite savo įsakymą: naudokite Positive ir Negative CLIP mazgus. Pavyzdys:
- Teigiamas: „cinematinis portretas, švelnus studijos apšvietimas, 85 mm objektyvas, labai detalus, filmo grūdeliai“
- Neigiamas: „išplaukęs, mažos raiškos, deformuotas, papildomi pirštai, vandens ženklas“
- Žingsniai: 20–35 greičio/kokybės balansui
- Imtuvas: DPM++ 2M Karras (patikimas) arba Euler a (greitas)
- CFG: 4,5–7,5 (didesnis stipriau stumia įsakymą, bet gali per daug prisotinti)
- Sėkla: nustatykite ją atkuriamumui; keiskite tyrinėjimui
- Skiriamoji geba: SD 1.5 atveju pradėkite nuo 512 × 512 arba 768 × 768. SDXL atveju gerai veikia 1024 × 1024.
- Dekoduoti ir išsaugoti: pridėkite VAE Decode → Save Image. Spustelėkite Queue Prompt, kad sugeneruotumėte.
Pagrindinių mazgų supratimas (paprasta kalba)
- Checkpoint Loader: įkelia jūsų difuzijos modelį (UNet), teksto koduotuvą (-us) (CLIP) ir VAE. Pagalvokite apie tai kaip apie savo „variklį + kalbos smegenis + vaizdo vertėją“.
- CLIP Text Encode: konvertuoja jūsų įsakymą į skaitmeninius įterpinius, kuriuos modelis supranta. Naudokite ir teigiamus, ir neigiamus teksto koduotuvus.
- KSampler: vaizdo sintezės širdis. Jis pašalina latentinį triukšmą, vadovaujamas jūsų įsakymo ir imtuvo metodo per daugybę žingsnių.
- VAE Decode: konvertuoja galutinius latentinius duomenis į peržiūrimą vaizdą. VAE keitimas keičia spalvų/kontrasto tikslumą.
- Save Image: įrašo išvestį į diską su metaduomenimis, kad vėliau galėtumėte atkurti rezultatus.
Norėdami gauti išsamesnės informacijos apie šiuos statybinius blokus, peržiūrėkite pradedantiesiems skirtus suskirstymus ir mazgų paaiškinimus.
Patobulinimai: LoRA, ControlNet ir vaizdas į vaizdą
Naudokite LoRA stiliaus arba objekto valdymui
- Pridėkite LoRA Loader mazgą ir prijunkite jį prie savo modelio šakos.
- Stiprumas: pradėkite nuo maždaug 0,6–0,8; reguliuokite pagal stiliaus intensyvumą arba per didelį pritaikymą.
- Kelios LoRA: grandinė arba sujunkite, bet stebėkite, ar nėra konfliktų; sumažinkite stiprumą kraudami.
Pridėkite ControlNet tiksliai kompozicijai
- ControlNet mazgai leidžia jums valdyti kompoziciją naudojant įvesties žemėlapį (Canny, Depth, OpenPose ir kt.).
- Įprasta eiga: įkelkite ControlNet modelį → Iš anksto apdorokite savo gido vaizdą (pvz., Canny edge) → Įveskite ControlNet sąlygojimą į KSampler kartu su savo teksto sąlygojimu.
- Svoris: 0,5–1,2 yra gera pradžia. Per didelis svoris gali užgožti jūsų įsakymą.
Vaizdas į vaizdą arba užpildymas
- Pakeiskite pradinį triukšmą vaizdo latentiniais duomenimis per VAE Encode.
- Sureguliuokite triukšmo pašalinimo stiprumą KSampler, kad valdytumėte, kiek originalaus vaizdo lieka.
- Norėdami užpildyti, naudokite kaukės įvestį ir užpildymui skirtą imtuvo apdorojimo liniją.
Kokybės derinimas: įsakymai, CFG, imtuvai ir sėklos
- Įsakymų inžinerija: naudokite glaustus aprašymus, o ne pastraipas. Tvarka yra mažiau svarbi nei aiškumas, bet svarbiausius atributus laikykite priekyje.
- Žemas (3–5): daugiau kūrybiškumo, mažiau įsakymo laikymosi
- Vidutinis (6–8): subalansuotas
- Aukštas (9–12): stiprus laikymasis, gali sukurti artefaktus
- DPM++ 2M Karras: švarus, patikimas
- Euler a: greitas ir išraiškingas, puikiai tinka peržiūroms
- UniPC / Heun / DDIM: verta išbandyti; rezultatai skiriasi priklausomai nuo modelio
- Fiksuota sėkla = atkuriami rezultatai
- Keisti sėklą = tyrinėti įvairovę
Našumo patarimai, kaip užtikrinti sklandų atvaizdavimą
- VRAM biudžetas: sumažinkite skiriamąją gebą, žingsnius arba paketo dydį, jei pasiekiate OOM. SDXL esant 1024 × 1024 gali prireikti 8–12 GB VRAM, priklausomai nuo mazgų.
- Pusiau tikslus: įgalinkite fp16, kur palaikoma, kad sutaupytumėte daug atminties, o kokybės praradimas būtų nereikšmingas.
- Dengimas ir latentiniai didintuvai: generuokite mažesnius vaizdus, tada padidinkite juos per latentinį didintuvo mazgą arba vaizdo didintuvo modelį, kad sutaupytumėte VRAM.
- Kaupimas talpykloje: pakartotinai naudokite CLIP kodavimus ir dekoduotus VAE tarp paleidimų, kai įsakymai nesikeičia.
- Venkite nereikalingų šakų: papildomi atjungti mazgai vis tiek sunaudoja atmintį, kai vykdomi toje pačioje eilėje.
Darbo eigų organizavimas kaip profesionalas
- Grupuokite mazgus: naudokite rėmelius/etiketes sekcijoms organizuoti (Įsakymas, Modelis, Imtuvas, Išvestis ir kt.).
- Parametrų skydeliai: sukurkite „valdymo“ mazgus (pvz., tuščius įsakymų laukelius, slankiklius) viršuje, kad būtų lengva derinti.
- Išsaugoti/bendrinti: eksportuokite savo darbo eigos JSON ir pasilikite
naudotų modelių pastabą, kad būtų galima atkurti.
- Versijų valdymas: laikykite atskirus grafikus SD 1.5, SDXL ir specializuotoms apdorojimo linijoms (anime, fotorealistinis, gylis į vaizdą ir kt.).
Dažniausiai pasitaikančių problemų trikčių šalinimas
- Juodi arba tušti vaizdai:
- Neteisingas VAE arba trūksta VAE Decode
- Per mažas triukšmo pašalinimas (pvz., <0,2 img2img)
- Išbandykite kitą VAE; kai kurie VAE pastebimai pagerina kontrastą
- Sumažinkite CFG arba pakeiskite imtuvą
- Niekas nesikeičia tarp paleidimų:
- Sėkla yra fiksuota; įgalinkite atsitiktinį arba nustatykite naują sėklą
- Nepakanka atminties (OOM):
- Sumažinkite skiriamąją gebą, žingsnius arba paketo dydį; perjunkite į fp16
- Uždarykite kitas GPU programas; supaprastinkite ControlNet/LoRA stūmus
- Modelis nerastas / raudonas mazgas:
- Patikrinkite failų kelius ir modelių aplankus; patvirtinkite failų plėtinius
Mokykitės greičiau naudodami iš anksto sukurtas darbo eigas
Vaizdo įrašų apžvalgos ir pradedantiesiems skirtos serijos gali pagreitinti jūsų mokymosi kreivę naudojant paruoštus paleisti grafikus, kuriuos galite pristabdyti ir išnagrinėti. Rašytiniai vadovėliai ir wiki pateikia mazgų paaiškinimus ir atnaujintus diegimo veiksmus, kad nuolat atnaujintumėte informaciją.
Išplėstinis: grafų moduliavimas ir išplėtimas
- API/išoriniai mazgai: kai kurie vadovėliai apima ComfyUI prijungimą prie išorinių AI paslaugų per specialius mazgus, įgalinant hibridines apdorojimo linijas ir perkeliant sunkias užduotis.
- Mazgų bibliotekos ir plėtiniai: tyrinėkite bendruomenės mazgus, skirtus planuotojams, didintuvams ir išankstiniam apdorojimui (poza, gylis, segmentavimas). Visada patikrinkite suderinamumą su savo ComfyUI versija.
- SDXL patobulinimai ir sujungti imtuvai: paleiskite etapinį triukšmo pašalinimą (bazinis → patobulinimas) arba net kelis imtuvus stilistiniam maišymui.
Verta paminėti: įsakymų greitinimas naudojant Sider.AI
Jei dažnai kartojate įsakymus, nuorodas ar aprašymus, jums gali prireikti pagalbininko, kuris padėtų generuoti idėjas ir patobulintų variantus. Beje, Sider.AI gali padėti greitai parengti struktūrizuotus įsakymus, generuoti neigiamų įsakymų sąrašus ir apibendrinti jūsų darbo eigos eksperimentus, kad nepamestumėte eigos tarp paleidimų. Galite išbandyti čia: Paprasta SDXL pradinė darbo eiga (nukopijuokite šį modelį)
- Checkpoint Loader (SDXL bazinis)
- CLIP Text Encode (teigiamas) – „itin detali produkto nuotrauka, softbox apšvietimas, 50 mm objektyvas, atspindintis paviršius“
- CLIP Text Encode (neigiamas) – „mažos raiškos, judesio suliejimas, vandens ženklas, fono netvarka“
- KSampler: 1024 × 1024, 28 žingsniai, DPM++ 2M Karras, CFG 5,5, fiksuota sėkla
Nebūtini priedai:
- Patobulinimo etapas su SDXL Refiner kontroliniu tašku esant 10–15 žingsnių
- ControlNet (Depth) su paprastu objekto siluetu išdėstymui
- LoRA esant 0,6 konkrečiam prekės ženklui ar meno stiliui
Pagrindiniai dalykai
- ComfyUI galia slypi jos skaidrumas – kurkite savo apdorojimo liniją mazgas po mazgo.
- Pagrindinė teksto į vaizdą grandinė yra paprasta: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL naudingi dvigubi koduotuvai ir nebūtinas patobulinimo etapas detalėms.
- LoRA ir ControlNet suteikia jums stiliaus valdymą ir kompozicijos tikslumą.
- Sureguliuokite CFG, imtuvą ir sėklą, kad užtikrintumėte kokybę ir nuoseklumą; valdykite VRAM naudodami fp16 ir protingas skiriamąsias gebas.
- Organizuokite darbo eigas ir valdykite jų versijas, kad kartojimas būtų neskausmingas.
Kiti žingsniai
- Įdiekite ComfyUI vadovaudamiesi saugyklos/wiki instrukcijomis ir paleiskite bandomąją darbo eigą.
- Atkurkite minimalią grandinę nuo nulio, kad įtvirtintumėte pagrindus.
- Pridėkite ControlNet ir LoRA, tada A/B išbandykite imtuvo ir CFG nustatymus.
- Išsaugokite ir bendrinkite savo darbo eigos JSON su pastabomis apie modelius, sėklas ir parametrus.
Sėkmingo generavimo – ir sveiki atvykę į ramų, valdomą ComfyUI pasaulį.
DUK
Q1: Kaip įdiegti ir paleisti ComfyUI sistemoje Windows, macOS arba Linux?
Vadovaukitės oficialia saugykla ir bendruomenės wiki, kad gautumėte platformai būdingus veiksmus, modelių aplankų vietas ir priklausomybes. Įdiegę paleiskite vietinį serverį ir atidarykite ComfyUI naršyklėje, kad pradėtumėte jungti mazgus.
Q2: Kokia yra paprasčiausia ComfyUI darbo eiga tekstui į vaizdą?
Įkelkite kontrolinį tašką, užkoduokite teigiamus ir neigiamus įsakymus naudodami CLIP, paleiskite KSampler, dekoduokite naudodami VAE, tada išsaugokite vaizdą. Ši grandinė yra pagrindas, kaip efektyviai naudoti ComfyUI daugumai generavimų.
Q3: Kaip naudoti SDXL ComfyUI?
Naudokite SDXL kontrolinį tašką su dvigubais teksto koduotuvais, tada pasirinktinai pridėkite patobulinimo etapą, kad pagerintumėte detales. Paleiskite 1024 × 1024 skiriamąja geba su subalansuotu CFG (apie 5–7) ir efektyviu imtuvu, pvz., DPM++ 2M Karras.
Q4: Ar galiu pridėti ControlNet ir LoRA toje pačioje ComfyUI darbo eigoje?
Taip. Įkelkite LoRA ir ControlNet mazgus, prijunkite juos prie modelio ir KSampler sąlygojimų ir sureguliuokite svorius (pvz., 0,6–0,8 LoRA, ~0,5–1,2 ControlNet). Stebėkite VRAM naudojimą ir sumažinkite skiriamąją gebą arba žingsnius, jei pasiekiate OOM.
Q5: Kodėl mano ComfyUI vaizdai yra mažo kontrasto arba išblukę?
Išbandykite kitą VAE, sumažinkite CFG arba pakeiskite imtuvus. Kai kurie VAE sukuria ištikimesnę spalvą ir kontrastą; maži koregavimai gali greitai ištaisyti išblukusius rezultatus.