Kā lietot ComfyUI: Praktisks, soli pa solim ceļvedis iesācējiem
Ja esi dzirdējis, ka ComfyUI ir “uz mezgliem balstīts un ārkārtīgi jaudīgs”, bet jūties iebiedēts visu lodziņu un vadu dēļ, tu neesi viens. Labā ziņa: tiklīdz tu apgūsi dažus galvenos jēdzienus — kontrolpunktus, kodētājus, paraugņemšanas rīkus un dekodētājus —, tu veidosi attēlu darbplūsmas kā profesionālis. Šis praktiskais ceļvedis soli pa solim parāda, kā lietot ComfyUI, sākot no instalēšanas līdz pirmajiem SDXL attēliem, kā arī darbplūsmas ControlNet, LoRA un kvalitātes/veiktspējas regulēšanai.
Līdz beigām tu precīzi zināsi, kā lietot ComfyUI, lai ģenerētu konsekventus, atkārtojamus un elastīgus attēlus bez minējumiem.
Kas ir ComfyUI un kāpēc to lietot?
ComfyUI ir vizuāla, uz mezgliem balstīta saskarne Stable Diffusion, kas ļauj soli pa solim izstrādāt savu attēlu apstrādes konveijeru. Tā vietā, lai būtu viena poga “Ģenerēt”, tu savieno mezglus — katrs apstrādā atšķirīgu uzdevumu, piemēram, modeļa ielādi, teksta kodēšanu, latentu paraugu ņemšanu vai gala attēla dekodēšanu. Tas ir ātrs, modulārs un pārskatāms — lieliski piemērots mācībām, eksperimentiem un ražošanas darbplūsmām.
Ātrā palaišana: Instalējiet un palaidiet ComfyUI
- Windows/macOS/Linux: Izpildiet oficiālo repozitoriju un kopienas instalēšanas rokasgrāmatas. Atkarībā no savas platformas un GPU varat izmantot manuālu instalēšanu (Python + atkarības) vai iepakotus paņēmienus. ComfyUI wiki nodrošina soli pa solim uzstādīšanu Windows, macOS (ieskaitot Apple Silicon) un Linux.
- Modeļi: Novietojiet savus Stable Diffusion kontrolpunktus (piemēram, SDXL bāzes/precizētājs vai SD 1.5) mapē
models/checkpoints. Ievietojiet VAE failus mapē models/vae, LoRA failus mapē models/loras, ControlNet modeļus mapē models/controlnet.
- Palaist: Palaidiet starta skriptu savai OS; ComfyUI atveras jūsu pārlūkprogrammā. Audekls ir vieta, kur jūs savienosiet mezglus kopā.
Padoms: Lai nodrošinātu vislabāko veiktspēju, atjauniniet GPU draiverus un CUDA rīkkopu.
Galvenais jēdziens: Minimālā teksta-attēlā darbplūsma
ComfyUI pamata teksta-attēlā plūsma (SD 1.5 stilā) izskatās šādi:
- Mezgls: Checkpoint Loader
- Izvade: UNet, CLIP un VAE komponenti
- Mezgls: CLIP Text Encode (Positive)
- Mezgls: CLIP Text Encode (Negative)
- Izvade: Nosacījumu iegulumi vadībai
- Ievades: UNet, pozitīvi/negatīvi nosacījumi, sēkla, soļi, paraugņemšanas rīks (piemēram, DPM++ 2M Karras) un CFG skala
Šis pamata grafiks — Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save — ir pamats gandrīz visam, ko darīsi ComfyUI.
SDXL darbplūsma: Bāzes + (pēc izvēles) Precizētājs
SDXL izmanto duālos teksta kodētājus un bieži vien gūst labumu no precizētāja posma.
- Ielādēt SDXL bāzi: Izmantojiet ar SDXL saderīgu kontrolpunktu. Daudzas SDXL veidnes ietver divus CLIP kodētājus (lielam/mazam kontekstam). Ievadiet gan pozitīvas, gan negatīvas uzvednes.
- KSampler (bāze): Ģenerējiet latentus ar 1024 × 1024 (vai jūsu mērķi). Saglabājiet latentus vai dekodētus attēlus.
- Pēc izvēles precizētājs: Ielādējiet SDXL Refiner kontrolpunktu un palaidiet papildu KSampler posmu, kas balstīts uz bāzes izvadi, pēc tam dekodējiet ar VAE.
Šis divu posmu process var ievērojami uzlabot detaļas un saskaņotību pie lielākas izšķirtspējas.
Praktiski: Izveidojiet savu pirmo ComfyUI grafiku
- Sāciet ar veidni: Sānjoslā ielādējiet iebūvētu teksta-attēlā piemēru.
- Aizstājiet kontrolpunktu: Atlasiet savu SDXL vai SD 1.5 modeli.
- Uzrakstiet savu uzvedni: Izmantojiet Positive un Negative CLIP mezglus. Piemērs:
- Pozitīvs: “kinematogrāfisks portrets, maigs studijas apgaismojums, 85 mm objektīvs, ļoti detalizēts, filmu graudi”
- Negatīvs: “izplūdis, zemas izšķirtspējas, deformēts, papildu pirksti, ūdenszīme”
- Soļi: 20–35 ātruma/kvalitātes līdzsvaram
- Paraugņemšanas rīks: DPM++ 2M Karras (uzticams) vai Euler a (ātrs)
- CFG: 4,5–7,5 (augstāks grūž uzvedni spēcīgāk, bet var pārsātināt)
- Sēkla: Fiksējiet to reproducējamībai; mainiet izpētei
- Izšķirtspēja: SD 1.5 gadījumā sāciet ar 512 × 512 vai 768 × 768. SDXL gadījumā labi darbojas 1024 × 1024.
- Dekodēt un saglabāt: Pievienojiet VAE Decode → Save Image. Noklikšķiniet uz Queue Prompt, lai ģenerētu.
Galveno mezglu izpratne (vienkāršā valodā)
- Checkpoint Loader: Ielādē jūsu difūzijas modeli (UNet), teksta kodētāju(-us) (CLIP) un VAE. Domājiet par to kā par savu “dzinēju + valodas smadzenes + attēlu tulkotāju”.
- CLIP Text Encode: Pārvērš jūsu uzvedni skaitliskos iegulumos, ko modelis saprot. Izmantojiet gan pozitīvus, gan negatīvus teksta kodētājus.
- KSampler: Attēlu sintēzes sirds. Tas attīra latentu troksni, ko vada jūsu uzvedne un paraugņemšanas metode vairākos soļos.
- VAE Decode: Pārvērš gala latentus skatāmā attēlā. VAE apmaiņa maina krāsu/kontrasta precizitāti.
- Save Image: Ieraksta izvadi diskā ar metadatiem, lai vēlāk varētu atjaunot rezultātus.
Lai iegūtu dziļāku ieskatu šajos pamatelementos, skatiet iesācējiem draudzīgus sadalījumus un mezglu skaidrojumus.
Uzlabojumi: LoRA, ControlNet un attēls-attēlā
Izmantojiet LoRA stila vai objekta kontrolei
- Pievienojiet LoRA Loader mezglu un savienojiet to ar savu modeļa zaru.
- Stiprums: Sāciet apmēram ar 0,6–0,8; pielāgojiet, pamatojoties uz stila intensitāti vai pārmērīgu piemērotību.
- Vairāki LoRA: Ķēdē vai apvienojiet, bet uzmanieties no konfliktiem; samaziniet stiprumu, sakraujot.
Pievienojiet ControlNet precīzam kompozīcijai
- ControlNet mezgli ļauj jums vadīt kompozīciju, izmantojot ievades karti (Canny, dziļums, OpenPose utt.).
- Tipiskā plūsma: Ielādējiet ControlNet modeli → Apstrādājiet savu ceļveža attēlu (piemēram, Canny malu) → Ievadiet ControlNet nosacījumus KSampler kopā ar saviem teksta nosacījumiem.
- Svars: 0,5–1,2 ir labs sākums. Pārāk augsts var pārspēt jūsu uzvedni.
Attēls-attēlā vai iekrāsošana
- Aizstājiet sākotnējo troksni ar attēla latentu, izmantojot VAE Encode.
- Pielāgojiet trokšņa samazināšanas stiprumu KSampler, lai kontrolētu, cik daudz no sākotnējā attēla paliek.
- Iekrāsošanai izmantojiet maskas ievadi un iekrāsošanai piemērotu paraugņemšanas konveijeru.
Kvalitātes regulēšana: Uzvednes, CFG, paraugņemšanas rīki un sēklas
- Uzvednes inženierija: Izmantojiet kodolīgus deskriptorus, nevis rindkopas. Secībai ir mazāka nozīme nekā skaidrībai, bet svarīgus atribūtus turiet priekšplānā.
- Zems (3–5): Radošāks, mazāka uzvednes ievērošana
- Vidējs (6–8): Līdzsvarots
- Augsts (9–12): Spēcīga ievērošana, var radīt artefaktus
- Paraugņemšanas rīka izvēle:
- DPM++ 2M Karras: Tīrs, uzticams
- Euler a: Ātrs un izteiksmīgs, lieliski piemērots priekšskatījumiem
- UniPC / Heun / DDIM: Ir vērts testēt; rezultāti atšķiras atkarībā no modeļa
- Fiksēta sēkla = reproducējami rezultāti
- Mainīt sēklu = izpētīt daudzveidību
Veiktspējas padomi vienmērīgai renderēšanai
- VRAM budžets: Samaziniet izšķirtspēju, soļus vai pakešu lielumu, ja sasniedzat OOM. SDXL ar 1024 × 1024 var prasīt 8–12 GB VRAM atkarībā no mezgliem.
- Pusprecizitāte: Iespējojiet fp16, kur tas tiek atbalstīts, lai iegūtu lielus atmiņas ietaupījumus ar nenozīmīgiem kvalitātes zudumiem.
- Flīzēšana un latenti palielinātāji: Ģenerējiet mazākus, pēc tam palieliniet, izmantojot latentu palielinātāja mezglu vai attēlu palielinātāja modeli, lai ietaupītu VRAM.
- Kešatmiņa: Atkārtoti izmantojiet CLIP kodējumus un dekodētus VAE palaišanas reizēs, kad uzvednes nemainās.
- Izvairieties no nevajadzīgiem zariem: Papildu atvienoti mezgli joprojām patērē atmiņu, kad tie tiek izpildīti tajā pašā rindā.
Darbplūsmu organizēšana kā profesionālim
- Grupējiet mezglus: Izmantojiet rāmjus/etiķetes, lai organizētu sadaļas (uzvedne, modelis, paraugņemšanas rīks, izvade utt.).
- Parametru paneļi: Izveidojiet “kontroles” mezglus (piemēram, tukšus uzvedņu lodziņus, slīdņus) augšpusē ērtai regulēšanai.
- Saglabāt/kopīgot: Eksportējiet savu darbplūsmas JSON un saglabājiet
izmantoto modeļu piezīmi reproducējamībai.
- Versiju kontrole: Glabājiet atsevišķus grafikus SD 1.5, SDXL un specializētiem konveijeriem (anime, fotoreāls, dziļums-attēlā utt.).
Biežāko problēmu novēršana
- Nepareizs VAE vai trūkst VAE Decode
- Trokšņa samazināšana ir pārāk zema (piemēram, <0,2 img2img)
- Izmēģiniet citu VAE; daži VAE ievērojami uzlabo kontrastu
- Samaziniet CFG vai mainiet paraugņemšanas rīku
- Nekas nemainās starp palaišanas reizēm:
- Sēkla ir fiksēta; iespējojiet randomizēšanu vai iestatiet jaunu sēklu
- Samaziniet izšķirtspēju, soļus vai pakešu lielumu; pārslēdzieties uz fp16
- Aizveriet citas GPU lietotnes; vienkāršojiet ControlNet/LoRA steks
- Modelis nav atrasts / sarkans mezgls:
- Pārbaudiet failu ceļus un modeļu mapes; apstipriniet failu paplašinājumus
Ātrāk mācieties ar iepriekš izveidotām darbplūsmām
Video pamācības un iesācēju sērijas var paātrināt jūsu mācību līkni ar gataviem grafikiem, kurus varat apturēt un analizēt. Rakstiskās pamācības un wiki nodrošina mezglu skaidrojumus un atjauninātus instalēšanas soļus, lai jūs būtu informēts.
Papildu: Grafiku modularizācija un paplašināšana
- API/Ārējie mezgli: Dažas pamācības aptver ComfyUI savienošanu ar ārējiem AI pakalpojumiem, izmantojot īpašus mezglus, kas ļauj izveidot hibrīda konveijerus un atbrīvot smagus uzdevumus.
- Mezglu bibliotēkas un paplašinājumi: Izpētiet kopienas mezglus plānotājiem, palielinātājiem un pirmapstrādei (poza, dziļums, segmentācija). Vienmēr pārbaudiet saderību ar savu ComfyUI versiju.
- SDXL precizētāji un ķēdes paraugņemšanas rīki: Palaidiet iestudētu trokšņu samazināšanu (bāze → precizētājs) vai pat vairākus paraugņemšanas rīkus stilistiskai sajaukšanai.
Vērts atzīmēt: Uzvedņu paātrināšana ar Sider.AI
Ja jūs bieži atkārtojat uzvednes, atsauces vai aprakstus, iespējams, vēlēsities palīgu, lai ģenerētu idejas un precizētu variācijas. Starp citu, Sider.AI var palīdzēt ātri izstrādāt strukturētas uzvednes, ģenerēt negatīvu uzvedņu sarakstus un apkopot jūsu darbplūsmas eksperimentus, lai jūs nepazaudētu saikni starp palaišanas reizēm. Jūs varat to izmēģināt šeit: Vienkārša SDXL sākuma darbplūsma (kopējiet šo modeli)
- Checkpoint Loader (SDXL bāze)
- CLIP Text Encode (Positive) — “īpaši detalizēts produkta fotoattēls, softbox apgaismojums, 50 mm objektīvs, atstarojoša virsma”
- CLIP Text Encode (Negative) — “zema izšķirtspēja, kustības izplūdums, ūdenszīme, fona juceklis”
- KSampler: 1024 × 1024, 28 soļi, DPM++ 2M Karras, CFG 5,5, fiksēta sēkla
Pēc izvēles papildinājumi:
- Precizētāja posms ar SDXL Refiner kontrolpunktu pie 10–15 soļiem
- ControlNet (dziļums) ar vienkāršu objekta siluetu izkārtojumam
- LoRA ar 0,6 noteiktam zīmolam vai mākslas stilam
Galvenās atziņas
- ComfyUI jauda izriet no tā pārredzamības — izveidojiet savu konveijeru mezgls pēc mezgla.
- Pamata teksta-attēlā ķēde ir vienkārša: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL gūst labumu no duālajiem kodētājiem un pēc izvēles precizētāja posma detaļām.
- LoRA un ControlNet nodrošina stila kontroli un kompozīcijas precizitāti.
- Regulējiet CFG, paraugņemšanas rīku un sēklu kvalitātei un konsekvencei; pārvaldiet VRAM ar fp16 un saprātīgu izšķirtspēju.
- Organizējiet darbplūsmas un veidojiet to versijas, lai atvieglotu atkārtošanu.
Nākamie soļi
- Instalējiet ComfyUI, izpildot repozitorija/wiki norādījumus, un palaidiet darbplūsmas paraugu.
- Atjaunojiet minimālo ķēdi no nulles, lai nostiprinātu pamatus.
- Pievienojiet ControlNet un LoRA, pēc tam A/B testējiet paraugņemšanas rīka un CFG iestatījumus.
- Saglabājiet un kopīgojiet savu darbplūsmas JSON ar piezīmēm par modeļiem, sēklām un parametriem.
Veiksmīgu ģenerēšanu — un laipni lūdzam ComfyUI mierīgajā, kontrolējamajā pasaulē.
BUJ
Q1: Kā es varu instalēt un palaist ComfyUI operētājsistēmās Windows, macOS vai Linux?
Izpildiet oficiālo repozitoriju un kopienas wiki, lai iegūtu platformai specifiskus soļus, modeļu mapju atrašanās vietas un atkarības. Pēc instalēšanas palaidiet lokālo serveri un atveriet ComfyUI savā pārlūkprogrammā, lai sāktu savienot mezglus.
Q2: Kāda ir vienkāršākā ComfyUI darbplūsma teksta pārvēršanai par attēlu?
Ielādējiet kontrolpunktu, kodējiet pozitīvas un negatīvas uzvednes ar CLIP, palaidiet KSampler, dekodējiet ar VAE un pēc tam saglabājiet attēlu. Šī ķēde ir pamats tam, kā efektīvi izmantot ComfyUI lielākajai daļai ģenerēšanas.
Q3: Kā es varu izmantot SDXL ComfyUI?
Izmantojiet SDXL kontrolpunktu ar duālajiem teksta kodētājiem, pēc tam pēc izvēles pievienojiet precizētāja posmu, lai iegūtu labāku detalizāciju. Palaidiet ar 1024 × 1024 ar līdzsvarotu CFG (apmēram 5–7) un efektīvu paraugņemšanas rīku, piemēram, DPM++ 2M Karras.
Q4: Vai es varu pievienot ControlNet un LoRA tajā pašā ComfyUI darbplūsmā?
Jā. Ielādējiet savus LoRA un ControlNet mezglus, savienojiet tos ar modeļa un KSampler nosacījumiem un regulējiet svarus (piemēram, 0,6–0,8 LoRA, ~0,5–1,2 ControlNet). Uzraugiet VRAM izmantošanu un samaziniet izšķirtspēju vai soļus, ja sasniedzat OOM.
Q5: Kāpēc maniem ComfyUI attēliem ir zems kontrasts vai tie ir izbalējuši?
Izmēģiniet citu VAE, samaziniet CFG vai mainiet paraugņemšanas rīkus. Daži VAE rada uzticamāku krāsu un kontrastu; nelielas korekcijas var ātri novērst izbalējušus rezultātus.