Jinsi ya Kutumia ComfyUI: Mwongozo wa Kivitendo, Hatua kwa Hatua kwa Wanaoanza
Ikiwa umesikia kwamba ComfyUI ni "yenye msingi wa nodi na yenye nguvu sana" lakini umeogopa na masanduku na nyaya zote, hauko peke yako. Habari njema: mara tu unapojifunza dhana chache za msingi—vituo vya ukaguzi, visimbaji, vichukuzi sampuli, na visimbuzi—utakuwa unaunda mtiririko wa kazi wa picha kama mtaalamu. Mwongozo huu wa kivitendo unakuelekeza jinsi ya kutumia ComfyUI kutoka usakinishaji hadi picha zako za kwanza za SDXL, pamoja na mtiririko wa kazi wa ControlNet, LoRA, na urekebishaji wa ubora/utendaji.
Mwishoni, utajua haswa jinsi ya kutumia ComfyUI kutengeneza vizazi vya picha thabiti, vinavyoweza kurudiwa, na vinavyobadilika bila kubahatisha.
ComfyUI ni Nini na Kwa Nini Uitumie?
ComfyUI ni kiolesura cha kuona, chenye msingi wa nodi cha Stable Diffusion ambacho hukuruhusu kubuni mchakato wako wa picha hatua kwa hatua. Badala ya kitufe kimoja cha "Zalisha", unaunganisha nodi—kila moja ikishughulikia kazi tofauti kama vile kupakia modeli, kusimba maandishi, kuchukua sampuli za hali fiche, au kusimbua picha ya mwisho. Ni ya haraka, ya kimfumo, na ya uwazi—bora kwa kujifunza, majaribio, na mtiririko wa kazi wa uzalishaji.
Mwanzo wa Haraka: Sakinisha na Uzindue ComfyUI
- Windows/macOS/Linux: Fuata repo rasmi na miongozo ya usakinishaji ya jamii. Unaweza kutumia usakinishaji wa mikono (Python + vitegemezi) au njia zilizofungashwa kulingana na jukwaa lako na GPU. Wiki ya ComfyUI inatoa usanidi wa hatua kwa hatua kwa Windows, macOS (pamoja na Apple Silicon), na Linux.
- Modeli: Weka vituo vyako vya ukaguzi vya Stable Diffusion (mfano, SDXL base/refiner au SD 1.5) kwenye folda ya
models/checkpoints. Weka faili za VAE kwenye models/vae, LoRA kwenye models/loras, modeli za ControlNet kwenye models/controlnet.
- Uzinduzi: Endesha hati ya kuanzisha kwa OS yako; ComfyUI inafunguliwa kwenye kivinjari chako. Turubai ndipo utaunganisha nodi pamoja.
Kidokezo: Weka viendeshi vyako vya GPU na zana ya CUDA iliyosasishwa kwa utendaji bora.
Dhana ya Msingi: Mtiririko wa Kazi Mdogo wa Maandishi hadi Picha
Mtiririko wa msingi wa maandishi hadi picha wa ComfyUI (mtindo wa SD 1.5) unaonekana kama hii:
- Nodi: Kipakiaji cha Kituo cha Ukaguzi
- Pato: Vipengele vya UNet, CLIP, na VAE
- Nodi: CLIP Text Encode (Chanya)
- Nodi: CLIP Text Encode (Hasi)
- Pato: Upachikaji wa masharti kwa mwongozo
- Vipengele vya ndani: UNet, masharti chanya/hasi, mbegu, hatua, kichukuzi sampuli (mfano, DPM++ 2M Karras), na kiwango cha CFG
Grafu hii ya msingi—Checkpoint → CLIP (chanya/hasi) → KSampler → VAE Decode → Save—ndio msingi wa karibu kila kitu utakachofanya katika ComfyUI.
Mtiririko wa Kazi wa SDXL: Msingi + (Hiari) Kiboreshaji
SDXL hutumia visimbaji vya maandishi viwili na mara nyingi hunufaika na pitio la kiboreshaji.
- Pakia Msingi wa SDXL: Tumia kituo cha ukaguzi kinachooana na SDXL. Violezo vingi vya SDXL vinajumuisha visimbaji viwili vya CLIP (kwa muktadha mkuu/mdogo). Lisha maswali chanya na hasi.
- KSampler (Msingi): Zalisha hali fiche kwa 1024×1024 (au lengo lako). Hifadhi hali fiche au picha zilizosimbuliwa.
- Kiboreshaji Hiari: Pakia kituo cha ukaguzi cha Kiboreshaji cha SDXL na uendeshe pitio la ziada la KSampler lililo na masharti kwenye pato la msingi, kisha usimbe na VAE.
Mchakato huu wa hatua mbili unaweza kuboresha sana undani na mshikamano katika maazimio ya juu.
Vitendo: Jenga Grafu Yako ya Kwanza ya ComfyUI
- Anza kutoka kwa kiolezo: Kwenye upau wa kando, pakia mfano uliojengwa ndani wa maandishi hadi picha.
- Badilisha kituo cha ukaguzi: Chagua modeli yako ya SDXL au SD 1.5.
- Andika swali lako: Tumia nodi za CLIP Chanya na Hasi. Mfano:
- Chanya: “picha ya sinema, taa laini za studio, lenzi ya 85mm, iliyo na maelezo mengi, nafaka ya filamu”
- Hasi: “iliyofifia, ubora duni, iliyoharibika, vidole vya ziada, alama ya maji”
- Hatua: 20–35 kwa usawa wa kasi/ubora
- Kichukuzi sampuli: DPM++ 2M Karras (ya kuaminika) au Euler a (ya haraka)
- CFG: 4.5–7.5 (ya juu zaidi inasukuma swali kwa nguvu zaidi, lakini inaweza kujaa kupita kiasi)
- Mbegu: Rekebisha kwa uwezo wa kuzaliana; badilisha kwa uchunguzi
- Azimio: Kwa SD 1.5, anza kwa 512×512 au 768×768. Kwa SDXL, 1024×1024 inafanya kazi vizuri.
- Simba na Uhifadhi: Ongeza VAE Decode → Hifadhi Picha. Bofya Foleni Swali ili kuzalisha.
Kuelewa Nodi Muhimu (Katika Lugha Rahisi)
- Kipakiaji cha Kituo cha Ukaguzi: Hupakia modeli yako ya usambazaji (UNet), visimbaji maandishi (CLIP), na VAE. Ifikirie kama "injini yako + ubongo wa lugha + mfasiri wa picha."
- CLIP Text Encode: Hubadilisha swali lako kuwa upachikaji wa nambari ambao modeli inaelewa. Tumia visimbaji maandishi chanya na hasi.
- KSampler: Moyo wa usanisi wa picha. Huondoa kelele fiche iliyoongozwa na swali lako na mbinu ya kichukuzi sampuli katika idadi ya hatua.
- VAE Decode: Hutafsiri hali fiche za mwisho kuwa picha inayoonekana. Kubadilisha VAE hubadilisha uaminifu wa rangi/tofauti.
- Hifadhi Picha: Huandika pato kwenye diski na metadata ili uweze kuunda tena matokeo baadaye.
Kwa uchunguzi wa kina zaidi juu ya vizuizi hivi vya ujenzi, angalia uchambuzi rafiki kwa wanaoanza na maelezo ya nodi.
Nguvu-Juu: LoRA, ControlNet, na Picha hadi Picha
Tumia LoRA kwa Mtindo au Udhibiti wa Mada
- Ongeza nodi ya Kipakiaji cha LoRA na uiunganishe kwenye tawi lako la modeli.
- Nguvu: Anza karibu 0.6–0.8; rekebisha kulingana na nguvu ya mtindo au kutoshea kupita kiasi.
- LoRA Nyingi: Unganisha au uunganishe, lakini angalia migogoro; punguza nguvu wakati wa kuweka.
Ongeza ControlNet kwa Utunzi Sahihi
- Nodi za ControlNet hukuruhusu kuongoza utunzi kwa kutumia ramani ya ingizo (Canny, Kina, OpenPose, n.k.).
- Mtiririko wa kawaida: Pakia modeli ya ControlNet → Chakata awali picha yako ya mwongozo (mfano, makali ya Canny) → Lisha masharti ya ControlNet kwenye KSampler pamoja na masharti yako ya maandishi.
- Uzito: 0.5–1.2 ni mwanzo mzuri. Ya juu sana inaweza kushinda swali lako.
Picha hadi Picha au Uchoraji Ndani
- Badilisha kelele ya awali na hali fiche ya picha kupitia VAE Encode.
- Rekebisha nguvu ya kuondoa kelele katika KSampler ili kudhibiti ni kiasi gani cha picha asili kinasalia.
- Kwa uchoraji ndani, tumia ingizo la kinyago na mchakato wa kichukuzi sampuli unaofahamu uchoraji ndani.
Urekebishaji wa Ubora: Maswali, CFG, Vichukuzi Sampuli, na Mbegu
- Uhandisi wa maswali: Tumia visifa vifupi, sio aya. Agizo halijalishi sana kuliko uwazi, lakini weka sifa muhimu mbele.
- Chini (3–5): Ubunifu zaidi, kushikamana kidogo na swali
- Kati (6–8): Imesawazishwa
- Juu (9–12): Kushikamana kwa nguvu, kunaweza kuunda vizalia vya sanaa
- Uchaguzi wa kichukuzi sampuli:
- DPM++ 2M Karras: Safi, ya kuaminika
- Euler a: Ya haraka na ya kueleza, bora kwa muhtasari
- UniPC / Heun / DDIM: Inafaa kujaribu; matokeo yanatofautiana na modeli
- Mbegu iliyorekebishwa = matokeo yanayoweza kuzalishwa
- Mbegu tofauti = chunguza utofauti
Vidokezo vya Utendaji kwa Utoaji Laini
- Bajeti ya VRAM: Punguza azimio, hatua, au ukubwa wa bechi ikiwa uta fikia OOM. SDXL kwa 1024×1024 inaweza kuhitaji 8–12 GB VRAM kulingana na nodi.
- Usahihi wa nusu: Washa fp16 ambapo inasaidiwa kwa akiba kubwa ya kumbukumbu na upotezaji mdogo wa ubora.
- Kuweka vigae na vikuza hali fiche: Zalisha ndogo, kisha uinue kupitia nodi ya kikuza hali fiche au modeli ya kikuza picha ili kuokoa VRAM.
- Akiba: Tumia tena usimbaji wa CLIP na VAE zilizosimbuliwa kwenye endeshaji wakati maswali hayabadiliki.
- Epuka matawi yasiyo ya lazima: Nodi za ziada zilizokatwa bado hutumia kumbukumbu zinapoendeshwa kwenye foleni sawa.
Kupanga Mtiririko wa Kazi Kama Mtaalamu
- Nodi za kikundi: Tumia fremu/lebo kupanga sehemu (Swali, Modeli, Kichukuzi Sampuli, Pato, n.k.).
- Paneli za kigezo: Unda nodi za "udhibiti" (mfano, masanduku tupu ya swali, vitelezi) juu kwa urekebishaji rahisi.
- Hifadhi/shiriki: Hamisha JSON yako ya mtiririko wa kazi na uweke dokezo la
modeli zilizotumiwa kwa uwezo wa kuzaliana.
- Utoaji toleo: Weka grafu tofauti kwa SD 1.5, SDXL, na michakato maalum (anime, picha halisi, kina hadi picha, n.k.).
Kutatua Masuala ya Kawaida
- VAE isiyo sahihi au VAE Decode haipo
- Ondoa kelele chini sana (mfano, <0.2 katika img2img)
- Jaribu VAE nyingine; VAE zingine huboresha tofauti kwa kiasi kikubwa
- Punguza CFG au ubadilishe kichukuzi sampuli
- Hakuna kinachobadilika katika endeshaji:
- Mbegu imerekebishwa; washa nasibu au weka mbegu mpya
- Punguza azimio, hatua, au ukubwa wa bechi; badili hadi fp16
- Funga programu zingine za GPU; rahisisha mirundo ya ControlNet/LoRA
- Modeli haipatikani / nodi nyekundu:
- Thibitisha njia za faili na folda za modeli; thibitisha viendelezi vya faili
Jifunze Haraka na Mtiririko wa Kazi Uliojengwa Awali
Miongozo ya video na mfululizo wa wanaoanza unaweza kuharakisha mkondo wako wa kujifunza na grafu tayari za kuendeshwa ambazo unaweza kusitisha na kuchambua. Mafunzo yaliyoandikwa na wiki hutoa maelezo ya nodi na hatua zilizosasishwa za usakinishaji ili kukufanya uwe wa sasa.
Kiwango cha Juu: Kubadilisha na Kupanua Grafu Zako
- API/Nodi za nje: Baadhi ya mafunzo hufunika kuunganisha ComfyUI kwa huduma za nje za AI kupitia nodi maalum, kuwezesha michakato mseto na kupunguza kazi nzito.
- Maktaba na viendelezi vya nodi: Gundua nodi za jamii kwa vipanga ratiba, vikuza, na uchakataji awali (pose, kina, mgawanyiko). Daima angalia uoanifu na toleo lako la ComfyUI.
- Viboreshaji vya SDXL na vichukuzi sampuli vilivyounganishwa: Endesha uondoaji kelele ulioandaliwa (msingi → kiboreshaji) au hata vichukuzi sampuli vingi kwa mchanganyiko wa mtindo.
Inafaa Kuzingatia: Kuharakisha Uulizaji na Sider.AI
Ikiwa mara kwa mara unarudia maswali, marejeleo, au maelezo, unaweza kutaka msaidizi wa kuchangia mawazo na kuboresha tofauti. Kwa njia, Sider.AI inaweza kukusaidia kuandaa haraka maswali yaliyopangwa, kutoa orodha hasi za swali, na kufanya muhtasari wa majaribio yako ya mtiririko wa kazi ili usipoteze wimbo kati ya endeshaji. Unaweza kuijaribu hapa: Mtiririko Rahisi wa Kuanzisha wa SDXL (Nakili Mfumo Huu)
- Kipakiaji cha Kituo cha Ukaguzi (Msingi wa SDXL)
- CLIP Text Encode (Chanya) — “picha ya bidhaa iliyo na maelezo ya hali ya juu, taa ya softbox, lenzi ya 50mm, uso unaoakisi”
- CLIP Text Encode (Hasi) — “ubora duni, ukungu wa mwendo, alama ya maji, mrundikano wa mandharinyuma”
- KSampler: 1024×1024, hatua 28, DPM++ 2M Karras, CFG 5.5, mbegu iliyorekebishwa
- VAE Decode → Hifadhi Picha
Viongezi vya hiari:
- Pitio la kiboreshaji na kituo cha ukaguzi cha Kiboreshaji cha SDXL kwa hatua 10–15
- ControlNet (Kina) na silhouette rahisi ya kitu kwa mpangilio
- LoRA kwa 0.6 kwa chapa au mtindo maalum wa sanaa
Mambo Muhimu ya Kuzingatia
- Nguvu ya ComfyUI inatokana na uwazi wake—jenga bomba lako hatua kwa hatua.
- Mnyororo wa msingi wa maandishi hadi picha ni rahisi: Checkpoint → CLIP (chanya/hasi) → KSampler → VAE Decode → Save.
- SDXL hunufaika na visimbaji viwili na pitio la kiboreshaji hiari kwa undani.
- LoRA na ControlNet hukupa udhibiti wa mtindo na usahihi wa utunzi.
- Rekebisha CFG, kichukuzi sampuli, na mbegu kwa ubora na uthabiti; dhibiti VRAM na fp16 na maazimio yenye akili.
- Panga mtiririko wa kazi na utoe toleo kwa ajili ya marudio yasiyo na uchungu.
Hatua Zinazofuata
- Sakinisha ComfyUI kufuatia maagizo ya repo/wiki na uzindue mtiririko wa kazi wa sampuli.
- Jenga upya mnyororo mdogo kutoka mwanzo ili kuimarisha misingi.
- Ongeza ControlNet na LoRA, kisha jaribu mipangilio ya kichukuzi sampuli na CFG ya A/B.
- Hifadhi na ushiriki JSON yako ya mtiririko wa kazi na madokezo kwenye modeli, mbegu, na vigezo.
Uzalishaji mwema—na karibu kwenye ulimwengu mtulivu, unaodhibitiwa wa ComfyUI.
Maswali Yanayoulizwa Mara kwa Mara
Swali la 1: Ninawezaje kusakinisha na kuendesha ComfyUI kwenye Windows, macOS, au Linux?
Fuata repo rasmi na wiki ya jamii kwa hatua mahususi za jukwaa, maeneo ya folda za modeli, na vitegemezi. Baada ya usakinishaji, zindua seva ya ndani na ufungue ComfyUI kwenye kivinjari chako ili kuanza kuunganisha nodi.
Swali la 2: Ni mtiririko gani rahisi zaidi wa ComfyUI kwa maandishi hadi picha?
Pakia kituo cha ukaguzi, simba maswali chanya na hasi na CLIP, endesha KSampler, usimbe na VAE, kisha uhifadhi picha. Mnyororo huu ndio msingi wa jinsi ya kutumia ComfyUI kwa ufanisi kwa vizazi vingi.
Swali la 3: Ninawezaje kutumia SDXL katika ComfyUI?
Tumia kituo cha ukaguzi cha SDXL na visimbaji viwili vya maandishi, kisha hiari ongeza pitio la kiboreshaji kwa undani bora. Endesha kwa 1024×1024 na CFG iliyosawazishwa (karibu 5–7) na kichukuzi sampuli chenye ufanisi kama DPM++ 2M Karras.
Swali la 4: Je, ninaweza kuongeza ControlNet na LoRA katika mtiririko sawa wa kazi wa ComfyUI?
Ndiyo. Pakia nodi zako za LoRA na ControlNet, ziunganishe kwenye modeli na masharti ya KSampler, na urekebishe uzito (mfano, 0.6–0.8 kwa LoRA, ~0.5–1.2 kwa ControlNet). Angalia matumizi ya VRAM na upunguze azimio au hatua ikiwa utafikia OOM.
Swali la 5: Kwa nini picha zangu za ComfyUI zina tofauti ya chini au zimefifia?
Jaribu VAE tofauti, punguza CFG, au ubadilishe kichukuzi sampuli. VAE zingine hutoa rangi na tofauti za uaminifu zaidi; marekebisho madogo yanaweza kurekebisha matokeo yaliyofifia haraka.