Cara Menggunakan ComfyUI: Panduan Praktikal Langkah demi Langkah untuk Pemula
Jika anda pernah mendengar bahawa ComfyUI adalah "berasaskan nod dan sangat berkuasa" tetapi berasa terintimidasi oleh semua kotak dan wayar, anda tidak keseorangan. Berita baiknya: sebaik sahaja anda mempelajari beberapa konsep teras—titik semak, pengekod, pensampel dan penyahkod—anda akan membina aliran kerja imej seperti seorang profesional. Panduan praktikal ini membimbing anda cara menggunakan ComfyUI dari pemasangan hingga imej SDXL pertama anda, serta aliran kerja untuk ControlNet, LoRA dan penalaan kualiti/prestasi.
Pada akhirnya, anda akan tahu dengan tepat cara menggunakan ComfyUI untuk menghasilkan penjanaan imej yang konsisten, boleh diulang dan fleksibel tanpa tekaan.
Apakah ComfyUI dan Mengapa Menggunakannya?
ComfyUI ialah antara muka visual berasaskan nod untuk Stable Diffusion yang membolehkan anda mereka bentuk saluran imej anda langkah demi langkah. Daripada satu butang "Jana", anda menyambungkan nod—setiap satu mengendalikan tugas yang berbeza seperti memuatkan model, mengekod teks, mensampel laten atau menyahkod imej akhir. Ia pantas, modular dan telus—sesuai untuk pembelajaran, eksperimen dan aliran kerja pengeluaran.
Mula Pantas: Pasang dan Lancarkan ComfyUI
- Windows/macOS/Linux: Ikuti repo rasmi dan panduan pemasangan komuniti. Anda boleh menggunakan pemasangan manual (Python + kebergantungan) atau kaedah yang dibungkus bergantung pada platform dan GPU anda. Wiki ComfyUI menyediakan persediaan langkah demi langkah untuk Windows, macOS (termasuk Apple Silicon) dan Linux.
- Model: Letakkan titik semak Stable Diffusion anda (cth., SDXL base/refiner atau SD 1.5) dalam folder
models/checkpoints. Letakkan fail VAE dalam models/vae, LoRA dalam models/loras, model ControlNet dalam models/controlnet.
- Lancarkan: Jalankan skrip permulaan untuk OS anda; ComfyUI dibuka dalam pelayar anda. Kanvas ialah tempat anda akan memasang nod bersama-sama.
Petua: Pastikan pemacu GPU dan toolkit CUDA anda dikemas kini untuk prestasi terbaik.
Konsep Teras: Aliran Kerja Teks-ke-Imej Minimum
Aliran teks-ke-imej asas ComfyUI (gaya SD 1.5) kelihatan seperti ini:
- Output: Komponen UNet, CLIP dan VAE
- Nod: Kod Teks CLIP (Positif)
- Nod: Kod Teks CLIP (Negatif)
- Output: Pembenaman pengkondisian untuk panduan
- Input: UNet, pengkondisian positif/negatif, seed, langkah, pensampel (cth., DPM++ 2M Karras) dan skala CFG
Graf asas ini—Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save—ialah asas untuk hampir semua perkara yang akan anda lakukan dalam ComfyUI.
Aliran Kerja SDXL: Base + (Pilihan) Refiner
SDXL menggunakan pengekod teks dual dan selalunya mendapat manfaat daripada laluan refiner.
- Muatkan SDXL Base: Gunakan titik semak yang serasi dengan SDXL. Banyak templat SDXL menyertakan dua pengekod CLIP (untuk konteks besar/kecil). Suapkan kedua-dua gesaan positif dan negatif.
- KSampler (Base): Jana laten pada 1024×1024 (atau sasaran anda). Simpan laten atau imej yang dinyahkod.
- Refiner Pilihan: Muatkan titik semak SDXL Refiner dan jalankan laluan KSampler tambahan yang dikondisikan pada output base, kemudian nyahkod dengan VAE.
Proses dua peringkat ini boleh meningkatkan perincian dan koheren dengan ketara pada resolusi yang lebih tinggi.
Amali: Bina Graf ComfyUI Pertama Anda
- Mulakan daripada templat: Di bar sisi, muatkan contoh teks-ke-imej terbina dalam.
- Gantikan titik semak: Pilih model SDXL atau SD 1.5 anda.
- Tulis gesaan anda: Gunakan nod CLIP Positif dan Negatif. Contoh:
- Positif: “potret sinematik, pencahayaan studio lembut, lensa 85mm, sangat terperinci, grain filem”
- Negatif: “kabur, resolusi rendah, cacat, jari tambahan, tera air”
- Langkah: 20–35 untuk keseimbangan kelajuan/kualiti
- Pensampel: DPM++ 2M Karras (boleh dipercayai) atau Euler a (pantas)
- CFG: 4.5–7.5 (lebih tinggi menolak gesaan dengan lebih kuat, tetapi boleh terlebih tepu)
- Seed: Betulkan untuk kebolehulangan; ubah untuk penerokaan
- Resolusi: Untuk SD 1.5, mulakan pada 512×512 atau 768×768. Untuk SDXL, 1024×1024 berfungsi dengan baik.
- Nyahkod dan Simpan: Tambah Nyahkod VAE → Simpan Imej. Klik Queue Prompt untuk menjana.
Memahami Nod Utama (Dalam Bahasa Mudah)
- Pemuat Titik Semak: Memuatkan model resapan anda (UNet), pengekod teks (CLIP) dan VAE. Anggap ia sebagai “enjin + otak bahasa + penterjemah imej” anda.
- Kod Teks CLIP: Menukar gesaan anda kepada pembenaman berangka yang difahami oleh model. Gunakan kedua-dua pengekod teks positif dan negatif.
- KSampler: Jantung sintesis imej. Ia menyahbunyikan hingar laten yang dipandu oleh gesaan dan kaedah pensampel anda merentasi beberapa langkah.
- Nyahkod VAE: Menterjemahkan laten akhir kepada imej yang boleh dilihat. Menukar VAE mengubah kesetiaan warna/kontras.
- Simpan Imej: Menulis output ke cakera dengan metadata supaya anda boleh mencipta semula hasil kemudian.
Untuk penerokaan yang lebih mendalam mengenai blok binaan ini, lihat pecahan mesra pemula dan penerangan nod.
Peningkatan Kuasa: LoRA, ControlNet dan Imej-ke-Imej
Gunakan LoRA untuk Kawalan Gaya atau Subjek
- Tambah nod Pemuat LoRA dan sambungkannya ke cabang model anda.
- Kekuatan: Mulakan sekitar 0.6–0.8; laraskan berdasarkan keamatan gaya atau terlebih muat.
- Berbilang LoRA: Rantai atau gabungkan, tetapi perhatikan konflik; kurangkan kekuatan apabila menyusun.
Tambah ControlNet untuk Komposisi Tepat
- Nod ControlNet membolehkan anda mengemudi komposisi menggunakan peta input (Canny, Depth, OpenPose, dll.).
- Aliran tipikal: Muatkan model ControlNet → Praproses imej panduan anda (cth., tepi Canny) → Suapkan pengkondisian ControlNet ke dalam KSampler bersama-sama dengan pengkondisian teks anda.
- Berat: 0.5–1.2 ialah permulaan yang baik. Terlalu tinggi boleh mengatasi gesaan anda.
Imej-ke-Imej atau Pelukisan Dalam
- Gantikan hingar awal dengan laten imej melalui Kod VAE.
- Laraskan kekuatan nyahbunyi dalam KSampler untuk mengawal jumlah imej asal yang kekal.
- Untuk pelukisan dalam, gunakan input pelitup muka dan saluran pensampel yang sedar pelukisan dalam.
Penalaan Kualiti: Gesaan, CFG, Pensampel dan Seed
- Kejuruteraan gesaan: Gunakan deskriptor ringkas, bukan perenggan. Susunan kurang penting daripada kejelasan, tetapi pastikan atribut kritikal di hadapan.
- Rendah (3–5): Lebih kreatif, kurang pematuhan gesaan
- Sederhana (6–8): Seimbang
- Tinggi (9–12): Pematuhan yang kuat, boleh mencipta artifak
- DPM++ 2M Karras: Bersih, boleh dipercayai
- Euler a: Pantas dan ekspresif, bagus untuk pratonton
- UniPC / Heun / DDIM: Berbaloi diuji; hasil berbeza mengikut model
- Seed tetap = hasil yang boleh dihasilkan semula
- Ubah seed = terokai kepelbagaian
Petua Prestasi untuk Render Lancar
- Belanjawan VRAM: Kurangkan resolusi, langkah atau saiz kelompok jika anda mencapai OOM. SDXL pada 1024×1024 boleh memerlukan 8–12 GB VRAM bergantung pada nod.
- Ketepatan separuh: Dayakan fp16 tempat disokong untuk penjimatan memori yang besar dengan kehilangan kualiti yang boleh diabaikan.
- Jubin dan penskalaan atas laten: Jana lebih kecil, kemudian skala atas melalui nod penskalaan atas laten atau model penskalaan atas imej untuk menjimatkan VRAM.
- Cache: Gunakan semula pengekodan CLIP dan VAE yang dinyahkod merentasi larian apabila gesaan tidak berubah.
- Elakkan cabang yang tidak perlu: Nod terputus sambungan tambahan masih menggunakan memori apabila dilaksanakan dalam barisan yang sama.
Menyusun Aliran Kerja Seperti Seorang Profesional
- Nod kumpulan: Gunakan bingkai/label untuk menyusun bahagian (Gesaan, Model, Pensampel, Output, dll.).
- Panel parameter: Cipta nod “kawalan” (cth., kotak gesaan kosong, gelangsar) di bahagian atas untuk penalaan mudah.
- Simpan/kongsi: Eksport JSON aliran kerja anda dan simpan nota
model yang digunakan untuk kebolehulangan.
- Versi: Simpan graf berasingan untuk SD 1.5, SDXL dan saluran khusus (anime, fotorealistik, kedalaman-ke-imej, dll.).
Menyelesaikan Masalah Biasa
- VAE salah atau Nyahkod VAE hilang
- Nyahbunyi terlalu rendah (cth., <0.2 dalam img2img)
- Cuba VAE lain; sesetengah VAE meningkatkan kontras dengan ketara
- Kurangkan CFG atau tukar pensampel
- Tiada apa-apa yang berubah merentasi larian:
- Seed ditetapkan; dayakan rawak atau tetapkan seed baharu
- Kurangkan resolusi, langkah atau saiz kelompok; bertukar kepada fp16
- Tutup aplikasi GPU lain; permudahkan tindanan ControlNet/LoRA
- Model tidak ditemui / nod merah:
- Sahkan laluan fail dan folder model; sahkan sambungan fail
Belajar Lebih Cepat Dengan Aliran Kerja Prabina
Tunjuk cara video dan siri pemula boleh mempercepatkan lengkung pembelajaran anda dengan graf sedia untuk dijalankan yang boleh anda jeda dan bedah siasat. Tutorial dan wiki bertulis menyediakan penjelasan nod dan langkah pemasangan yang dikemas kini untuk memastikan anda terkini.
Lanjutan: Memodularkan dan Melanjutkan Graf Anda
- Nod API/Luar: Sesetengah tutorial meliputi penyambungan ComfyUI ke perkhidmatan AI luaran melalui nod khas, membolehkan saluran hibrid dan memunggah tugas berat.
- Pustaka dan sambungan nod: Terokai nod komuniti untuk penjadual, penskalaan atas dan prapemprosesan (pose, kedalaman, segmentasi). Sentiasa semak keserasian dengan versi ComfyUI anda.
- Refiner SDXL dan pensampel berantai: Jalankan nyahbunyi berperingkat (base → refiner) atau bahkan berbilang pensampel untuk penggabungan gaya.
Perlu Diperhatikan: Mempercepatkan Gesaan Dengan Sider.AI
Jika anda sering membuat lelaran pada gesaan, rujukan atau penerangan, anda mungkin mahukan pembantu untuk membuat sumbang saran dan memperhalusi variasi. By the way, Sider.AI boleh membantu anda merangka gesaan berstruktur dengan cepat, menjana senarai gesaan negatif dan meringkaskan eksperimen aliran kerja anda supaya anda tidak kehilangan jejak antara larian. Anda boleh mencubanya di sini: Aliran Kerja Permulaan SDXL Mudah (Salin Corak Ini)
- Pemuat Titik Semak (SDXL Base)
- Kod Teks CLIP (Positif) — “foto produk yang sangat terperinci, pencahayaan softbox, lensa 50mm, permukaan reflektif”
- Kod Teks CLIP (Negatif) — “resolusi rendah, kabur gerakan, tera air, kekacauan latar belakang”
- KSampler: 1024×1024, 28 langkah, DPM++ 2M Karras, CFG 5.5, seed tetap
- Nyahkod VAE → Simpan Imej
Tambahan pilihan:
- Laluan refiner dengan titik semak SDXL Refiner pada 10–15 langkah
- ControlNet (Depth) dengan siluet objek ringkas untuk reka letak
- LoRA pada 0.6 untuk jenama atau gaya seni tertentu
Perkara Utama
- Kuasa ComfyUI datang daripada ketelusannya—bina saluran anda nod demi nod.
- Rantai teks-ke-imej teras adalah mudah: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL mendapat manfaat daripada pengekod dual dan laluan refiner pilihan untuk perincian.
- LoRA dan ControlNet memberi anda kawalan gaya dan ketepatan komposisi.
- Tala CFG, pensampel dan seed untuk kualiti dan ketekalan; urus VRAM dengan fp16 dan resolusi yang munasabah.
- Susun aliran kerja dan versi untuk lelaran tanpa rasa sakit.
Langkah Seterusnya
- Pasang ComfyUI mengikut arahan repo/wiki dan lancarkan aliran kerja sampel.
- Bina semula rantai minimum dari awal untuk mengukuhkan asas.
- Tambah ControlNet dan LoRA, kemudian tetapan pensampel dan CFG ujian A/B.
- Simpan dan kongsi JSON aliran kerja anda dengan nota mengenai model, seed dan parameter.
Selamat menjana—dan selamat datang ke dunia ComfyUI yang tenang dan boleh dikawal.
Soalan Lazim
S1:Bagaimanakah cara saya memasang dan menjalankan ComfyUI pada Windows, macOS atau Linux?
Ikuti repo rasmi dan wiki komuniti untuk langkah khusus platform, lokasi folder model dan kebergantungan. Selepas pemasangan, lancarkan pelayan tempatan dan buka ComfyUI dalam pelayar anda untuk mula memasang nod.,.
S2:Apakah aliran kerja ComfyUI yang paling mudah untuk teks-ke-imej?
Muatkan titik semak, kodkan gesaan positif dan negatif dengan CLIP, jalankan KSampler, nyahkod dengan VAE, kemudian simpan imej. Rantai ini adalah asas untuk cara menggunakan ComfyUI dengan berkesan untuk kebanyakan penjanaan.,.
S3:Bagaimanakah cara saya menggunakan SDXL dalam ComfyUI?
Gunakan titik semak SDXL dengan pengekod teks dual, kemudian secara pilihan tambahkan laluan refiner untuk perincian yang lebih baik. Jalankan pada 1024×1024 dengan CFG yang seimbang (sekitar 5–7) dan pensampel yang cekap seperti DPM++ 2M Karras..
S4:Bolehkah saya menambah ControlNet dan LoRA dalam aliran kerja ComfyUI yang sama?
Ya. Muatkan nod LoRA dan ControlNet anda, sambungkannya ke model dan pengkondisian KSampler, dan tala berat (cth., 0.6–0.8 untuk LoRA, ~0.5–1.2 untuk ControlNet). Perhatikan penggunaan VRAM dan kurangkan resolusi atau langkah jika anda mencapai OOM.
S5:Mengapakah imej ComfyUI saya rendah kontras atau pudar?
Cuba VAE yang berbeza, kurangkan CFG atau tukar pensampel. Sesetengah VAE menghasilkan warna dan kontras yang lebih setia; pelarasan kecil boleh membetulkan hasil yang pudar dengan cepat.