How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Cara Menggunakan ComfyUI: Panduan Praktikal Langkah demi Langkah untuk Pemula

Jika anda pernah mendengar bahawa ComfyUI adalah "berasaskan nod dan sangat berkuasa" tetapi berasa terintimidasi oleh semua kotak dan wayar, anda tidak keseorangan. Berita baiknya: sebaik sahaja anda mempelajari beberapa konsep teras—titik semak, pengekod, pensampel dan penyahkod—anda akan membina aliran kerja imej seperti seorang profesional. Panduan praktikal ini membimbing anda cara menggunakan ComfyUI dari pemasangan hingga imej SDXL pertama anda, serta aliran kerja untuk ControlNet, LoRA dan penalaan kualiti/prestasi.

Pada akhirnya, anda akan tahu dengan tepat cara menggunakan ComfyUI untuk menghasilkan penjanaan imej yang konsisten, boleh diulang dan fleksibel tanpa tekaan.

Apakah ComfyUI dan Mengapa Menggunakannya?

ComfyUI ialah antara muka visual berasaskan nod untuk Stable Diffusion yang membolehkan anda mereka bentuk saluran imej anda langkah demi langkah. Daripada satu butang "Jana", anda menyambungkan nod—setiap satu mengendalikan tugas yang berbeza seperti memuatkan model, mengekod teks, mensampel laten atau menyahkod imej akhir. Ia pantas, modular dan telus—sesuai untuk pembelajaran, eksperimen dan aliran kerja pengeluaran.

Mula Pantas: Pasang dan Lancarkan ComfyUI

Windows/macOS/Linux: Ikuti repo rasmi dan panduan pemasangan komuniti. Anda boleh menggunakan pemasangan manual (Python + kebergantungan) atau kaedah yang dibungkus bergantung pada platform dan GPU anda. Wiki ComfyUI menyediakan persediaan langkah demi langkah untuk Windows, macOS (termasuk Apple Silicon) dan Linux.

Model: Letakkan titik semak Stable Diffusion anda (cth., SDXL base/refiner atau SD 1.5) dalam folder models/checkpoints. Letakkan fail VAE dalam models/vae, LoRA dalam models/loras, model ControlNet dalam models/controlnet.

Lancarkan: Jalankan skrip permulaan untuk OS anda; ComfyUI dibuka dalam pelayar anda. Kanvas ialah tempat anda akan memasang nod bersama-sama.

Petua: Pastikan pemacu GPU dan toolkit CUDA anda dikemas kini untuk prestasi terbaik.

Konsep Teras: Aliran Kerja Teks-ke-Imej Minimum

Aliran teks-ke-imej asas ComfyUI (gaya SD 1.5) kelihatan seperti ini:

Muatkan model

Nod: Pemuat Titik Semak

Output: Komponen UNet, CLIP dan VAE

Kodkan gesaan

Nod: Kod Teks CLIP (Positif)

Nod: Kod Teks CLIP (Negatif)

Output: Pembenaman pengkondisian untuk panduan

Jana laten

Nod: KSampler

Input: UNet, pengkondisian positif/negatif, seed, langkah, pensampel (cth., DPM++ 2M Karras) dan skala CFG

Output: Imej laten

Nyahkod imej

Nod: Nyahkod VAE

Output: Imej

Simpan output

Nod: Simpan Imej

Graf asas ini—Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save—ialah asas untuk hampir semua perkara yang akan anda lakukan dalam ComfyUI.

Aliran Kerja SDXL: Base + (Pilihan) Refiner

SDXL menggunakan pengekod teks dual dan selalunya mendapat manfaat daripada laluan refiner.

Muatkan SDXL Base: Gunakan titik semak yang serasi dengan SDXL. Banyak templat SDXL menyertakan dua pengekod CLIP (untuk konteks besar/kecil). Suapkan kedua-dua gesaan positif dan negatif.

KSampler (Base): Jana laten pada 1024×1024 (atau sasaran anda). Simpan laten atau imej yang dinyahkod.

Refiner Pilihan: Muatkan titik semak SDXL Refiner dan jalankan laluan KSampler tambahan yang dikondisikan pada output base, kemudian nyahkod dengan VAE.

Proses dua peringkat ini boleh meningkatkan perincian dan koheren dengan ketara pada resolusi yang lebih tinggi.

Amali: Bina Graf ComfyUI Pertama Anda

Mulakan daripada templat: Di bar sisi, muatkan contoh teks-ke-imej terbina dalam.

Gantikan titik semak: Pilih model SDXL atau SD 1.5 anda.

Tulis gesaan anda: Gunakan nod CLIP Positif dan Negatif. Contoh:

Positif: “potret sinematik, pencahayaan studio lembut, lensa 85mm, sangat terperinci, grain filem”

Negatif: “kabur, resolusi rendah, cacat, jari tambahan, tera air”

Tetapan KSampler:

Langkah: 20–35 untuk keseimbangan kelajuan/kualiti

Pensampel: DPM++ 2M Karras (boleh dipercayai) atau Euler a (pantas)

CFG: 4.5–7.5 (lebih tinggi menolak gesaan dengan lebih kuat, tetapi boleh terlebih tepu)

Seed: Betulkan untuk kebolehulangan; ubah untuk penerokaan

Resolusi: Untuk SD 1.5, mulakan pada 512×512 atau 768×768. Untuk SDXL, 1024×1024 berfungsi dengan baik.

Nyahkod dan Simpan: Tambah Nyahkod VAE → Simpan Imej. Klik Queue Prompt untuk menjana.

Memahami Nod Utama (Dalam Bahasa Mudah)

Pemuat Titik Semak: Memuatkan model resapan anda (UNet), pengekod teks (CLIP) dan VAE. Anggap ia sebagai “enjin + otak bahasa + penterjemah imej” anda.

Kod Teks CLIP: Menukar gesaan anda kepada pembenaman berangka yang difahami oleh model. Gunakan kedua-dua pengekod teks positif dan negatif.

KSampler: Jantung sintesis imej. Ia menyahbunyikan hingar laten yang dipandu oleh gesaan dan kaedah pensampel anda merentasi beberapa langkah.

Nyahkod VAE: Menterjemahkan laten akhir kepada imej yang boleh dilihat. Menukar VAE mengubah kesetiaan warna/kontras.

Simpan Imej: Menulis output ke cakera dengan metadata supaya anda boleh mencipta semula hasil kemudian.

Untuk penerokaan yang lebih mendalam mengenai blok binaan ini, lihat pecahan mesra pemula dan penerangan nod.

Peningkatan Kuasa: LoRA, ControlNet dan Imej-ke-Imej

Gunakan LoRA untuk Kawalan Gaya atau Subjek

Tambah nod Pemuat LoRA dan sambungkannya ke cabang model anda.

Kekuatan: Mulakan sekitar 0.6–0.8; laraskan berdasarkan keamatan gaya atau terlebih muat.

Berbilang LoRA: Rantai atau gabungkan, tetapi perhatikan konflik; kurangkan kekuatan apabila menyusun.

Tambah ControlNet untuk Komposisi Tepat

Nod ControlNet membolehkan anda mengemudi komposisi menggunakan peta input (Canny, Depth, OpenPose, dll.).

Aliran tipikal: Muatkan model ControlNet → Praproses imej panduan anda (cth., tepi Canny) → Suapkan pengkondisian ControlNet ke dalam KSampler bersama-sama dengan pengkondisian teks anda.

Berat: 0.5–1.2 ialah permulaan yang baik. Terlalu tinggi boleh mengatasi gesaan anda.

Imej-ke-Imej atau Pelukisan Dalam

Gantikan hingar awal dengan laten imej melalui Kod VAE.

Laraskan kekuatan nyahbunyi dalam KSampler untuk mengawal jumlah imej asal yang kekal.

Untuk pelukisan dalam, gunakan input pelitup muka dan saluran pensampel yang sedar pelukisan dalam.

Penalaan Kualiti: Gesaan, CFG, Pensampel dan Seed

Kejuruteraan gesaan: Gunakan deskriptor ringkas, bukan perenggan. Susunan kurang penting daripada kejelasan, tetapi pastikan atribut kritikal di hadapan.

Skala CFG:

Rendah (3–5): Lebih kreatif, kurang pematuhan gesaan

Sederhana (6–8): Seimbang

Tinggi (9–12): Pematuhan yang kuat, boleh mencipta artifak

Pilihan pensampel:

DPM++ 2M Karras: Bersih, boleh dipercayai

Euler a: Pantas dan ekspresif, bagus untuk pratonton

UniPC / Heun / DDIM: Berbaloi diuji; hasil berbeza mengikut model

Seed:

Seed tetap = hasil yang boleh dihasilkan semula

Ubah seed = terokai kepelbagaian

Petua Prestasi untuk Render Lancar

Belanjawan VRAM: Kurangkan resolusi, langkah atau saiz kelompok jika anda mencapai OOM. SDXL pada 1024×1024 boleh memerlukan 8–12 GB VRAM bergantung pada nod.

Ketepatan separuh: Dayakan fp16 tempat disokong untuk penjimatan memori yang besar dengan kehilangan kualiti yang boleh diabaikan.

Jubin dan penskalaan atas laten: Jana lebih kecil, kemudian skala atas melalui nod penskalaan atas laten atau model penskalaan atas imej untuk menjimatkan VRAM.

Cache: Gunakan semula pengekodan CLIP dan VAE yang dinyahkod merentasi larian apabila gesaan tidak berubah.

Elakkan cabang yang tidak perlu: Nod terputus sambungan tambahan masih menggunakan memori apabila dilaksanakan dalam barisan yang sama.

Menyusun Aliran Kerja Seperti Seorang Profesional

Nod kumpulan: Gunakan bingkai/label untuk menyusun bahagian (Gesaan, Model, Pensampel, Output, dll.).

Panel parameter: Cipta nod “kawalan” (cth., kotak gesaan kosong, gelangsar) di bahagian atas untuk penalaan mudah.

Simpan/kongsi: Eksport JSON aliran kerja anda dan simpan nota model yang digunakan untuk kebolehulangan.

Versi: Simpan graf berasingan untuk SD 1.5, SDXL dan saluran khusus (anime, fotorealistik, kedalaman-ke-imej, dll.).

Menyelesaikan Masalah Biasa

Imej hitam atau kosong:

VAE salah atau Nyahkod VAE hilang

Nyahbunyi terlalu rendah (cth., <0.2 dalam img2img)

Warna pudar:

Cuba VAE lain; sesetengah VAE meningkatkan kontras dengan ketara

Kurangkan CFG atau tukar pensampel

Tiada apa-apa yang berubah merentasi larian:

Seed ditetapkan; dayakan rawak atau tetapkan seed baharu

Kehabisan memori (OOM):

Kurangkan resolusi, langkah atau saiz kelompok; bertukar kepada fp16

Tutup aplikasi GPU lain; permudahkan tindanan ControlNet/LoRA

Model tidak ditemui / nod merah:

Sahkan laluan fail dan folder model; sahkan sambungan fail

Belajar Lebih Cepat Dengan Aliran Kerja Prabina

Tunjuk cara video dan siri pemula boleh mempercepatkan lengkung pembelajaran anda dengan graf sedia untuk dijalankan yang boleh anda jeda dan bedah siasat. Tutorial dan wiki bertulis menyediakan penjelasan nod dan langkah pemasangan yang dikemas kini untuk memastikan anda terkini.

Lanjutan: Memodularkan dan Melanjutkan Graf Anda

Nod API/Luar: Sesetengah tutorial meliputi penyambungan ComfyUI ke perkhidmatan AI luaran melalui nod khas, membolehkan saluran hibrid dan memunggah tugas berat.

Pustaka dan sambungan nod: Terokai nod komuniti untuk penjadual, penskalaan atas dan prapemprosesan (pose, kedalaman, segmentasi). Sentiasa semak keserasian dengan versi ComfyUI anda.

Refiner SDXL dan pensampel berantai: Jalankan nyahbunyi berperingkat (base → refiner) atau bahkan berbilang pensampel untuk penggabungan gaya.

Perlu Diperhatikan: Mempercepatkan Gesaan Dengan Sider.AI

Jika anda sering membuat lelaran pada gesaan, rujukan atau penerangan, anda mungkin mahukan pembantu untuk membuat sumbang saran dan memperhalusi variasi. By the way, Sider.AI boleh membantu anda merangka gesaan berstruktur dengan cepat, menjana senarai gesaan negatif dan meringkaskan eksperimen aliran kerja anda supaya anda tidak kehilangan jejak antara larian. Anda boleh mencubanya di sini:

Aliran Kerja Permulaan SDXL Mudah (Salin Corak Ini)

Pemuat Titik Semak (SDXL Base)

Kod Teks CLIP (Positif) — “foto produk yang sangat terperinci, pencahayaan softbox, lensa 50mm, permukaan reflektif”

Kod Teks CLIP (Negatif) — “resolusi rendah, kabur gerakan, tera air, kekacauan latar belakang”

KSampler: 1024×1024, 28 langkah, DPM++ 2M Karras, CFG 5.5, seed tetap

Nyahkod VAE → Simpan Imej

Tambahan pilihan:

Laluan refiner dengan titik semak SDXL Refiner pada 10–15 langkah

ControlNet (Depth) dengan siluet objek ringkas untuk reka letak

LoRA pada 0.6 untuk jenama atau gaya seni tertentu

Perkara Utama

Kuasa ComfyUI datang daripada ketelusannya—bina saluran anda nod demi nod.

Rantai teks-ke-imej teras adalah mudah: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

SDXL mendapat manfaat daripada pengekod dual dan laluan refiner pilihan untuk perincian.

LoRA dan ControlNet memberi anda kawalan gaya dan ketepatan komposisi.

Tala CFG, pensampel dan seed untuk kualiti dan ketekalan; urus VRAM dengan fp16 dan resolusi yang munasabah.

Susun aliran kerja dan versi untuk lelaran tanpa rasa sakit.

Langkah Seterusnya

Pasang ComfyUI mengikut arahan repo/wiki dan lancarkan aliran kerja sampel.

Bina semula rantai minimum dari awal untuk mengukuhkan asas.

Tambah ControlNet dan LoRA, kemudian tetapan pensampel dan CFG ujian A/B.

Simpan dan kongsi JSON aliran kerja anda dengan nota mengenai model, seed dan parameter.

Selamat menjana—dan selamat datang ke dunia ComfyUI yang tenang dan boleh dikawal.

Soalan Lazim

S1:Bagaimanakah cara saya memasang dan menjalankan ComfyUI pada Windows, macOS atau Linux? Ikuti repo rasmi dan wiki komuniti untuk langkah khusus platform, lokasi folder model dan kebergantungan. Selepas pemasangan, lancarkan pelayan tempatan dan buka ComfyUI dalam pelayar anda untuk mula memasang nod.,.

S2:Apakah aliran kerja ComfyUI yang paling mudah untuk teks-ke-imej? Muatkan titik semak, kodkan gesaan positif dan negatif dengan CLIP, jalankan KSampler, nyahkod dengan VAE, kemudian simpan imej. Rantai ini adalah asas untuk cara menggunakan ComfyUI dengan berkesan untuk kebanyakan penjanaan.,.

S3:Bagaimanakah cara saya menggunakan SDXL dalam ComfyUI? Gunakan titik semak SDXL dengan pengekod teks dual, kemudian secara pilihan tambahkan laluan refiner untuk perincian yang lebih baik. Jalankan pada 1024×1024 dengan CFG yang seimbang (sekitar 5–7) dan pensampel yang cekap seperti DPM++ 2M Karras..

S4:Bolehkah saya menambah ControlNet dan LoRA dalam aliran kerja ComfyUI yang sama? Ya. Muatkan nod LoRA dan ControlNet anda, sambungkannya ke model dan pengkondisian KSampler, dan tala berat (cth., 0.6–0.8 untuk LoRA, ~0.5–1.2 untuk ControlNet). Perhatikan penggunaan VRAM dan kurangkan resolusi atau langkah jika anda mencapai OOM.

S5:Mengapakah imej ComfyUI saya rendah kontras atau pudar? Cuba VAE yang berbeza, kurangkan CFG atau tukar pensampel. Sesetengah VAE menghasilkan warna dan kontras yang lebih setia; pelarasan kecil boleh membetulkan hasil yang pudar dengan cepat.