How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Cara Menggunakan ComfyUI: Panduan Praktis Langkah demi Langkah untuk Pemula

Jika Anda pernah mendengar bahwa ComfyUI itu “berbasis node dan sangat kuat” tetapi merasa terintimidasi oleh semua kotak dan kabelnya, Anda tidak sendirian. Kabar baiknya: setelah Anda mempelajari beberapa konsep inti—, , , dan —Anda akan membangun alur kerja gambar seperti seorang profesional. Panduan praktis ini memandu Anda tentang cara menggunakan ComfyUI mulai dari instalasi hingga gambar SDXL pertama Anda, ditambah alur kerja untuk ControlNet, LoRA, dan penyetelan kualitas/kinerja.

Pada akhirnya, Anda akan tahu persis cara menggunakan ComfyUI untuk membuat generasi gambar yang konsisten, dapat diulang, dan fleksibel tanpa tebak-tebakan.

Apa Itu ComfyUI dan Mengapa Menggunakannya?

ComfyUI adalah antarmuka visual berbasis node untuk Stable Diffusion yang memungkinkan Anda mendesain gambar Anda langkah demi langkah. Alih-alih tombol “Hasilkan” tunggal, Anda menghubungkan node—yang masing-masing menangani tugas yang berbeda seperti memuat model, menyandikan teks, mengambil sampel laten, atau mendekode gambar akhir. Cepat, modular, dan transparan—sempurna untuk pembelajaran, eksperimen, dan alur kerja produksi.

Mulai Cepat: Instal dan Luncurkan ComfyUI

Windows/macOS/Linux: Ikuti repo resmi dan panduan instalasi komunitas. Anda dapat menggunakan instalasi manual (Python + dependensi) atau metode paket tergantung pada platform dan GPU Anda. Wiki ComfyUI menyediakan pengaturan langkah demi langkah untuk Windows, macOS (termasuk Apple Silicon), dan Linux.

Model: Tempatkan Stable Diffusion Anda (mis., basis/ SDXL atau SD 1.5) di folder models/checkpoints. Tempatkan file VAE di models/vae, LoRA di models/loras, model ControlNet di models/controlnet.

Luncurkan: Jalankan skrip mulai untuk OS Anda; ComfyUI terbuka di browser Anda. Kanvas adalah tempat Anda akan menghubungkan node bersama-sama.

Tip: Selalu perbarui GPU dan CUDA Anda untuk kinerja terbaik.

Konsep Inti: Alur Kerja Teks-ke-Gambar Minimal

Alur teks-ke-gambar dasar ComfyUI (gaya SD 1.5) terlihat seperti ini:

Muat model

Node: Checkpoint Loader

Output: komponen UNet, CLIP, dan VAE

Encode prompt

Node: CLIP Text Encode (Positif)

Node: CLIP Text Encode (Negatif)

Output: Embedding untuk panduan

Hasilkan laten

Node: KSampler

Input: UNet, positif/negatif, , langkah, (mis., DPM++ 2M Karras), dan skala CFG

Output: Gambar laten

Dekode gambar

Node: VAE Decode

Output: Gambar

Simpan output

Node: Save Image

Grafik dasar ini— → CLIP (pos/neg) → KSampler → VAE Decode → Save—adalah fondasi untuk hampir semua hal yang akan Anda lakukan di ComfyUI.

Alur Kerja SDXL: Basis + (Opsional) Refiner

SDXL menggunakan teks ganda dan sering kali mendapat manfaat dari .

Muat Basis SDXL: Gunakan yang kompatibel dengan SDXL. Banyak templat SDXL menyertakan dua CLIP (untuk konteks besar/kecil). Masukkan positif dan negatif.

KSampler (Basis): Hasilkan laten pada 1024×1024 (atau target Anda). Simpan laten atau gambar yang didekode.

Refiner Opsional: Muat SDXL dan jalankan tambahan yang dikondisikan pada basis, lalu dekode dengan VAE.

Proses dua tahap ini dapat secara signifikan meningkatkan detail dan koherensi pada resolusi yang lebih tinggi.

Praktik Langsung: Bangun Grafik ComfyUI Pertama Anda

Mulai dari templat: Di bilah sisi, muat contoh teks-ke-gambar bawaan.

Ganti : Pilih model SDXL atau SD 1.5 Anda.

Tulis Anda: Gunakan node CLIP Positif dan Negatif. Contoh:

Positif: “potret sinematik, pencahayaan studio lembut, lensa 85mm, sangat detail, ”

Negatif: “buram, resolusi rendah, cacat, jari ekstra, ”

Pengaturan KSampler:

Langkah: 20–35 untuk keseimbangan kecepatan/kualitas

Sampler: DPM++ 2M Karras (andal) atau Euler a (cepat)

CFG: 4.5–7.5 (lebih tinggi mendorong lebih keras, tetapi dapat terlalu jenuh)

Seed: Perbaiki untuk reproduktibilitas; variasikan untuk eksplorasi

Resolusi: Untuk SD 1.5, mulai pada 512×512 atau 768×768. Untuk SDXL, 1024×1024 berfungsi dengan baik.

Dekode dan Simpan: Tambahkan VAE Decode → Save Image. Klik Queue Prompt untuk menghasilkan.

Memahami Node Kunci (Dengan Bahasa Sederhana)

Checkpoint Loader: Memuat model difusi Anda (UNet), teks (CLIP), dan VAE. Anggap saja sebagai “mesin + otak bahasa + penerjemah gambar” Anda.

CLIP Text Encode: Mengonversi Anda menjadi numerik yang dipahami model. Gunakan teks positif dan negatif.

KSampler: Jantung dari sintesis gambar. Ini menghilangkan laten yang dipandu oleh dan metode Anda di sejumlah langkah.

VAE Decode: Menerjemahkan laten akhir menjadi gambar yang dapat dilihat. Menukar VAE mengubah fidelitas warna/kontras.

Save Image: Menulis ke disk dengan metadata sehingga Anda dapat membuat ulang hasil nanti.

Untuk penyelaman lebih dalam pada blok bangunan ini, lihat uraian ramah pemula dan penjelasan node.

Power-Up: LoRA, ControlNet, dan Gambar-ke-Gambar

Gunakan LoRA untuk Gaya atau Kontrol Subjek

Tambahkan node LoRA Loader dan hubungkan ke cabang model Anda.

Kekuatan: Mulai sekitar 0.6–0.8; sesuaikan berdasarkan intensitas gaya atau .

Beberapa LoRA: Rantai atau gabungkan, tetapi perhatikan konflik; turunkan kekuatan saat menumpuk.

Tambahkan ControlNet untuk Komposisi yang Tepat

Node ControlNet memungkinkan Anda mengarahkan komposisi menggunakan peta input (Canny, Depth, OpenPose, dll.).

Alur tipikal: Muat model ControlNet → Praproses gambar panduan Anda (mis., tepi Canny) → Masukkan ControlNet ke KSampler bersama dengan teks Anda.

Bobot: 0.5–1.2 adalah awal yang baik. Terlalu tinggi dapat mengalahkan Anda.

Gambar-ke-Gambar atau Inpainting

Ganti awal dengan laten gambar melalui VAE Encode.

Sesuaikan kekuatan di KSampler untuk mengontrol berapa banyak gambar asli yang tersisa.

Untuk , gunakan input dan yang sadar .

Penyetelan Kualitas: Prompt, CFG, Sampler, dan Seed

Rekayasa : Gunakan deskriptor ringkas, bukan paragraf. Urutan kurang penting daripada kejelasan, tetapi pertahankan atribut penting di depan.

Skala CFG:

Rendah (3–5): Lebih kreatif, kurang kepatuhan

Menengah (6–8): Seimbang

Tinggi (9–12): Kepatuhan yang kuat, dapat membuat artefak

Pilihan :

DPM++ 2M Karras: Bersih, andal

Euler a: Cepat dan ekspresif, bagus untuk pratinjau

UniPC / Heun / DDIM: Layak diuji; hasil bervariasi berdasarkan model

Seed:

Seed tetap = hasil yang dapat direproduksi

Seed bervariasi = jelajahi keragaman

Tips Kinerja untuk Render Halus

Penganggaran VRAM: Turunkan resolusi, langkah, atau ukuran jika Anda mencapai OOM. SDXL pada 1024×1024 dapat memerlukan 8–12 GB VRAM tergantung pada node.

Presisi setengah: Aktifkan fp16 jika didukung untuk penghematan memori besar dengan kehilangan kualitas yang dapat diabaikan.

Tiling dan laten: Hasilkan yang lebih kecil, lalu tingkatkan skala melalui node laten atau model gambar untuk menghemat VRAM.

Caching: Gunakan kembali CLIP dan VAE yang didekode di seluruh proses saat tidak berubah.

Hindari cabang yang tidak perlu: Node tambahan yang terputus masih menggunakan memori saat dieksekusi dalam antrean yang sama.

Mengatur Alur Kerja Seperti Seorang Profesional

Kelompokkan node: Gunakan bingkai/label untuk mengatur bagian (Prompt, Model, Sampler, Output, dll.).

Panel parameter: Buat node “kontrol” (mis., kotak kosong, ) di bagian atas untuk penyetelan mudah.

Simpan/bagikan: Ekspor JSON alur kerja Anda dan simpan catatan model yang digunakan untuk reproduktibilitas.

Pembuatan versi: Simpan grafik terpisah untuk SD 1.5, SDXL, dan khusus (anime, , , dll.).

Memecahkan Masalah Umum

Gambar hitam atau kosong:

VAE salah atau VAE Decode hilang

Denoise terlalu rendah (mis., <0.2 di img2img)

Warna pudar:

Coba VAE lain; beberapa VAE meningkatkan kontras secara nyata

Turunkan CFG atau ubah

Tidak ada yang berubah di seluruh proses:

Seed diperbaiki; aktifkan acak atau atur baru

Kehabisan memori (OOM):

Kurangi resolusi, langkah, atau ukuran ; beralih ke fp16

Tutup aplikasi GPU lain; sederhanakan tumpukan ControlNet/LoRA

Model tidak ditemukan / node merah:

Verifikasi jalur file dan folder model; konfirmasi ekstensi file

Belajar Lebih Cepat Dengan Alur Kerja yang Sudah Jadi

Video dan seri pemula dapat mempercepat kurva belajar Anda dengan grafik siap pakai yang dapat Anda jeda dan bedah. Tutorial dan wiki tertulis memberikan penjelasan node dan langkah-langkah instalasi yang diperbarui agar Anda tetap .

Lanjutan: Memodulasi dan Memperluas Grafik Anda

API/Node eksternal: Beberapa tutorial membahas menghubungkan ComfyUI ke layanan AI eksternal melalui node khusus, memungkinkan dan memindahkan tugas-tugas berat.

Pustaka node dan ekstensi: Jelajahi node komunitas untuk penjadwal, , dan praproses (pose, kedalaman, segmentasi). Selalu periksa kompatibilitas dengan versi ComfyUI Anda.

Refiner SDXL dan berantai: Jalankan bertahap (basis → ) atau bahkan beberapa untuk gaya.

Perlu Dicatat: Mempercepat Prompt Dengan Sider.AI

Jika Anda sering melakukan iterasi pada , referensi, atau deskripsi, Anda mungkin menginginkan pendamping untuk bertukar pikiran dan menyempurnakan variasi. Ngomong-ngomong, Sider.AI dapat membantu Anda dengan cepat membuat terstruktur, menghasilkan daftar negatif, dan meringkas eksperimen alur kerja Anda sehingga Anda tidak kehilangan jejak di antara proses. Anda dapat mencobanya di sini:

Alur Kerja Pemula SDXL Sederhana (Salin Pola Ini)

Checkpoint Loader (Basis SDXL)

CLIP Text Encode (Positif) — “foto produk ultra-detail, pencahayaan , lensa 50mm, permukaan reflektif”

CLIP Text Encode (Negatif) — “resolusi rendah, , , kekacauan latar belakang”

KSampler: 1024×1024, 28 langkah, DPM++ 2M Karras, CFG 5.5, tetap

VAE Decode → Save Image

Add-on opsional:

Refiner dengan SDXL pada 10–15 langkah

ControlNet (Kedalaman) dengan siluet objek sederhana untuk tata letak

LoRA pada 0.6 untuk merek atau gaya seni tertentu

Poin-Poin Penting

Kekuatan ComfyUI berasal dari transparansinya—bangun Anda node demi node.

Rantai teks-ke-gambar inti sederhana: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

SDXL mendapat manfaat dari ganda dan opsional untuk detail.

LoRA dan ControlNet memberi Anda kontrol gaya dan ketepatan komposisi.

Setel CFG, , dan untuk kualitas dan konsistensi; kelola VRAM dengan fp16 dan resolusi yang masuk akal.

Atur alur kerja dan beri versi untuk iterasi tanpa rasa sakit.

Langkah Selanjutnya

Instal ComfyUI mengikuti instruksi repo/wiki dan luncurkan alur kerja sampel.

Bangun kembali rantai minimal dari awal untuk memperkuat dasar-dasarnya.

Tambahkan ControlNet dan LoRA, lalu uji A/B pengaturan dan CFG.

Simpan dan bagikan JSON alur kerja Anda dengan catatan tentang model, , dan parameter.

Selamat menghasilkan—dan selamat datang di dunia ComfyUI yang tenang dan terkendali.

FAQ

T1:Bagaimana cara menginstal dan menjalankan ComfyUI di Windows, macOS, atau Linux? Ikuti repo resmi dan wiki komunitas untuk langkah-langkah khusus platform, lokasi folder model, dan dependensi. Setelah instalasi, luncurkan server lokal dan buka ComfyUI di browser Anda untuk mulai menghubungkan node.

T2:Apa alur kerja ComfyUI paling sederhana untuk teks-ke-gambar? Muat , positif dan negatif dengan CLIP, jalankan KSampler, dekode dengan VAE, lalu simpan gambar. Rantai ini adalah fondasi tentang cara menggunakan ComfyUI secara efektif untuk sebagian besar generasi.

T3:Bagaimana cara menggunakan SDXL di ComfyUI? Gunakan SDXL dengan teks ganda, lalu secara opsional tambahkan untuk detail yang lebih baik. Jalankan pada 1024×1024 dengan CFG seimbang (sekitar 5–7) dan efisien seperti DPM++ 2M Karras.

T4:Bisakah saya menambahkan ControlNet dan LoRA dalam alur kerja ComfyUI yang sama? Ya. Muat node LoRA dan ControlNet Anda, hubungkan ke model dan KSampler, dan setel bobot (mis., 0.6–0.8 untuk LoRA, ~0.5–1.2 untuk ControlNet). Perhatikan penggunaan VRAM dan kurangi resolusi atau langkah jika Anda mencapai OOM.

T5:Mengapa gambar ComfyUI saya memiliki kontras rendah atau pudar? Coba VAE yang berbeda, turunkan CFG, atau ganti . Beberapa VAE menghasilkan warna dan kontras yang lebih akurat; penyesuaian kecil dapat memperbaiki hasil yang pudar dengan cepat.