How do I install and run ComfyUI on Windows, macOS, or Linux?

Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.

What’s the simplest ComfyUI workflow for text-to-image?

Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.

How do I use SDXL in ComfyUI?

Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..

Can I add ControlNet and LoRA in the same ComfyUI workflow?

Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.

Why are my ComfyUI images low‑contrast or washed out?

Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.

Cách Sử Dụng ComfyUI: Hướng Dẫn Thực Tiễn Từng Bước Cho Người Mới Bắt Đầu

Nếu bạn từng nghe rằng ComfyUI là “dựa trên node và cực kỳ mạnh mẽ” nhưng lại cảm thấy choáng ngợp với những hộp và dây nối, bạn không phải người duy nhất. Tin vui là sau khi nắm được vài khái niệm cốt lõi — checkpoints, encoders, samplers và decoders — bạn sẽ có thể xây dựng quy trình tạo ảnh như một chuyên gia. Hướng dẫn thực tế này sẽ dẫn bạn cách sử dụng ComfyUI từ lúc cài đặt đến việc tạo ra những bức ảnh SDXL đầu tiên, cùng với các workflow cho ControlNet, LoRAs và tinh chỉnh chất lượng/hiệu suất.

Sau khi hoàn thành, bạn sẽ hiểu chính xác cách sử dụng ComfyUI để tạo ra các ảnh có độ nhất quán cao, dễ lặp lại và linh hoạt mà không cần phải phỏng đoán.

ComfyUI Là Gì Và Tại Sao Nên Dùng?

ComfyUI là giao diện đồ họa dựa trên node cho Stable Diffusion, cho phép bạn thiết kế pipeline tạo ảnh từng bước một. Thay vì chỉ có nút “Generate” đơn giản, bạn kết nối các node — mỗi node đảm nhiệm một nhiệm vụ riêng biệt như tải mô hình, mã hóa văn bản, lấy mẫu latent, hoặc giải mã ảnh cuối cùng. Nó nhanh, mô-đun, và minh bạch — rất phù hợp để học hỏi, thử nghiệm và làm việc sản xuất.

Bắt Đầu Nhanh: Cài Đặt và Mở ComfyUI

Windows/macOS/Linux: Làm theo hướng dẫn cài đặt chính thức của repo và cộng đồng. Bạn có thể cài thủ công (Python + các thư viện phụ thuộc) hoặc dùng các phương pháp đóng gói tùy theo hệ điều hành và GPU. Wiki ComfyUI cung cấp hướng dẫn chi tiết từng bước cho Windows, macOS (bao gồm Apple Silicon) và Linux.

Mô hình: Đặt các checkpoint Stable Diffusion (ví dụ SDXL base/refiner hoặc SD 1.5) vào thư mục models/checkpoints. Đặt file VAE vào models/vae, LoRAs vào models/loras, mô hình ControlNet vào models/controlnet.

Khởi chạy: Chạy file script khởi động phù hợp với hệ điều hành; ComfyUI sẽ mở trong trình duyệt. Canvas là nơi bạn sẽ nối các node lại với nhau.

Mẹo: Hãy giữ driver GPU và bộ công cụ CUDA luôn được cập nhật để có hiệu suất tối ưu.

Khái Niệm Cốt Lõi: Quy Trình Text‑to‑Image Tối Giản

Quy trình text-to-image cơ bản của ComfyUI (kiểu SD 1.5) như sau:

Tải mô hình

Node: Checkpoint Loader

Đầu ra: các thành phần UNet, CLIP và VAE

Mã hóa prompt

Node: CLIP Text Encode (Tích Cực)

Node: CLIP Text Encode (Tiêu Cực)

Đầu ra: embedding điều kiện để hướng dẫn

Tạo latents

Node: KSampler

Đầu vào: UNet, embedding tích cực/tiêu cực, seed, số bước, sampler (ví dụ DPM++ 2M Karras), và CFG scale

Đầu ra: ảnh tiềm ẩn (latent)

Giải mã ảnh

Node: VAE Decode

Đầu ra: ảnh

Lưu ảnh đầu ra

Node: Save Image

Sơ đồ cơ bản này — Checkpoint → CLIP (tích cực/tiêu cực) → KSampler → VAE Decode → Save — là nền tảng cho hầu hết mọi thứ bạn làm với ComfyUI.

Quy Trình SDXL: Base + (Tuỳ Chọn) Refiner

SDXL dùng hai bộ mã hóa văn bản và thường có thêm bước xử lý bổ sung là refiner.

Tải SDXL Base: Dùng checkpoint tương thích SDXL. Nhiều template SDXL có hai mã hóa CLIP (cho ngữ cảnh lớn/nhỏ). Cung cấp cả prompt tích cực và tiêu cực.

KSampler (Base): Tạo latent với độ phân giải 1024×1024 (hoặc theo mục tiêu). Có thể lưu latent hoặc ảnh đã giải mã.

Tuỳ Chọn Refiner: Tải checkpoint SDXL Refiner và chạy thêm một lượt KSampler, điều kiện là output từ bước base, sau đó giải mã với VAE.

Quy trình hai bước này giúp cải thiện đáng kể chi tiết và sự liên kết ở độ phân giải cao.

Thực Hành: Tạo Đồ Thị ComfyUI Đầu Tiên

Bắt đầu từ template: Tại sidebar, tải một ví dụ text-to-image có sẵn.

Thay đổi checkpoint: Chọn mô hình SDXL hoặc SD 1.5 của bạn.

Viết prompt: Dùng hai node CLIP Positive và Negative. Ví dụ:

Positive: “chân dung điện ảnh, ánh sáng studio mềm mại, lens 85mm, chi tiết cao, hạt phim”

Negative: “mờ, độ phân giải thấp, biến dạng, thừa ngón tay, dấu watermark”

Cấu hình KSampler:

Số bước: 20–35 để cân bằng tốc độ và chất lượng

Sampler: DPM++ 2M Karras (đáng tin cậy) hoặc Euler a (nhanh)

CFG: 4.5–7.5 (cao hơn sẽ ép prompt hơn, nhưng dễ quá bão hoà)

Seed: Cố định để tái tạo kết quả; thay đổi để thử nghiệm

Độ phân giải: Với SD 1.5, bắt đầu ở 512×512 hoặc 768×768. Với SDXL, 1024×1024 là tốt.

Giải mã và lưu: Thêm VAE Decode → Save Image. Bấm Queue Prompt để tạo ảnh.

Hiểu Các Node Quan Trọng (Dễ Hiểu)

Checkpoint Loader: Tải mô hình diffusion (UNet), bộ mã hóa văn bản (CLIP) và VAE. Có thể hiểu là “động cơ + bộ não ngôn ngữ + trình dịch ảnh” của bạn.

CLIP Text Encode: Chuyển prompt thành embeddings số mà mô hình hiểu được. Sử dụng cả mã hóa tích cực và tiêu cực.

KSampler: Trung tâm của quá trình tạo ảnh. Nó loại bỏ nhiễu latent dựa vào prompt và phương pháp sampler qua số bước định sẵn.

VAE Decode: Chuyển latent cuối cùng thành ảnh có thể xem được. Thay VAE sẽ thay đổi độ trung thực màu và tương phản.

Save Image: Ghi ảnh ra đĩa kèm metadata để bạn có thể tái tạo kết quả sau này.

Để hiểu sâu hơn về các thành phần này, bạn có thể đọc các giải thích đơn giản dành cho người mới và mô tả node.

Tăng Cường Năng Lực: LoRA, ControlNet và Image‑to‑Image

Dùng LoRA để kiểm soát phong cách hoặc chủ thể

Thêm node LoRA Loader và kết nối vào nhánh mô hình của bạn.

Cường độ: Bắt đầu khoảng 0.6–0.8; điều chỉnh dựa trên độ mạnh của phong cách hoặc dấu hiệu overfitting.

Nhiều LoRA: Có thể xâu chuỗi hoặc gộp lại, nhưng chú ý tránh xung đột; giảm cường độ khi dùng chồng nhiều LoRA.

Thêm ControlNet để chỉnh bố cục chính xác

Các node ControlNet cho phép bạn điều hướng bố cục dựa trên ảnh đầu vào (Canny, Depth, OpenPose, v.v).

Luồng điển hình: Tải mô hình ControlNet → Xử lý trước ảnh hướng dẫn (ví dụ Canny edge) → Đưa điều kiện ControlNet vào KSampler cùng với điều kiện văn bản.

Trọng số: 0.5–1.2 là mức bắt đầu phù hợp. Quá cao sẽ làm lu mờ prompt của bạn.

Image‑to‑Image hoặc Inpainting

Thay thế nhiễu ban đầu bằng latent ảnh qua VAE Encode.

Điều chỉnh độ mạnh loại bỏ nhiễu trong KSampler để kiểm soát mức độ giữ lại của ảnh gốc.

Với inpainting, dùng thêm input mask và quy trình sampler hỗ trợ inpaint.

Tinh Chỉnh Chất Lượng: Prompt, CFG, Sampler và Seed

Kỹ thuật prompt: Dùng mô tả ngắn gọn, không phải đoạn dài. Thứ tự ít quan trọng hơn sự rõ ràng, nhưng giữ các đặc tính quan trọng ở đầu.

CFG scale:

Thấp (3–5): Sáng tạo hơn, ít tuân prompt

Trung bình (6–8): Cân bằng

Cao (9–12): Tuân prompt mạnh, có thể tạo lỗi ảnh

Chọn sampler:

DPM++ 2M Karras: Sạch, đáng tin cậy

Euler a: Nhanh và biểu cảm, thích hợp xem trước

UniPC / Heun / DDIM: Nên thử, kết quả tuỳ mô hình

Seeds:

Seed cố định = kết quả tái tạo được

Seed thay đổi = khám phá đa dạng hình ảnh

Mẹo Tối Ưu Hiệu Suất Khi Render Mượt Mà

Quản lý VRAM: Giảm độ phân giải, số bước, hoặc kích thước batch nếu bị hết bộ nhớ. SDXL 1024×1024 có thể cần 8–12 GB VRAM tuỳ node.

Chế độ half precision: Bật fp16 nếu được hỗ trợ để tiết kiệm bộ nhớ lớn mà không giảm chất lượng đáng kể.

Chia nhỏ ảnh và dùng latent upscaler: Tạo ảnh nhỏ rồi phóng to bằng node latent upscaler hoặc mô hình upscaler để tiết kiệm VRAM.

Cache: Tái sử dụng embedding CLIP và VAE decoded giữa các lần chạy khi prompt không đổi.

Tránh các nhánh không cần thiết: Node không kết nối vẫn tiêu thụ bộ nhớ khi chạy chung queue.

Sắp Xếp Workflow Như Chuyên Gia

Nhóm node: Dùng frame/label để tổ chức các phần (Prompt, Model, Sampler, Output, v.v).

Bảng điều khiển tham số: Tạo node “control” (ví dụ ô prompt trống, thanh trượt) ở trên cùng để dễ tinh chỉnh.

Lưu/chia sẻ: Xuất workflow dạng JSON và giữ ghi chú models used để tái tạo.

Phiên bản hoá: Giữ các đồ thị tách biệt cho SD 1.5, SDXL và pipeline đặc biệt (anime, photoreal, depth-to-image, v.v).

Khắc Phục Sự Cố Thường Gặp

Ảnh đen hoặc trắng xóa:

Dùng sai VAE hoặc thiếu bước VAE Decode

Mức denoise quá thấp (ví dụ <0.2 khi img2img)

Màu sắc nhạt nhòa:

Thử VAE khác; một số VAE cải thiện độ tương phản rõ rệt

Giảm CFG hoặc đổi sampler

Ảnh không thay đổi qua các lần chạy:

Seed cố định; bật randomize hoặc đổi seed mới

Hết bộ nhớ (OOM):

Giảm độ phân giải, số bước hoặc batch size; chuyển sang fp16

Tắt các ứng dụng GPU khác; đơn giản hóa stack ControlNet/LoRA

Mô hình không tìm thấy / node đỏ:

Kiểm tra đường dẫn file và thư mục mô hình; xác nhận phần mở rộng file

Học Nhanh Với Workflow Có Sẵn

Video hướng dẫn và series dành cho người mới giúp đẩy nhanh quá trình học với đồ thị chạy được ngay có thể tạm dừng và phân tích. Hướng dẫn viết và wiki cung cấp giải thích các node và cập nhật cài đặt để bạn theo kịp.

Nâng Cao: Mô‑đun hoá và Mở Rộng Đồ Thị

API/node bên ngoài: Một số hướng dẫn cho thấy cách kết nối ComfyUI với dịch vụ AI bên ngoài qua node đặc biệt, tạo pipeline lai và chuyển tải công việc nặng.

Thư viện node và tiện ích mở rộng: Khám phá node cộng đồng cho scheduler, upscaler và xử lý tiền kỳ (pose, depth, segmentation). Luôn kiểm tra tương thích với phiên bản ComfyUI của bạn.

SDXL refiners và sampler nối tiếp: Thực hiện khử nhiễu theo giai đoạn (base → refiner) hoặc chạy nhiều sampler để pha trộn phong cách.

Lưu Ý: Tăng Tốc Việc Tạo Prompt Với Sider.AI

Nếu bạn thường xuyên chỉnh sửa prompt, tài liệu tham khảo hoặc mô tả, bạn có thể cần một trợ thủ để brainstorming và hoàn thiện biến thể prompt. Nhân tiện, Sider.AI có thể giúp bạn soạn thảo nhanh prompt có cấu trúc, tạo danh sách prompt tiêu cực và tóm tắt các thử nghiệm workflow để không bị mất dấu giữa các lần chạy. Bạn có thể thử tại đây:

Một Workflow SDXL Khởi Đầu Đơn Giản (Copy Theo Mẫu Này)

Checkpoint Loader (SDXL Base)

CLIP Text Encode (Tích Cực) — “ảnh sản phẩm siêu chi tiết, đèn softbox, lens 50mm, bề mặt phản chiếu”

CLIP Text Encode (Tiêu Cực) — “độ phân giải thấp, chuyển động mờ, watermark, nền lộn xộn”

KSampler: 1024×1024, 28 bước, DPM++ 2M Karras, CFG 5.5, seed cố định

VAE Decode → Save Image

Tuỳ chọn thêm:

Refiner với checkpoint SDXL Refiner, 10–15 bước

ControlNet (Depth) với silhouette đối tượng đơn giản để bố cục

LoRA 0.6 cho nhãn hiệu hoặc phong cách nghệ thuật cụ thể

Điểm Cốt Lõi

Sức mạnh của ComfyUI đến từ sự minh bạch — xây dựng pipeline từng node một.

Dây chuyền text-to-image cơ bản là: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.

SDXL tận dụng hai encoder và bước refiner tùy chọn để tăng chi tiết.

LoRA và ControlNet giúp bạn kiểm soát phong cách và bố cục chính xác.

Tinh chỉnh CFG, sampler và seed để có chất lượng và tính nhất quán; quản lý VRAM bằng fp16 và độ phân giải phù hợp.

Sắp xếp workflow và quản lý phiên bản giúp lặp lại dễ dàng.

Bước Tiếp Theo

Cài ComfyUI theo hướng dẫn repo/wiki và khởi chạy workflow mẫu.

Xây dựng lại dây chuyền tối giản từ đầu để củng cố kiến thức cơ bản.

Thêm ControlNet và LoRA, sau đó thử nghiệm so sánh sampler và CFG.

Lưu và chia sẻ workflow dạng JSON cùng ghi chú về mô hình, seed, và tham số.

Chúc bạn tạo ảnh vui vẻ — và chào mừng đến với thế giới ComfyUI bình tĩnh, dễ kiểm soát.

Câu Hỏi Thường Gặp

Q1: Làm sao để cài đặt và chạy ComfyUI trên Windows, macOS hoặc Linux? Làm theo hướng dẫn chính thức của repo và wiki cộng đồng cho từng nền tảng, vị trí folder mô hình và các thư viện phụ thuộc. Sau khi cài đặt, khởi chạy server cục bộ và mở ComfyUI trong trình duyệt để bắt đầu kết nối các node.

Q2: Workflow text-to-image đơn giản nhất trong ComfyUI là gì? Tải checkpoint, mã hóa prompt tích cực và tiêu cực với CLIP, chạy KSampler, giải mã với VAE rồi lưu ảnh. Dây chuyền này là nền tảng để bạn tạo ảnh hiệu quả với ComfyUI.

Q3: Làm thế nào để dùng SDXL trong ComfyUI? Sử dụng checkpoint SDXL với hai bộ mã hóa văn bản, sau đó có thể thêm bước refiner để tăng chi tiết. Chạy ở 1024×1024 với CFG cân bằng (khoảng 5–7) và sampler hiệu quả như DPM++ 2M Karras.

Q4: Có thể thêm ControlNet và LoRA trong cùng một workflow ComfyUI không? Có thể. Tải các node LoRA và ControlNet, kết nối chúng vào model và điều kiện của KSampler, điều chỉnh trọng số (ví dụ 0.6–0.8 cho LoRA, khoảng 0.5–1.2 cho ControlNet). Theo dõi bộ nhớ VRAM và giảm độ phân giải hoặc số bước nếu gặp OOM.

Q5: Tại sao ảnh ComfyUI của tôi màu nhạt hoặc tương phản kém? Thử dùng VAE khác, giảm CFG, hoặc đổi sampler. Một số VAE cho màu sắc và tương phản chuẩn hơn; điều chỉnh nhỏ có thể khắc phục nhanh vấn đề màu nhạt.