Как да използвате ComfyUI: Практично ръководство стъпка по стъпка за начинаещи
Ако сте чували, че ComfyUI е „базиран на възли и супер мощен“, но се чувствате сплашени от всички кутии и кабели, не сте сами. Добрата новина: след като научите няколко основни концепции – контролни точки, енкодери, семплери и декодери – ще изграждате работни процеси за изображения като професионалист. Това практично ръководство ще ви преведе през това как да използвате ComfyUI от инсталацията до първите ви SDXL изображения, плюс работни процеси за ControlNet, LoRAs и настройка на качеството/производителността.
До края ще знаете точно как да използвате ComfyUI, за да правите последователни, повтарящи се и гъвкави генерирания на изображения без догадки.
Какво е ComfyUI и защо да го използваме?
ComfyUI е визуален, базиран на възли интерфейс за Stable Diffusion, който ви позволява да проектирате вашата стъпка по стъпка линия за обработка на изображения. Вместо един-единствен бутон „Генериране“, вие свързвате възли – всеки от които обработва отделна задача, като например зареждане на модел, кодиране на текст, семплиране на латентни изображения или декодиране на финалното изображение. Той е бърз, модулен и прозрачен – идеален за учене, експериментиране и производствени работни процеси.
Бърз старт: Инсталирайте и стартирайте ComfyUI
- Windows/macOS/Linux: Следвайте официалното хранилище и ръководствата за инсталиране на общността. Можете да използвате ръчна инсталация (Python + зависимости) или пакетирани методи в зависимост от вашата платформа и GPU. Wiki-то на ComfyUI предоставя стъпка по стъпка настройка за Windows, macOS (включително Apple Silicon) и Linux.
- Модели: Поставете вашите контролни точки на Stable Diffusion (напр. SDXL base/refiner или SD 1.5) в папката
models/checkpoints. Поставете VAE файловете в models/vae, LoRA в models/loras, ControlNet моделите в models/controlnet.
- Стартиране: Стартирайте скрипта за стартиране за вашата ОС; ComfyUI се отваря във вашия браузър. Платното е мястото, където ще свързвате възлите заедно.
Съвет: Поддържайте вашите GPU драйвери и CUDA toolkit актуални за най-добра производителност.
Основна концепция: Минимален работен процес текст към изображение
Основният поток от текст към изображение на ComfyUI (стил SD 1.5) изглежда така:
- Изход: UNet, CLIP и VAE компоненти
- Възел: CLIP Text Encode (Положителен)
- Възел: CLIP Text Encode (Отрицателен)
- Изход: Conditioning embeddings за насочване
- Генериране на латентни изображения
- Входове: UNet, положително/отрицателно кондициониране, seed, стъпки, семплер (напр. DPM++ 2M Karras) и CFG scale
- Изход: Латентно изображение
- Декодиране на изображение
Тази основна графика – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – е основата за почти всичко, което ще правите в ComfyUI.
SDXL Workflow: Base + (Optional) Refiner
SDXL използва двойни текстови енкодери и често се възползва от refiner pass.
- Load SDXL Base: Използвайте SDXL-съвместим checkpoint. Много SDXL шаблони включват два CLIP енкодера (за голям/малък контекст). Подавайте както положителни, така и отрицателни подкани.
- KSampler (Base): Генерирайте латентни изображения при 1024×1024 (или вашата цел). Запишете латентни изображения или декодирани изображения.
- Optional Refiner: Заредете SDXL Refiner checkpoint и изпълнете допълнителен KSampler pass, кондициониран на базата на базовия изход, след което декодирайте с VAE.
Този двуетапен процес може значително да подобри детайлите и кохерентността при по-високи разделителни способности.
Практическа работа: Изградете първата си ComfyUI графика
- Започнете от шаблон: В страничната лента заредете вграден пример текст към изображение.
- Заменете checkpoint: Изберете своя SDXL или SD 1.5 модел.
- Напишете вашата подкана: Използвайте положителните и отрицателните CLIP възли. Пример:
- Положителен: „cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain“
- Отрицателен: „blurry, low-res, deformed, extra fingers, watermark“
- Стъпки: 20–35 за баланс на скорост/качество
- Семплер: DPM++ 2M Karras (надежден) или Euler a (бърз)
- CFG: 4.5–7.5 (по-високото тласка подканата по-силно, но може да пренасити)
- Seed: Фиксирайте го за възпроизводимост; променяйте за проучване
- Разделителна способност: За SD 1.5 започнете при 512×512 или 768×768. За SDXL 1024×1024 работи добре.
- Decode and Save: Добавете VAE Decode → Save Image. Щракнете върху Queue Prompt, за да генерирате.
Разбиране на ключовите възли (на обикновен език)
- Checkpoint Loader: Зарежда вашия diffusion модел (UNet), текстов(и) енкодер(и) (CLIP) и VAE. Мислете за него като за вашия „двигател + езиков мозък + преводач на изображения“.
- CLIP Text Encode: Преобразува вашата подкана в числени embeddings, които моделът разбира. Използвайте както положителни, така и отрицателни текстови енкодери.
- KSampler: Сърцето на синтеза на изображения. Той премахва шума от латентния шум, ръководен от вашата подкана и метод на семплиране през определен брой стъпки.
- VAE Decode: Превежда крайните латентни изображения във видимо изображение. Размяната на VAE променя цветовата/контрастната вярност.
- Save Image: Записва изхода на диск с метаданни, за да можете да пресъздадете резултатите по-късно.
За по-задълбочено гмуркане в тези градивни елементи вижте разбивки, подходящи за начинаещи, и обяснения на възлите.
Усилвания: LoRA, ControlNet и Image към Image
Използвайте LoRA за управление на стил или обект
- Добавете възел LoRA Loader и го свържете към вашия модел клон.
- Сила: Започнете около 0.6–0.8; коригирайте въз основа на интензитета на стила или прекомерното приспособяване.
- Множество LoRA: Верига или обединяване, но внимавайте за конфликти; понижете силите при подреждане.
Добавете ControlNet за прецизна композиция
- Възлите ControlNet ви позволяват да управлявате композицията с помощта на входна карта (Canny, Depth, OpenPose и т.н.).
- Типичен поток: Заредете ControlNet модел → Предварително обработете вашето водещо изображение (напр. Canny edge) → Подайте ControlNet кондициониране в KSampler заедно с вашето текстово кондициониране.
- Тегло: 0.5–1.2 е добро начало. Твърде високото може да надделее над вашата подкана.
Изображение към изображение или Inpainting
- Заменете първоначалния шум с латентно изображение чрез VAE Encode.
- Регулирайте силата на denoise в KSampler, за да контролирате колко от оригиналното изображение остава.
- За inpainting използвайте маска за вход и конвейер за семплиране, който е наясно с inpaint.
Настройка на качеството: Подкани, CFG, Семплери и Seeds
- Инженеринг на подкани: Използвайте кратки дескриптори, а не параграфи. Редът е по-малко важен от яснотата, но дръжте критичните атрибути отпред.
- Нисък (3–5): По-креативен, по-малко придържане към подканата
- Висок (9–12): Силно придържане, може да създаде артефакти
- DPM++ 2M Karras: Чист, надежден
- Euler a: Бърз и изразителен, чудесен за визуализации
- UniPC / Heun / DDIM: Заслужава си да се тества; резултатите варират според модела
- Фиксиран seed = възпроизводими резултати
- Промяна на seed = изследване на разнообразието
Съвети за производителност за плавно рендиране
- VRAM budgeting: По-ниска разделителна способност, стъпки или размер на партидата, ако достигнете OOM. SDXL при 1024×1024 може да изисква 8–12 GB VRAM в зависимост от възлите.
- Полу-прецизност: Активирайте fp16, където се поддържа, за големи спестявания на памет с незначителна загуба на качество.
- Tiling и latent upscalers: Генерирайте по-малки, след това мащабирайте чрез latent upscaler възел или модел за увеличаване на мащаба на изображението, за да спестите VRAM.
- Caching: Повторно използване на CLIP кодирания и декодирани VAE при изпълнения, когато подканите не се променят.
- Избягвайте ненужни клонове: Допълнителните несвързани възли все още консумират памет, когато се изпълняват в една и съща опашка.
Организиране на работните процеси като професионалист
- Групирайте възлите: Използвайте рамки/етикети, за да организирате секции (Подкана, Модел, Семплер, Изход и т.н.).
- Панели с параметри: Създайте „контролни“ възли (напр. празни кутии за подкани, плъзгачи) в горната част за лесна настройка.
- Запазване/споделяне: Експортирайте своя JSON за работен поток и запазете бележка за
използвани модели за възпроизводимост.
- Версиониране: Съхранявайте отделни графики за SD 1.5, SDXL и специализирани конвейери (anime, photoreal, depth-to-image и т.н.).
Отстраняване на често срещани проблеми
- Черни или празни изображения:
- Грешен VAE или липсващ VAE Decode
- Твърде нисък denoise (напр. <0.2 в img2img)
- Опитайте друг VAE; някои VAE подобряват контраста забележимо
- Понижете CFG или сменете семплера
- Нищо не се променя при изпълнения:
- Seed е фиксиран; активирайте randomize или задайте нов seed
- Намалете разделителната способност, стъпките или размера на партидата; преминете към fp16
- Затворете други GPU приложения; опростете ControlNet/LoRA стекове
- Моделът не е намерен / червен възел:
- Проверете файловите пътища и папките на модела; потвърдете файловите разширения
Научете по-бързо с предварително изградени работни процеси
Видео уроците и началните серии могат да ускорят вашата крива на обучение с готови за изпълнение графики, които можете да поставите на пауза и да анализирате. ,. Писмените уроци и wiki-та предоставят обяснения на възлите и актуализирани стъпки за инсталиране, за да сте в крак с новостите.
Разширено: Модуларизиране и разширяване на вашите графики
- API/Външни възли: Някои уроци обхващат свързването на ComfyUI към външни AI услуги чрез специални възли, позволяващи хибридни конвейери и разтоварване на тежки задачи.
- Библиотеки с възли и разширения: Разгледайте възлите на общността за schedulers, upscalers и предварителна обработка (pose, depth, segmentation). Винаги проверявайте съвместимостта с вашата ComfyUI версия.
- SDXL refiners и верижни семплери: Изпълнете поетапно премахване на шума (base → refiner) или дори множество семплери за стилистично смесване.
Заслужава си да се отбележи: Ускоряване на подканите с Sider.AI
Ако често повтаряте подкани, препратки или описания, може да искате помощник за обмисляне и усъвършенстване на вариации. Между другото, Sider.AI може да ви помогне бързо да изготвите структурирани подкани, да генерирате списъци с отрицателни подкани и да обобщите вашите експерименти с работния поток, така че да не губите следа между изпълненията. Можете да го опитате тук: Обикновен SDXL начален работен поток (Копирайте този модел)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (Положителен) — „ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface“
- CLIP Text Encode (Отрицателен) — „low-res, motion blur, watermark, background clutter“
- KSampler: 1024×1024, 28 стъпки, DPM++ 2M Karras, CFG 5.5, фиксиран seed
Допълнителни добавки:
- Refiner pass с SDXL Refiner checkpoint при 10–15 стъпки
- ControlNet (Depth) с обикновен силует на обект за оформление
- LoRA при 0.6 за конкретна марка или художествен стил
Основни изводи
- Силата на ComfyUI идва от неговата прозрачност – изградете своя конвейер възел по възел.
- Основната верига текст към изображение е проста: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL се възползва от двойни енкодери и незадължителен refiner pass за детайл.
- LoRA и ControlNet ви дават управление на стила и прецизност на композицията.
- Настройте CFG, семплер и seed за качество и консистенция; управлявайте VRAM с fp16 и разумни разделителни способности.
- Организирайте работните потоци и ги версионирайте за безпроблемно повтаряне.
Следващи стъпки
- Инсталирайте ComfyUI, следвайки инструкциите на repo/wiki, и стартирайте примерен работен поток.
- Възстановете минималната верига от нулата, за да затвърдите основите.
- Добавете ControlNet и LoRA, след което тествайте A/B семплера и CFG настройките.
- Запазете и споделете своя JSON за работен поток с бележки за модели, seeds и параметри.
Приятно генериране – и добре дошли в спокойния, контролируем свят на ComfyUI.
ЧЗВ
Q1:How do I install and run ComfyUI on Windows, macOS, or Linux?
Follow the official repo and the community wiki for platform-specific steps, model folder locations, and dependencies. After installation, launch the local server and open ComfyUI in your browser to start wiring nodes.,.
Q2:What’s the simplest ComfyUI workflow for text-to-image?
Load a checkpoint, encode positive and negative prompts with CLIP, run a KSampler, decode with VAE, then save the image. This chain is the foundation for how to use ComfyUI effectively for most generations.,.
Q3:How do I use SDXL in ComfyUI?
Use an SDXL checkpoint with dual text encoders, then optionally add a refiner pass for better detail. Run at 1024×1024 with balanced CFG (around 5–7) and an efficient sampler like DPM++ 2M Karras..
Q4:Can I add ControlNet and LoRA in the same ComfyUI workflow?
Yes. Load your LoRA and ControlNet nodes, connect them to the model and KSampler conditionings, and tune weights (e.g., 0.6–0.8 for LoRA, ~0.5–1.2 for ControlNet). Watch VRAM usage and reduce resolution or steps if you hit OOM.
Q5:Why are my ComfyUI images low‑contrast or washed out?
Try a different VAE, lower CFG, or switch samplers. Some VAEs produce more faithful color and contrast; small adjustments can fix washed-out results quickly.