ComfyUI-ஐ எவ்வாறு பயன்படுத்துவது: ஆரம்பநிலையாளர்களுக்கான ஒரு நடைமுறை, படிப்படியான வழிகாட்டி
ComfyUI என்பது “node அடிப்படையிலானது மற்றும் மிகவும் சக்தி வாய்ந்தது” என்று நீங்கள் கேள்விப்பட்டிருந்தால், ஆனால் அனைத்து பெட்டிகள் மற்றும் கம்பிகளைக் கண்டு பயந்தால், நீங்கள் மட்டும் தனியாக இல்லை. நல்ல செய்தி: checkpoints, encoders, samplers மற்றும் decoders போன்ற சில முக்கிய கருத்துக்களை நீங்கள் கற்றுக்கொண்டவுடன், ஒரு நிபுணரைப் போல பட வேலைப்பாய்வுகளை உருவாக்குவீர்கள். இந்த நடைமுறை வழிகாட்டி நிறுவலிலிருந்து உங்கள் முதல் SDXL படங்கள் வரை ComfyUI ஐ எவ்வாறு பயன்படுத்துவது என்பது குறித்து உங்களுக்கு வழிகாட்டுகிறது, அத்துடன் ControlNet, LoRA கள் மற்றும் தரம் / செயல்திறன் சரிசெய்தலுக்கான வேலைப்பாய்வுகளையும் உள்ளடக்கியது.
முடிவில், யூகிக்காமல் நிலையான, மீண்டும் செய்யக்கூடிய மற்றும் நெகிழ்வான பட உருவாக்கங்களை உருவாக்க ComfyUI ஐ எவ்வாறு பயன்படுத்துவது என்பதை நீங்கள் சரியாக அறிவீர்கள்.
ComfyUI என்றால் என்ன, அதை ஏன் பயன்படுத்த வேண்டும்?
ComfyUI என்பது Stable Diffusion க்கான ஒரு காட்சி, node அடிப்படையிலான இடைமுகம் ஆகும், இது உங்கள் பட குழாய்த்திட்டத்தை படிப்படியாக வடிவமைக்க உதவுகிறது. ஒரு பொத்தானை மட்டும் அழுத்துவதற்கு பதிலாக, மாதிரியை ஏற்றுவது, உரையை encode செய்வது, latents-ஐ sampling செய்வது அல்லது இறுதிப் படத்தை decode செய்வது போன்ற தனித்தனி பணிகளைக் கையாளும் nodes-ஐ நீங்கள் இணைக்கலாம். இது வேகமானது, மாற்றியமைக்கக்கூடியது, மேலும் வெளிப்படையானது - கற்றல், சோதனை மற்றும் தயாரிப்பு வேலைப்பாய்வுகளுக்கு ஏற்றது.
விரைவான தொடக்கம்: ComfyUI ஐ நிறுவி இயக்கவும்
- Windows/macOS/Linux: அதிகாரப்பூர்வ repo மற்றும் சமூக நிறுவல் வழிகாட்டிகளைப் பின்பற்றவும். உங்கள் இயங்குதளம் மற்றும் GPU ஐப் பொறுத்து, நீங்கள் கைமுறை நிறுவலைப் பயன்படுத்தலாம் (Python + dependencies) அல்லது தொகுக்கப்பட்ட முறைகளைப் பயன்படுத்தலாம். ComfyUI wiki ஆனது Windows, macOS (Apple Silicon உட்பட) மற்றும் Linux க்கான படிப்படியான அமைப்பை வழங்குகிறது.
- Models: உங்கள் Stable Diffusion checkpoints-ஐ (எ.கா., SDXL base/refiner அல்லது SD 1.5)
models/checkpoints கோப்புறையில் வைக்கவும். VAE கோப்புகளை models/vae-ல், LoRA-களை models/loras-ல், ControlNet models-ஐ models/controlnet-ல் வைக்கவும்.
- Launch: உங்கள் OS க்கான தொடக்க script-ஐ இயக்கவும்; ComfyUI உங்கள் browser-ல் திறக்கும். canvas தான் நீங்கள் nodes-ஐ ஒன்றாக இணைக்கும் இடம்.
உதவிக்குறிப்பு: சிறந்த செயல்திறனுக்காக உங்கள் GPU drivers மற்றும் CUDA toolkit-ஐ புதுப்பித்த நிலையில் வைத்திருங்கள்.
முக்கிய கருத்து: குறைந்தபட்ச உரையிலிருந்து படத்திற்கான வேலைப்பாய்வு
ComfyUI-இன் அடிப்படை உரையிலிருந்து படத்திற்கான flow (SD 1.5 style) இதுபோல் இருக்கும்:
- Output: UNet, CLIP மற்றும் VAE கூறுகள்
- Prompt-களை encode செய்யவும்
- Node: CLIP Text Encode (Positive)
- Node: CLIP Text Encode (Negative)
- Output: வழிகாட்டுதலுக்கான Conditioning embeddings
- Inputs: UNet, positive/negative conditioning, seed, steps, sampler (எ.கா., DPM++ 2M Karras), மற்றும் CFG scale
இந்த அடிப்படை graph—Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save—என்பது ComfyUI-இல் நீங்கள் செய்யும் எல்லாவற்றிற்கும் அடிப்படை.
SDXL வேலைப்பாய்வு: Base + (விரும்பினால்) Refiner
SDXL இரட்டை உரை encoders-களைப் பயன்படுத்துகிறது மற்றும் பெரும்பாலும் refiner pass-ல் இருந்து பயனடைகிறது.
- SDXL Base-ஐ ஏற்றவும்: SDXL-இணக்கமான checkpoint-ஐப் பயன்படுத்தவும். பல SDXL templates இரண்டு CLIP encoders-களை உள்ளடக்கியது (பெரிய / சிறிய context-க்கு). positive மற்றும் negative prompt-களை உள்ளிடவும்.
- KSampler (Base): 1024×1024 இல் latents-ஐ உருவாக்கவும் (அல்லது உங்கள் இலக்கு அளவு). latents அல்லது decoded படங்களை சேமிக்கவும்.
- விரும்பினால் Refiner: SDXL Refiner checkpoint-ஐ ஏற்றி, base output-ல் conditioned செய்யப்பட்ட கூடுதல் KSampler pass-ஐ இயக்கவும், பின்னர் VAE-ஐக் கொண்டு decode செய்யவும்.
இந்த இரண்டு-படி செயல்முறை அதிக தெளிவுத்திறனில் விவரம் மற்றும் ஒருமைப்பாட்டை கணிசமாக மேம்படுத்தும்.
செயல்முறை விளக்கம்: உங்கள் முதல் ComfyUI Graph-ஐ உருவாக்குங்கள்
- ஒரு template-ல் இருந்து தொடங்கவும்: sidebar-ல், உள்ளமைக்கப்பட்ட உரையிலிருந்து படத்திற்கான உதாரணத்தை ஏற்றவும்.
- Checkpoint-ஐ மாற்றவும்: உங்கள் SDXL அல்லது SD 1.5 மாதிரியைத் தேர்ந்தெடுக்கவும்.
- உங்கள் prompt-ஐ எழுதவும்: Positive மற்றும் Negative CLIP nodes-களைப் பயன்படுத்தவும். உதாரணம்:
- Positive: “cinematic portrait, soft studio lighting, 85mm lens, highly detailed, film grain”
- Negative: “blurry, low-res, deformed, extra fingers, watermark”
- Steps: வேகம் / தர சமநிலைக்கு 20-35
- Sampler: DPM++ 2M Karras (நம்பகமானது) அல்லது Euler a (வேகமானது)
- CFG: 4.5-7.5 (அதிகம் prompt-ஐ கடினமாக தள்ளுகிறது, ஆனால் அதிக நிறைவு செய்யலாம்)
- Seed: மீண்டும் உருவாக்க அதை சரிசெய்யவும்; ஆய்வுக்காக மாறுபடும்
- தெளிவுத்திறன்: SD 1.5 க்கு, 512×512 அல்லது 768×768 இல் தொடங்கவும். SDXL க்கு, 1024×1024 நன்றாக வேலை செய்கிறது.
- Decode செய்து சேமிக்கவும்: VAE Decode → Save Image-ஐ சேர்க்கவும். உருவாக்க Queue Prompt என்பதை கிளிக் செய்யவும்.
முக்கிய Nodes-களைப் புரிந்துகொள்வது (எளிமையான ஆங்கிலத்தில்)
- Checkpoint Loader: உங்கள் diffusion model (UNet), text encoder(கள்) (CLIP) மற்றும் VAE-ஐ ஏற்றுகிறது. இதை உங்கள் “engine + language brain + image translator” என்று நினைத்துப் பாருங்கள்.
- CLIP Text Encode: உங்கள் prompt-ஐ மாதிரி புரிந்துகொள்ளும் numerical embeddings-ஆக மாற்றுகிறது. positive மற்றும் negative text encoders இரண்டையும் பயன்படுத்தவும்.
- KSampler: பட தொகுப்பின் இதயம். இது உங்கள் prompt மற்றும் sampler method-ஆல் ஒரு குறிப்பிட்ட எண்ணிக்கையிலான படிகளில் latent noise-ஐ denoises செய்கிறது.
- VAE Decode: இறுதி latents-ஐ பார்க்கக்கூடிய படமாக மாற்றுகிறது. VAE-களை மாற்றுவது நிறம் / மாறுபாடு துல்லியத்தை மாற்றுகிறது.
- Save Image: metadata உடன் output-ஐ disk-ல் எழுதுகிறது, இதனால் நீங்கள் முடிவுகளை பின்னர் மீண்டும் உருவாக்க முடியும்.
இந்த building blocks பற்றிய ஆழமான புரிதலுக்கு, ஆரம்பநிலைக்கு ஏற்ற விளக்கங்கள் மற்றும் node explainers-ஐப் பார்க்கவும்.
Power‑Ups: LoRA, ControlNet மற்றும் படத்திலிருந்து படத்திற்கு
Style அல்லது Subject Control-க்கு LoRA ஐப் பயன்படுத்தவும்
- LoRA Loader node-ஐச் சேர்த்து, அதை உங்கள் மாதிரி branch-உடன் இணைக்கவும்.
- Strength: சுமார் 0.6-0.8 இல் தொடங்கவும்; style தீவிரத்தன்மை அல்லது overfitting-ஐ அடிப்படையாகக் கொண்டு சரிசெய்யவும்.
- Multiple LoRA-க்கள்: சங்கிலி அல்லது இணைக்கவும், ஆனால் முரண்பாடுகளைக் கவனியுங்கள்; stacking செய்யும் போது வலிமையைக் குறைக்கவும்.
துல்லியமான composition-க்கு ControlNet-ஐ சேர்க்கவும்
- ControlNet nodes ஆனது ஒரு உள்ளீட்டு map-ஐப் பயன்படுத்தி (Canny, Depth, OpenPose, etc.) composition-ஐ கட்டுப்படுத்த அனுமதிக்கிறது.
- வழக்கமான flow: ControlNet model-ஐ ஏற்றவும் → உங்கள் வழிகாட்டி படத்தை preprocess செய்யவும் (எ.கா., Canny edge) → உங்கள் text conditioning உடன் KSampler-க்குள் ControlNet conditioning-ஐ உள்ளிடவும்.
- Weight: 0.5-1.2 ஒரு நல்ல தொடக்கம். அதிகமாக இருந்தால் உங்கள் prompt-ஐ முறியடிக்கலாம்.
படத்திலிருந்து படத்திற்கு அல்லது Inpainting
- VAE Encode வழியாக ஆரம்ப noise-ஐ ஒரு பட latent-உடன் மாற்றவும்.
- KSampler-ல் உள்ள denoise strength-ஐ சரிசெய்து அசல் படத்தின் எவ்வளவு மீதமிருக்க வேண்டும் என்பதைக் கட்டுப்படுத்தவும்.
- Inpainting-க்கு, mask input மற்றும் inpaint-aware sampler pipeline-ஐப் பயன்படுத்தவும்.
தர சரிசெய்தல்: Prompts, CFG, Samplers மற்றும் Seeds
- Prompt engineering: பத்திகளை விட சிறிய descriptor-களைப் பயன்படுத்தவும். தெளிவை விட order முக்கியத்துவம் குறைந்தது, ஆனால் முக்கியமான attributes-ஐ முன்பே வைக்கவும்.
- Low (3–5): அதிக ஆக்கப்பூர்வமானது, prompt adherence குறைவு
- High (9–12): வலுவான adherence, artifacts-ஐ உருவாக்க முடியும்
- DPM++ 2M Karras: சுத்தமான, நம்பகமானது
- Euler a: வேகமான மற்றும் வெளிப்படையானது, முன்னோட்டங்களுக்கு சிறந்தது
- UniPC / Heun / DDIM: சோதனைக்கு மதிப்புள்ளது; முடிவுகள் மாதிரியைப் பொறுத்து மாறுபடும்
- Fixed seed = மீண்டும் உருவாக்கக்கூடிய முடிவுகள்
- மாறுபட்ட seed = பன்முகத்தன்மையை ஆராயுங்கள்
மென்மையான ரெண்டர்களுக்கு செயல்திறன் குறிப்புகள்
- VRAM பட்ஜெட்: நீங்கள் OOM-ஐ அடித்தால் resolution, steps அல்லது batch size-ஐக் குறைக்கவும். 1024×1024 இல் SDXL nodes-ஐப் பொறுத்து 8–12 GB VRAM தேவைப்படலாம்.
- Half precision: குறிப்பிடத்தக்க தர இழப்பு இல்லாமல் பெரிய நினைவக சேமிப்புக்காக fp16-ஐ ஆதரிக்கப்படும் இடத்தில் இயக்கவும்.
- Tiling மற்றும் latent upscalers: சிறியதாக உருவாக்கவும், பின்னர் VRAM-ஐ சேமிக்க latent upscaler node அல்லது image upscaler model வழியாக upscale செய்யவும்.
- Caching: prompts மாறாதபோது runs முழுவதும் CLIP encodings மற்றும் decoded VAE-களை மீண்டும் பயன்படுத்தவும்.
- தேவையற்ற branches-களைத் தவிர்க்கவும்: கூடுதல் துண்டிக்கப்பட்ட nodes அதே வரிசையில் இயக்கும்போது இன்னும் நினைவகத்தைப் பயன்படுத்துகின்றன.
ஒரு நிபுணரைப் போல வேலைப்பாய்வுகளை ஒழுங்கமைத்தல்
- Group nodes: பிரிவுகளை ஒழுங்கமைக்க frames/labels-ஐப் பயன்படுத்தவும் (Prompt, Model, Sampler, Output போன்றவை).
- Parameter panels: எளிதாக சரிசெய்ய மேல்தளத்தில் “control” nodes-களை (எ.கா., காலியான prompt பெட்டிகள், ஸ்லைடர்கள்) உருவாக்கவும்.
- சேமி / பகிர்: உங்கள் workflow JSON-ஐ ஏற்றுமதி செய்து, மீண்டும் உருவாக்க
models used குறிப்பை வைக்கவும்.
- Versioning: SD 1.5, SDXL மற்றும் சிறப்பு pipelines (anime, photoreal, depth-to-image போன்றவை) ஆகியவற்றிற்கு தனி graphs-ஐ வைத்திருக்கவும்.
பொதுவான சிக்கல்களை சரிசெய்தல்
- கருப்பு அல்லது வெற்று படங்கள்:
- தவறான VAE அல்லது காணாமல் போன VAE Decode
- Denoise மிகவும் குறைவு (எ.கா., img2img இல் <0.2)
- வேறு VAE-ஐ முயற்சிக்கவும்; சில VAE-கள் மாறுபாட்டை கணிசமாக மேம்படுத்துகின்றன
- CFG-ஐக் குறைக்கவும் அல்லது sampler-ஐ மாற்றவும்
- Runs முழுவதும் எதுவும் மாறவில்லை:
- Seed சரி செய்யப்பட்டது; randomize-ஐ இயக்கவும் அல்லது புதிய seed-ஐ அமைக்கவும்
- Resolution, steps அல்லது batch size-ஐக் குறைக்கவும்; fp16 க்கு மாறவும்
- பிற GPU apps-களை மூடவும்; ControlNet/LoRA stacks-களை எளிதாக்கவும்
- மாதிரி காணப்படவில்லை / சிவப்பு node:
- File paths மற்றும் model folders-களைச் சரிபார்க்கவும்; file extensions-களை உறுதிப்படுத்தவும்
முன்கூட்டியே உருவாக்கப்பட்ட வேலைப்பாய்வுகளுடன் வேகமாக கற்றுக்கொள்ளுங்கள்
Video walkthroughs மற்றும் ஆரம்ப தொடர்கள், இடைநிறுத்தப்பட்டு பிரிக்கக்கூடிய, பயன்படுத்த தயாராக இருக்கும் graphs மூலம் உங்கள் கற்றல் வளைவை துரிதப்படுத்தலாம். எழுதப்பட்ட tutorials மற்றும் wikis node விளக்கங்களையும் புதுப்பிக்கப்பட்ட நிறுவல் படிகளையும் வழங்குகின்றன, இதனால் நீங்கள் எப்போதும் புதுப்பித்த நிலையில் இருக்கலாம்.
மேம்பட்டவை: உங்கள் Graphs-களை மாற்றியமைத்தல் மற்றும் விரிவாக்குதல்
- API/External nodes: சில tutorials ComfyUI-ஐ சிறப்பு nodes வழியாக external AI சேவைகளுடன் இணைப்பதை உள்ளடக்கியது, இது கலப்பின pipelines மற்றும் அதிக பணிகளை offload செய்ய உதவுகிறது.
- Node libraries மற்றும் extensions: schedulers, upscalers மற்றும் preprocessing (pose, depth, segmentation) க்கான சமூக nodes-களை ஆராயுங்கள். உங்கள் ComfyUI பதிப்புடன் எப்போதும் இணக்கத்தன்மையை சரிபார்க்கவும்.
- SDXL refiners மற்றும் chained samplers: staged denoising (base → refiner) அல்லது stylistic blending-க்கு பல samplers-ஐ இயக்கவும்.
Sider.AI மூலம் Prompts-ஐ வேகப்படுத்துவது குறிப்பிடத்தக்கது
Prompt-கள், குறிப்புகள் அல்லது விளக்கங்களில் நீங்கள் அடிக்கடி மாற்றங்களைச் செய்தால், மாறுபாடுகளை brainstrom செய்து செம்மைப்படுத்த உங்களுக்கு ஒரு உதவியாளர் தேவைப்படலாம். மேலும், Sider.AI கட்டமைக்கப்பட்ட prompt-களை விரைவாக உருவாக்கவும், negative prompt பட்டியல்களை உருவாக்கவும், மேலும் உங்கள் workflow சோதனைகளை சுருக்கவும் உதவும், இதனால் runs-க்கு இடையில் தடத்தை இழக்க மாட்டீர்கள். நீங்கள் அதை இங்கே முயற்சி செய்யலாம்: எளிய SDXL தொடக்க Workflow (இந்த pattern-ஐ நகலெடுக்கவும்)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (Positive) — “ultra-detailed product photo, softbox lighting, 50mm lens, reflective surface”
- CLIP Text Encode (Negative) — “low-res, motion blur, watermark, background clutter”
- KSampler: 1024×1024, 28 steps, DPM++ 2M Karras, CFG 5.5, fixed seed
விரும்பினால் add-ons:
- 10–15 படிகளில் SDXL Refiner checkpoint உடன் Refiner pass
- layout-க்கு எளிய பொருள் silhouette உடன் ControlNet (Depth)
- ஒரு குறிப்பிட்ட brand அல்லது கலை style-க்கு 0.6 இல் LoRA
முக்கிய குறிப்புகள்
- ComfyUI இன் சக்தி அதன் வெளிப்படைத்தன்மையிலிருந்து வருகிறது - உங்கள் குழாய்த்திட்டத்தை node மூலம் உருவாக்குங்கள்.
- முக்கிய உரையிலிருந்து படத்திற்கான சங்கிலி எளிதானது: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL இரட்டை encoders-களில் இருந்தும் விவரங்களுக்கான விருப்ப refiner pass-ல் இருந்தும் பயனடைகிறது.
- LoRA கள் மற்றும் ControlNet உங்களுக்கு style கட்டுப்பாடு மற்றும் composition துல்லியத்தை வழங்குகிறது.
- தரம் மற்றும் ஒருமைப்பாட்டிற்காக CFG, sampler மற்றும் seed-ஐ சரிசெய்யவும்; fp16 மற்றும் உணர்வுபூர்வமான resolutions-களைக் கொண்டு VRAM-ஐ நிர்வகிக்கவும்.
- வேலைப்பாய்வுகளை ஒழுங்கமைத்து, வலியற்ற மாற்றத்திற்கு அவற்றை version செய்யவும்.
அடுத்த படிகள்
- Repo/wiki வழிமுறைகளைப் பின்பற்றி ComfyUI ஐ நிறுவி, ஒரு மாதிரி workflow-ஐ இயக்கவும்.
- அடிப்படையை உறுதிப்படுத்த scratch-லிருந்து குறைந்தபட்ச சங்கிலியை மீண்டும் உருவாக்கவும்.
- ControlNet மற்றும் LoRA-ஐச் சேர்க்கவும், பின்னர் sampler மற்றும் CFG அமைப்புகளை A/B test செய்யவும்.
- மாதிரிகள், seeds மற்றும் parameters பற்றிய குறிப்புகளுடன் உங்கள் workflow JSON-ஐ சேமித்து பகிரவும்.
மகிழ்ச்சியாக உருவாக்கவும் - மேலும் ComfyUI-இன் அமைதியான, கட்டுப்படுத்தக்கூடிய உலகத்திற்கு வரவேற்கிறோம்.
FAQ
Q1: Windows, macOS அல்லது Linux-ல் ComfyUI-ஐ எவ்வாறு நிறுவுவது மற்றும் இயக்குவது?
தளம் சார்ந்த படிகள், மாதிரி கோப்புறைகளின் இருப்பிடங்கள் மற்றும் dependencies-களுக்கு அதிகாரப்பூர்வ repo மற்றும் சமூக wiki-ஐப் பின்பற்றவும். நிறுவிய பின், local server-ஐத் தொடங்கி, nodes-களை இணைக்க உங்கள் browser-ல் ComfyUI-ஐத் திறக்கவும்.
Q2: உரையிலிருந்து படத்திற்கான எளிய ComfyUI workflow எது?
A checkpoint-ஐ ஏற்றவும், CLIP உடன் positive மற்றும் negative prompts-களை encode செய்யவும், KSampler-ஐ இயக்கவும், VAE உடன் decode செய்யவும், பின்னர் படத்தை சேமிக்கவும். பெரும்பாலான உருவாக்கங்களுக்கு ComfyUI ஐ திறம்பட பயன்படுத்துவதற்கான அடிப்படை இது.
Q3: ComfyUI-இல் SDXL ஐ எவ்வாறு பயன்படுத்துவது?
இரட்டை உரை encoders-களுடன் SDXL checkpoint-ஐப் பயன்படுத்தவும், பின்னர் சிறந்த விவரங்களுக்காக refiner pass-ஐ விருப்பமாகச் சேர்க்கவும். சமநிலையான CFG (சுமார் 5–7) மற்றும் DPM++ 2M Karras போன்ற திறமையான sampler உடன் 1024×1024 இல் இயக்கவும்.
Q4: ஒரே ComfyUI workflow-இல் ControlNet மற்றும் LoRA-ஐச் சேர்க்க முடியுமா?
ஆம். உங்கள் LoRA மற்றும் ControlNet nodes-களை ஏற்றவும், அவற்றை மாதிரி மற்றும் KSampler conditionings-களுடன் இணைக்கவும், மேலும் weights-ஐ சரிசெய்யவும் (எ.கா., LoRA-க்கு 0.6–0.8, ControlNet-க்கு ~0.5–1.2). VRAM பயன்பாட்டைப் பார்த்து, நீங்கள் OOM-ஐ அடித்தால் resolution அல்லது steps-ஐக் குறைக்கவும்.
Q5: எனது ComfyUI படங்கள் ஏன் low‑contrast அல்லது washed out ஆக உள்ளன?
வேறு VAE-ஐ முயற்சிக்கவும், CFG-ஐக் குறைக்கவும் அல்லது samplers-ஐ மாற்றவும். சில VAE-கள் அதிக நம்பகமான நிறம் மற்றும் மாறுபாட்டை உருவாக்குகின்றன; சிறிய சரிசெய்தல்கள் washed-out முடிவுகளை விரைவாக சரிசெய்யும்.