כיצד להשתמש ב-ComfyUI: מדריך מעשי, שלב אחר שלב, למתחילים
אם שמעתם ש-ComfyUI היא "מבוססת צמתים וסופר עוצמתית" אבל הרגשתם מאוימים מכל התיבות והחוטים, אתם לא לבד. החדשות הטובות: ברגע שתלמדו כמה מושגי ליבה – נקודות ביקורת, מקודדים, דוגמים ומפענחים – תבנו תהליכי עבודה של תמונות כמו מקצוענים. מדריך מעשי זה ידריך אתכם כיצד להשתמש ב-ComfyUI מהתקנה ועד לתמונות SDXL הראשונות שלכם, בתוספת תהליכי עבודה עבור ControlNet, LoRAs וכוונון איכות/ביצועים.
עד סוף המדריך, תדעו בדיוק כיצד להשתמש ב-ComfyUI כדי ליצור יצירות תמונה עקביות, ניתנות לשחזור וגמישות ללא ניחושים.
מה זה ComfyUI ולמה להשתמש בה?
ComfyUI היא ממשק ויזואלי מבוסס צמתים עבור Stable Diffusion שמאפשר לכם לעצב את צינור התמונה שלכם שלב אחר שלב. במקום כפתור "יצירה" בודד, אתם מחברים צמתים – כל אחד מטפל במשימה נפרדת כגון טעינת מודל, קידוד טקסט, דגימת חבויים או פענוח התמונה הסופית. היא מהירה, מודולרית ושקופה – מושלמת ללמידה, ניסויים ותהליכי עבודה.
התחלה מהירה: התקינו והפעילו את ComfyUI
- Windows/macOS/Linux: עקבו אחר המאגר הרשמי ומדריכי ההתקנה של הקהילה. אתם יכולים להשתמש בהתקנה ידנית (Python + תלויות) או בשיטות ארוזות בהתאם לפלטפורמה ולמעבד הגרפי שלכם. ה-wiki של ComfyUI מספק הגדרה שלב אחר שלב עבור Windows, macOS (כולל Apple Silicon) ו-Linux.
- מודלים: הניחו את נקודות הביקורת של Stable Diffusion (לדוגמה, SDXL base/refiner או SD 1.5) בתיקייה
models/checkpoints. שימו קבצי VAE ב-models/vae, LoRAs ב-models/loras, מודלי ControlNet ב-models/controlnet.
- הפעלה: הפעילו את סקריפט ההתחלה עבור מערכת ההפעלה שלכם; ComfyUI נפתחת בדפדפן שלכם. הקנבס הוא המקום שבו תחברו צמתים יחד.
טיפ: שמרו על דרייברי ה-GPU וערכת הכלים CUDA מעודכנים לביצועים הטובים ביותר.
מושג ליבה: תהליך העבודה המינימלי של טקסט לתמונה
זרימת הטקסט לתמונה הבסיסית של ComfyUI (סגנון SD 1.5) נראית כך:
- פלט: רכיבי UNet, CLIP ו-VAE
- צומת: CLIP Text Encode (חיובי)
- צומת: CLIP Text Encode (שלילי)
- כניסות: UNet, התניה חיובית/שלילית, seed, שלבים, דוגם (לדוגמה, DPM++ 2M Karras) וקנה מידה CFG
גרף בסיסי זה – Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save – הוא הבסיס לכל מה שתעשו ב-ComfyUI.
SDXL Workflow: Base + (אופציונלי) Refiner
SDXL משתמשת במקודדי טקסט כפולים ולעתים קרובות מרוויחה ממעבר זיקוק.
- טען SDXL Base: השתמש בנקודת ביקורת תואמת SDXL. תבניות SDXL רבות כוללות שני מקודדי CLIP (עבור הקשר גדול/קטן). הזן הנחיות חיוביות ושליליות.
- KSampler (Base): צור חבויים ב-1024×1024 (או ביעד שלך). שמור חבויים או תמונות מפוענחות.
- Refiner אופציונלי: טען את נקודת הביקורת של SDXL Refiner והפעל מעבר KSampler נוסף מותנה בפלט הבסיס, ולאחר מכן פענח עם VAE.
תהליך דו-שלבי זה יכול לשפר משמעותית את הפירוט והקוהרנטיות ברזולוציות גבוהות יותר.
תרגול מעשי: בנו את גרף ComfyUI הראשון שלכם
- התחל מתבנית: בסרגל הצד, טען דוגמה מובנית של טקסט לתמונה.
- החלף את נקודת הביקורת: בחר את מודל SDXL או SD 1.5 שלך.
- כתוב את ההנחיה שלך: השתמש בצמתי CLIP החיוביים והשליליים. לדוגמה:
- חיובי: “דיוקן קולנועי, תאורת סטודיו רכה, עדשת 85 מ"מ, מפורט מאוד, גרעיניות של סרט”
- שלילי: “מטושטש, ברזולוציה נמוכה, מעוות, אצבעות נוספות, סימן מים”
- שלבים: 20–35 לאיזון מהירות/איכות
- דוגם: DPM++ 2M Karras (אמין) או Euler a (מהיר)
- CFG: 4.5–7.5 (גבוה יותר דוחף את ההנחיה חזק יותר, אבל יכול לגרום לרוויה יתר)
- Seed: תקן אותו לשחזור; שנה אותו לחקירה
- רזולוציה: עבור SD 1.5, התחל ב-512×512 או 768×768. עבור SDXL, 1024×1024 עובד היטב.
- פנח ושמור: הוסף VAE Decode → Save Image. לחץ על Queue Prompt כדי ליצור.
הבנת צמתי המפתח (בשפה פשוטה)
- Checkpoint Loader: טוען את מודל הדיפוזיה שלך (UNet), מקודדי טקסט (CLIP) ו-VAE. תחשוב על זה כעל "מנוע + מוח שפה + מתרגם תמונות".
- CLIP Text Encode: ממיר את ההנחיה שלך להטמעות מספריות שהמודל מבין. השתמש במקודדי טקסט חיוביים ושליליים.
- KSampler: הלב של סינתזת תמונות. הוא מסיר רעש חבוי בהנחיית ההנחיה ושיטת הדגימה שלך על פני מספר שלבים.
- VAE Decode: מתרגם חבויים סופיים לתמונה ניתנת לצפייה. החלפת VAEs משנה את נאמנות הצבע/ניגודיות.
- Save Image: כותב פלט לדיסק עם מטא נתונים כדי שתוכל ליצור מחדש תוצאות מאוחר יותר.
לצלילה עמוקה יותר על אבני הבניין האלה, עיין בפירוקים ידידותיים למתחילים ומסבירי צמתים.
Power‑Ups: LoRA, ControlNet ותמונה לתמונה
השתמש ב-LoRA לבקרת סגנון או נושא
- הוסף צומת LoRA Loader וחבר אותו לענף המודל שלך.
- עוצמה: התחל בסביבות 0.6–0.8; התאם בהתבסס על עוצמת הסגנון או התאמת יתר.
- LoRAs מרובים: שרשר או מזג, אבל היזהר מפני התנגשויות; הורד עוצמות בעת ערימה.
הוסף ControlNet לקומפוזיציה מדויקת
- צמתי ControlNet מאפשרים לך לנווט קומפוזיציה באמצעות מפת קלט (Canny, Depth, OpenPose וכו').
- זרימה טיפוסית: טען מודל ControlNet ← עבד מראש את תמונת ההנחיה שלך (לדוגמה, קצה Canny) ← הזן התניית ControlNet לתוך KSampler יחד עם התניית הטקסט שלך.
- משקל: 0.5–1.2 היא התחלה טובה. גבוה מדי יכול להכריע את ההנחיה שלך.
תמונה לתמונה או תיקון צבע
- החלף את הרעש הראשוני בתמונה חבויה באמצעות VAE Encode.
- התאם את עוצמת הסרת הרעשים ב-KSampler כדי לשלוט בכמות התמונה המקורית שנותרה.
- לתיקון צבע, השתמש בקלט מסכה וצינור דוגם מודע לתיקון צבע.
כוונון איכות: הנחיות, CFG, דוגמים ו-Seeds
- הנדסת הנחיות: השתמש בתיאורים תמציתיים, לא בפסקאות. סדר חשוב פחות מבהירות, אבל שמור על תכונות קריטיות בחזית.
- נמוך (3–5): יותר יצירתי, פחות הקפדה על ההנחיה
- גבוה (9–12): הקפדה חזקה, יכול ליצור חפצים
- DPM++ 2M Karras: נקי, אמין
- Euler a: מהיר ואקספרסיבי, נהדר לתצוגה מקדימה
- UniPC / Heun / DDIM: כדאי לבדוק; התוצאות משתנות לפי מודל
- Seed קבוע = תוצאות ניתנות לשחזור
טיפים לביצועים עבור רנדרים חלקים
- תקצוב VRAM: הורד רזולוציה, שלבים או גודל אצווה אם אתה מגיע ל-OOM. SDXL ב-1024×1024 יכול לדרוש 8–12 GB VRAM בהתאם לצמתים.
- דיוק חצי: הפעל fp16 היכן שנתמך עבור חיסכון גדול בזיכרון עם אובדן איכות זניח.
- ריצוף ומגדילי חבויים: צור קטנים יותר, ואז הגדל באמצעות צומת מגדיל חבוי או מודל מגדיל תמונה כדי לחסוך ב-VRAM.
- אחסון במטמון: השתמש מחדש בקידודי CLIP ו-VAEs מפוענחים על פני ריצות כאשר ההנחיות לא משתנות.
- הימנע מענפים מיותרים: צמתים מנותקים נוספים עדיין צורכים זיכרון כאשר הם מבוצעים באותו תור.
ארגון תהליכי עבודה כמו מקצוען
- קבץ צמתים: השתמש במסגרות/תוויות כדי לארגן חלקים (הנחיה, מודל, דוגם, פלט וכו').
- לוחות פרמטרים: צור צמתי "שליטה" (לדוגמה, תיבות הנחיה ריקות, מחוונים) בחלק העליון לכוונון קל.
- שמור/שתף: ייצא את JSON של תהליך העבודה שלך ושמור הערה של
מודלים בשימוש לשחזור.
- שליטה בגרסאות: שמור גרפים נפרדים עבור SD 1.5, SDXL וצינורות מיוחדים (אנימה, פוטוריאליסטי, עומק לתמונה וכו').
פתרון בעיות נפוצות
- VAE שגוי או VAE Decode חסר
- הסרת רעשים נמוכה מדי (לדוגמה, <0.2 ב-img2img)
- נסה VAE אחר; חלק מה-VAEs משפרים את הניגודיות באופן ניכר
- שום דבר לא משתנה בין ריצות:
- Seed קבוע; הפעל אקראיות או הגדר seed חדש
- הורד רזולוציה, שלבים או גודל אצווה; עבור ל-fp16
- סגור אפליקציות GPU אחרות; פשט ערימות ControlNet/LoRA
- מודל לא נמצא / צומת אדום:
- אמת את נתיבי הקבצים ותיקיות המודל; אשר את סיומות הקבצים
למד מהר יותר עם תהליכי עבודה בנויים מראש
הדרכות וידאו וסדרות למתחילים יכולים להאיץ את עקומת הלמידה שלך עם גרפים מוכנים להפעלה שאתה יכול להשהות ולנתח. מדריכים וויקי כתובים מספקים הסברים על צמתים ושלבי התקנה מעודכנים כדי לשמור אותך מעודכן.
מתקדם: מודולריזציה והרחבת הגרפים שלך
- API/צמתים חיצוניים: חלק מההדרכות מכסות חיבור ComfyUI לשירותי AI חיצוניים באמצעות צמתים מיוחדים, המאפשרים צינורות היברידיים ומורידים משימות כבדות.
- ספריות צמתים והרחבות: חקור צמתי קהילה עבור מתזמנים, מגדילים ועיבוד מראש (תנוחה, עומק, פילוח). בדוק תמיד את התאימות לגרסת ComfyUI שלך.
- זיקוקי SDXL ודוגמים משורשרים: הפעל הסרת רעשים מדורגת (בסיס ← זיקוק) או אפילו דוגמים מרובים למיזוג סגנוני.
ראוי לציון: האצת הנחיות עם Sider.AI
אם אתה חוזר לעתים קרובות על הנחיות, הפניות או תיאורים, ייתכן שתרצה עוזר משני לסיעור מוחות ולשכלול וריאציות. אגב, Sider.AI יכול לעזור לך לנסח במהירות הנחיות מובנות, ליצור רשימות הנחיות שליליות ולסכם את ניסויי תהליך העבודה שלך כדי שלא תאבד מעקב בין ריצות. אתה יכול לנסות את זה כאן: תהליך עבודה פשוט למתחילים של SDXL (העתק דפוס זה)
- Checkpoint Loader (SDXL Base)
- CLIP Text Encode (חיובי) – "תצלום מוצר מפורט במיוחד, תאורת סופטבוקס, עדשת 50 מ"מ, משטח מחזיר אור"
- CLIP Text Encode (שלילי) – "רזולוציה נמוכה, טשטוש תנועה, סימן מים, עומס רקע"
- KSampler: 1024×1024, 28 שלבים, DPM++ 2M Karras, CFG 5.5, seed קבוע
תוספות אופציונליות:
- מעבר זיקוק עם נקודת ביקורת SDXL Refiner ב-10–15 שלבים
- ControlNet (עומק) עם צללית אובייקט פשוטה לפריסה
- LoRA ב-0.6 עבור מותג ספציפי או סגנון אמנותי
נקודות מפתח
- העוצמה של ComfyUI מגיעה מהשקיפות שלה – בנה את צינור התמונה שלך צומת אחר צומת.
- שרשרת הטקסט לתמונה הליבה היא פשוטה: Checkpoint → CLIP (pos/neg) → KSampler → VAE Decode → Save.
- SDXL מרוויחה ממקודדים כפולים וממעבר זיקוק אופציונלי לפירוט.
- LoRAs ו-ControlNet נותנים לך שליטה בסגנון ודיוק קומפוזיציה.
- כוונון CFG, דוגם ו-seed לאיכות ועקביות; נהל VRAM עם fp16 ורזולוציות הגיוניות.
- ארגן תהליכי עבודה ושלוט בגרסאות שלהם לצורך חזרה קלה.
הצעדים הבאים
- התקן את ComfyUI בהתאם להוראות המאגר/וויקי והפעל תהליך עבודה לדוגמה.
- בנה מחדש את השרשרת המינימלית מאפס כדי לבסס את היסודות.
- הוסף ControlNet ו-LoRA, ולאחר מכן בדוק A/B הגדרות דוגם ו-CFG.
- שמור ושתף את JSON של תהליך העבודה שלך עם הערות על מודלים, seeds ופרמטרים.
יצירה שמחה – וברוכים הבאים לעולם הרגוע והניתן לשליטה של ComfyUI.
שאלות נפוצות
ש1: כיצד אוכל להתקין ולהפעיל את ComfyUI ב-Windows, macOS או Linux?
עקוב אחר המאגר הרשמי וויקי הקהילה לשלבים ספציפיים לפלטפורמה, מיקומי תיקיות מודלים ותלויות. לאחר ההתקנה, הפעל את השרת המקומי ופתח את ComfyUI בדפדפן שלך כדי להתחיל לחבר צמתים.
ש2: מהו תהליך העבודה הפשוט ביותר של ComfyUI לטקסט לתמונה?
טען נקודת ביקורת, קודד הנחיות חיוביות ושליליות עם CLIP, הפעל KSampler, פענח עם VAE, ולאחר מכן שמור את התמונה. שרשרת זו היא הבסיס לאופן השימוש ב-ComfyUI ביעילות עבור רוב הדורות.
ש3: כיצד אוכל להשתמש ב-SDXL ב-ComfyUI?
השתמש בנקודת ביקורת SDXL עם מקודדי טקסט כפולים, ולאחר מכן הוסף מעבר זיקוק לפרטים טובים יותר. הפעל ב-1024×1024 עם CFG מאוזן (בסביבות 5–7) ודוגם יעיל כמו DPM++ 2M Karras.
ש4: האם אוכל להוסיף ControlNet ו-LoRA באותו תהליך עבודה של ComfyUI?
כן. טען את צמתי LoRA ו-ControlNet שלך, חבר אותם להתניות המודל ו-KSampler וכוונון משקלים (לדוגמה, 0.6–0.8 עבור LoRA, ~0.5–1.2 עבור ControlNet). צפה בשימוש ב-VRAM והורד רזולוציה או שלבים אם אתה מגיע ל-OOM.
ש5: מדוע תמונות ComfyUI שלי בעלות ניגודיות נמוכה או דהויות?
נסה VAE אחר, הורד CFG או החלף דוגמים. חלק מה-VAEs מייצרים צבע וניגודיות נאמנים יותר; התאמות קטנות יכולות לתקן תוצאות דהויות במהירות.