کو کیسے استعمال کریں: ابتدائی افراد کے لیے ایک عملی، مرحلہ وار گائیڈ
اگر آپ نے سنا ہے کہ "نوڈ پر مبنی اور انتہائی طاقتور" ہے لیکن تمام خانوں اور تاروں سے خوفزدہ محسوس کیا ہے، تو آپ اکیلے نہیں ہیں۔ اچھی خبر یہ ہے: ایک بار جب آپ چند بنیادی تصورات سیکھ لیتے ہیں—چیک پوائنٹس، انکوڈرز، سیمپلرز اور ڈیکوڈرز—تو آپ ایک پیشہ ور کی طرح امیج ورک فلو بنا رہے ہوں گے۔ یہ عملی گائیڈ آپ کو کو انسٹالیشن سے لے کر آپ کی پہلی تصاویر تک استعمال کرنے کا طریقہ بتاتی ہے، اس کے علاوہ ، s اور معیار/کارکردگی ٹیوننگ کے لیے ورک فلو بھی شامل ہیں۔
آخر تک، آپ بالکل جان جائیں گے کہ کو مستقل، دہرائی جانے والی، اور لچکدار امیج جنریشن بنانے کے لیے بغیر کسی اندازے کے کیسے استعمال کیا جائے۔
کیا ہے اور اسے کیوں استعمال کریں؟
اسٹیبل ڈیفیوژن کے لیے ایک بصری، نوڈ پر مبنی انٹرفیس ہے جو آپ کو اپنے امیج پائپ لائن کو مرحلہ وار ڈیزائن کرنے دیتا ہے۔ ایک واحد "جنریٹ" بٹن کے بجائے، آپ نوڈس کو جوڑتے ہیں—ہر ایک ایک مخصوص کام کو سنبھالتا ہے جیسے کہ ماڈل لوڈ کرنا، ٹیکسٹ کو انکوڈ کرنا، لیٹنٹس کو سیمپل کرنا یا حتمی امیج کو ڈی کوڈ کرنا۔ یہ تیز، ماڈیولر اور شفاف ہے—سیکھنے، تجربات اور پروڈکشن ورک فلو کے لیے بہترین ہے۔
فوری شروعات: انسٹال اور لانچ کریں
- Windows/macOS/Linux: آفیشل ریپو اور کمیونٹی انسٹالیشن گائیڈز پر عمل کریں۔ آپ اپنے پلیٹ فارم اور کے لحاظ سے دستی انسٹالیشن (Python + dependencies) یا پیکجڈ طریقے استعمال کر سکتے ہیں۔ وکی Windows، macOS (بشمول Apple Silicon) اور Linux کے لیے مرحلہ وار سیٹ اپ فراہم کرتا ہے۔
- ماڈلز: اپنے اسٹیبل ڈیفیوژن چیک پوائنٹس (مثال کے طور پر،
ControlNet بیس/ریفائنر یا ControlNet 1.5) کو ControlNet فولڈر میں رکھیں۔ models/vae میں ControlNet فائلیں، LoRA میں LoRAs، models/controlnet میں ControlNet ماڈلز ڈالیں۔
- لانچ: اپنے کے لیے اسٹارٹ اسکرپٹ چلائیں؛ آپ کے براؤزر میں کھل جائے گا۔ کینوس وہ جگہ ہے جہاں آپ نوڈس کو ایک ساتھ جوڑیں گے۔
ٹپ: بہترین کارکردگی کے لیے اپنے ڈرائیورز اور ٹول کٹ کو اپ ٹو ڈیٹ رکھیں۔
بنیادی تصور: کم سے کم ٹیکسٹ ٹو امیج ورک فلو
کا بنیادی ٹیکسٹ ٹو امیج فلو ( 1.5 اسٹائل) اس طرح نظر آتا ہے:
- آؤٹ پٹ: رہنمائی کے لیے کنڈیشنگ ایمبیڈنگز
- ان پٹس: ، مثبت/منفی کنڈیشنگ، سیڈ، سٹیپس، سیمپلر (مثال کے طور پر، )، اور اسکیل
یہ بنیادی گراف—چیک پوائنٹ → (مثبت/منفی) → → ڈی کوڈ → محفوظ کریں— میں تقریباً ہر چیز کی بنیاد ہے جو آپ کریں گے۔
ورک فلو: بیس + (اختیاری) ریفائنر
دوہری ٹیکسٹ انکوڈرز استعمال کرتا ہے اور اکثر ریفائنر پاس سے فائدہ اٹھاتا ہے۔
- بیس لوڈ کریں: کے موافق چیک پوائنٹ استعمال کریں۔ بہت سے ٹیمپلیٹس میں دو انکوڈرز (بڑے/چھوٹے سیاق و سباق کے لیے) شامل ہیں۔ مثبت اور منفی دونوں پرامپٹس فیڈ کریں۔
- (بیس): 1024×1024 (یا اپنے ہدف) پر لیٹنٹس تیار کریں۔ لیٹنٹس یا ڈی کوڈ شدہ تصاویر محفوظ کریں۔
- اختیاری ریفائنر: ریفائنر چیک پوائنٹ لوڈ کریں اور بیس آؤٹ پٹ پر مشروط ایک اضافی پاس چلائیں، پھر سے ڈی کوڈ کریں۔
یہ دو مرحلوں والا عمل اعلیٰ ریزولوشنز پر تفصیل اور ہم آہنگی کو نمایاں طور پر بہتر بنا سکتا ہے۔
عملی: اپنا پہلا گراف بنائیں
- ٹیمپلیٹ سے شروع کریں: سائیڈ بار میں، بلٹ ان ٹیکسٹ ٹو امیج مثال لوڈ کریں۔
- چیک پوائنٹ تبدیل کریں: اپنا یا 1.5 ماڈل منتخب کریں۔
- اپنا پرامپٹ لکھیں: مثبت اور منفی نوڈس استعمال کریں۔ مثال:
- مثبت: "سینیمیٹک پورٹریٹ، نرم اسٹوڈیو لائٹنگ، 85 ملی میٹر لینس، انتہائی تفصیلی، فلم گرین"
- منفی: "دھندلا، کم ریزولوشن، مسخ شدہ، اضافی انگلیاں، واٹر مارک"
- سٹیپس: رفتار/معیار کے توازن کے لیے 20–35
- سیمپلر: (قابل اعتماد) یا (تیز)
- : 4.5–7.5 (زیادہ پرامپٹ کو زیادہ زور سے دھکیلتا ہے، لیکن زیادہ سیر کر سکتا ہے)
- سیڈ: دوبارہ پیدا کرنے کی صلاحیت کے لیے اسے ٹھیک کریں؛ دریافت کے لیے مختلف کریں۔
- ریزولوشن: 1.5 کے لیے، 512×512 یا 768×768 پر شروع کریں۔ کے لیے، 1024×1024 اچھی طرح کام کرتا ہے۔
- ڈی کوڈ اور محفوظ کریں: ڈی کوڈ → امیج محفوظ کریں شامل کریں۔ جنریٹ کرنے کے لیے کیو پرامپٹ پر کلک کریں۔
اہم نوڈس کو سمجھنا (آسان زبان میں)
- چیک پوائنٹ لوڈر: آپ کے ڈیفیوژن ماڈل ()، ٹیکسٹ انکوڈر(ز) () اور کو لوڈ کرتا ہے۔ اسے اپنے "انجن + لینگویج برین + امیج ٹرانسلیٹر" کے طور پر سوچیں۔
- ٹیکسٹ انکوڈ: آپ کے پرامپٹ کو عددی ایمبیڈنگز میں تبدیل کرتا ہے جسے ماڈل سمجھتا ہے۔ مثبت اور منفی دونوں ٹیکسٹ انکوڈرز استعمال کریں۔
- : امیج سنتھیسس کا دل۔ یہ آپ کے پرامپٹ اور سیمپلر طریقہ کی رہنمائی میں لیٹنٹ شور کو متعدد مراحل میں ختم کرتا ہے۔
- ڈی کوڈ: حتمی لیٹنٹس کو دیکھنے کے قابل امیج میں تبدیل کرتا ہے۔ s کو تبدیل کرنے سے رنگ/کنٹراسٹ کی وفاداری بدل جاتی ہے۔
- امیج محفوظ کریں: میٹا ڈیٹا کے ساتھ آؤٹ پٹ کو ڈسک پر لکھتا ہے تاکہ آپ بعد میں نتائج دوبارہ بنا سکیں۔
ان بنیادی بلڈنگ بلاکس پر مزید گہرائی سے غوطہ لگانے کے لیے، ابتدائی دوستانہ بریک ڈاؤن اور نوڈ ایکسپلینرز دیکھیں۔
پاور اپس: , , اور امیج ٹو امیج
اسٹائل یا سبجیکٹ کنٹرول کے لیے استعمال کریں
- ایک لوڈر نوڈ شامل کریں اور اسے اپنے ماڈل برانچ سے جوڑیں۔
- طاقت: 0.6–0.8 کے آس پاس شروع کریں؛ اسٹائل کی شدت یا اوور فٹنگ کی بنیاد پر ایڈجسٹ کریں۔
- متعدد s: زنجیر یا ضم کریں، لیکن تنازعات سے بچیں؛ اسٹیک کرتے وقت طاقتیں کم کریں۔
درست کمپوزیشن کے لیے شامل کریں
- نوڈس آپ کو ان پٹ میپ (Canny، Depth، OpenPose وغیرہ) کا استعمال کرتے ہوئے کمپوزیشن کو چلانے دیتے ہیں۔
- عام فلو: ماڈل لوڈ کریں → اپنی گائیڈ امیج کو پہلے سے پروسیس کریں (مثال کے طور پر، Canny edge) → اپنے ٹیکسٹ کنڈیشنگ کے ساتھ کنڈیشنگ کو میں فیڈ کریں۔
- وزن: 0.5–1.2 ایک اچھی شروعات ہے۔ بہت زیادہ آپ کے پرامپٹ کو مغلوب کر سکتا ہے۔
امیج ٹو امیج یا ان پینٹنگ
- انکوڈ کے ذریعے ابتدائی شور کو امیج لیٹنٹ سے تبدیل کریں۔
- کنٹرول کرنے کے لیے میں ڈینوز کی طاقت کو ایڈجسٹ کریں کہ اصل امیج کا کتنا حصہ باقی ہے۔
- ان پینٹنگ کے لیے، ماسک ان پٹ اور ان پینٹ سے آگاہ سیمپلر پائپ لائن استعمال کریں۔
کوالٹی ٹیوننگ: پرامپٹس، ، سیمپلرز اور سیڈز
- پرامپٹ انجینئرنگ: پیراگراف نہیں، جامع ڈسکرپٹرز استعمال کریں۔ ترتیب وضاحت سے کم اہم ہے، لیکن اہم صفات کو سامنے رکھیں۔
- کم (3–5): زیادہ تخلیقی، کم پرامپٹ پر عمل درآمد
- اعلی (9–12): مضبوط عمل درآمد، آرٹفیکٹس بنا سکتا ہے
- : تیز اور اظہاری، پیش نظارہ کے لیے بہترین
- / / : جانچنے کے قابل؛ نتائج ماڈل کے لحاظ سے مختلف ہوتے ہیں۔
- فکسڈ سیڈ = دوبارہ پیدا کرنے کے قابل نتائج
- مختلف سیڈ = تنوع دریافت کریں
ہموار رینڈرز کے لیے کارکردگی کے نکات
- بجٹنگ: اگر آپ تک پہنچ جاتے ہیں تو ریزولوشن، سٹیپس یا بیچ سائز کم کریں۔ 1024×1024 پر کو نوڈس کے لحاظ سے 8–12 کی ضرورت پڑ سکتی ہے۔
- نصف درستگی: جہاں تعاون یافتہ ہو وہاں کو تھوڑی بہت معیار کے نقصان کے ساتھ بڑی میموری کی بچت کے لیے فعال کریں۔
- ٹائلنگ اور لیٹنٹ اپ اسکیلرز: چھوٹا تیار کریں، پھر لیٹنٹ اپ اسکیلر نوڈ یا امیج اپ اسکیلر ماڈل کے ذریعے کو بچانے کے لیے اپ اسکیل کریں۔
- کیشنگ: جب پرامپٹس تبدیل نہیں ہوتے ہیں تو انکوڈنگز اور ڈی کوڈ شدہ s کو متعدد رنز میں دوبارہ استعمال کریں۔
- غیر ضروری برانچوں سے بچیں: اضافی منقطع نوڈس پھر بھی میموری استعمال کرتے ہیں جب انہیں ایک ہی قطار میں عمل میں لایا جاتا ہے۔
پیشہ ور کی طرح ورک فلو کو منظم کرنا
- گروپ نوڈس: سیکشنز کو منظم کرنے کے لیے فریم/لیبل استعمال کریں (پرامپٹ، ماڈل، سیمپلر، آؤٹ پٹ وغیرہ)۔
- پیرامیٹر پینلز: آسان ٹیوننگ کے لیے اوپر "کنٹرول" نوڈس بنائیں (مثال کے طور پر، خالی پرامپٹ بکس، سلائیڈرز)۔
- محفوظ/اشتراک کریں: اپنے ورک فلو
استعمال شدہ ماڈلز کو ایکسپورٹ کریں اور دوبارہ پیدا کرنے کی صلاحیت کے لیے استعمال شدہ ماڈلز نوٹ رکھیں۔
- ورژننگ: 1.5، ، اور خصوصی پائپ لائنز (اینیمی، فوٹو ریئل، ڈیپتھ ٹو امیج وغیرہ) کے لیے الگ گراف رکھیں۔
عام مسائل کا ازالہ کرنا
- ڈینوز بہت کم (مثال کے طور پر، میں <0.2)
- ایک مختلف آزمائیں؛ کچھ s کنٹراسٹ کو نمایاں طور پر بہتر بناتے ہیں
- کم کریں یا سیمپلر تبدیل کریں
- متعدد رنز میں کچھ بھی نہیں بدلتا:
- سیڈ فکسڈ ہے؛ رینڈمائز فعال کریں یا ایک نیا سیڈ سیٹ کریں
- ریزولوشن، سٹیپس یا بیچ سائز کم کریں؛ پر سوئچ کریں
- دیگر ایپس بند کریں؛ / اسٹیکس کو آسان بنائیں
- فائل کے راستوں اور ماڈل فولڈرز کی تصدیق کریں؛ فائل ایکسٹینشنز کی تصدیق کریں
پہلے سے تیار کردہ ورک فلو کے ساتھ تیزی سے سیکھیں
ویڈیو واک تھرو اور ابتدائی سیریز آپ کے سیکھنے کے منحنی خطوط کو تیار کرنے کے لیے تیار گراف کے ساتھ تیز کر سکتی ہیں جنہیں آپ روک سکتے ہیں اور تجزیہ کر سکتے ہیں۔ تحریری ٹیوٹوریلز اور وکی نوڈ کی وضاحتیں اور تازہ ترین انسٹالیشن سٹیپس فراہم کرتے ہیں تاکہ آپ کو موجودہ رکھا جا سکے۔
اعلی درجے کی: اپنے گراف کو ماڈیولرائز اور توسیع دینا
- /بیرونی نوڈس: کچھ ٹیوٹوریلز کو خصوصی نوڈس کے ذریعے بیرونی سروسز سے جوڑنے کا احاطہ کرتے ہیں، جس سے ہائبرڈ پائپ لائنز اور بھاری کاموں کو آف لوڈ کیا جا سکتا ہے۔
- نوڈ لائبریریاں اور ایکسٹینشنز: شیڈیولرز، اپ اسکیلرز اور پری پروسیسنگ (پوز، ڈیپتھ، سیگمنٹیشن) کے لیے کمیونٹی نوڈس دریافت کریں۔ ہمیشہ اپنے ورژن کے ساتھ مطابقت کی جانچ کریں۔
- ریفائنرز اور زنجیر والے سیمپلرز: اسٹیجڈ ڈینوزنگ (بیس → ریفائنر) یا اسٹائلسٹک بلینڈنگ کے لیے متعدد سیمپلرز بھی چلائیں۔
قابل ذکر: Sider.AI کے ساتھ پرامپٹنگ کو تیز کرنا
اگر آپ اکثر پرامپٹس، ریفرنسز یا ڈسکرپشنز پر تکرار کرتے ہیں، تو آپ کو مختلف حالتوں پر غور و فکر کرنے اور بہتر بنانے کے لیے ایک سائیڈ کِک کی ضرورت پڑ سکتی ہے۔ ویسے، Sider.AI آپ کو تیزی سے منظم پرامپٹس تیار کرنے، منفی پرامپٹ لسٹیں تیار کرنے اور اپنے ورک فلو تجربات کا خلاصہ کرنے میں مدد کر سکتا ہے تاکہ آپ رنز کے درمیان ٹریک نہ کھویں۔ آپ اسے یہاں آزما سکتے ہیں: ایک سادہ سٹارٹر ورک فلو (اس پیٹرن کو کاپی کریں)
- ٹیکسٹ انکوڈ (مثبت) — "انتہائی تفصیلی پروڈکٹ فوٹو، سوفٹ باکس لائٹنگ، 50 ملی میٹر لینس، ریفلیکٹیو سرفیس"
- ٹیکسٹ انکوڈ (منفی) — "کم ریزولوشن، موشن بلر، واٹر مارک، بیک گراؤنڈ کلاٹر"
- : 1024×1024، 28 سٹیپس، ، 5.5، فکسڈ سیڈ
اختیاری ایڈ آنز:
- 10–15 سٹیپس پر ریفائنر چیک پوائنٹ کے ساتھ ریفائنر پاس
- لے آؤٹ کے لیے ایک سادہ آبجیکٹ سلہوٹ کے ساتھ (ڈیپتھ)
- ایک مخصوص برانڈ یا آرٹ اسٹائل کے لیے 0.6 پر
اہم باتیں
- کی طاقت اس کی شفافیت سے آتی ہے—اپنے پائپ لائن کو نوڈ بہ نوڈ بنائیں۔
- بنیادی ٹیکسٹ ٹو امیج چین آسان ہے: چیک پوائنٹ → (مثبت/منفی) → → ڈی کوڈ → محفوظ کریں۔
- دوہری انکوڈرز اور تفصیل کے لیے ایک اختیاری ریفائنر پاس سے فائدہ اٹھاتا ہے۔
- s اور آپ کو اسٹائل کنٹرول اور کمپوزیشن کی درستگی دیتے ہیں۔
- معیار اور مستقل مزاجی کے لیے ، سیمپلر اور سیڈ کو ٹیون کریں؛ اور سمجھدار ریزولوشنز کے ساتھ کا نظم کریں۔
- آسان تکرار کے لیے ورک فلو کو منظم کریں اور ان کا ورژن بنائیں۔
اگلے اقدامات
- ریپو/وکی ہدایات پر عمل کرتے ہوئے انسٹال کریں اور ایک نمونہ ورک فلو لانچ کریں۔
- بنیادی باتوں کو مضبوط کرنے کے لیے کم سے کم زنجیر کو شروع سے دوبارہ بنائیں۔
- اور ایک شامل کریں، پھر ٹیسٹ سیمپلر اور ترتیبات کریں۔
- ماڈلز، سیڈز اور پیرامیٹرز پر نوٹس کے ساتھ اپنے ورک فلو کو محفوظ اور شیئر کریں۔
مبارک ہو جنریٹ کریں—اور کی پرسکون، قابل کنٹرول دنیا میں خوش آمدید۔
عمومی سوالات
سوال 1: میں ، یا پر کو کیسے انسٹال اور چلاؤں؟
پلیٹ فارم کے مخصوص مراحل، ماڈل فولڈر کے مقامات اور انحصار کے لیے آفیشل ریپو اور کمیونٹی وکی پر عمل کریں۔ انسٹالیشن کے بعد، مقامی سرور لانچ کریں اور نوڈس کو وائرنگ شروع کرنے کے لیے اپنے براؤزر میں کھولیں۔
سوال 2: ٹیکسٹ ٹو امیج کے لیے سب سے آسان ورک فلو کیا ہے؟
ایک چیک پوائنٹ لوڈ کریں، کے ساتھ مثبت اور منفی پرامپٹس انکوڈ کریں، ایک چلائیں، سے ڈی کوڈ کریں، پھر امیج محفوظ کریں۔ یہ زنجیر کو زیادہ تر جنریشنز کے لیے مؤثر طریقے سے استعمال کرنے کی بنیاد ہے۔
سوال 3: میں میں کو کیسے استعمال کروں؟
دوہری ٹیکسٹ انکوڈرز کے ساتھ ایک چیک پوائنٹ استعمال کریں، پھر بہتر تفصیل کے لیے اختیاری طور پر ایک ریفائنر پاس شامل کریں۔ متوازن (تقریباً 5–7) اور ایک موثر سیمپلر جیسے کے ساتھ 1024×1024 پر چلائیں۔
سوال 4: کیا میں ایک ہی ورک فلو میں اور شامل کر سکتا ہوں؟
ہاں۔ اپنے اور نوڈس لوڈ کریں، انہیں ماڈل اور کنڈیشننگز سے جوڑیں، اور وزن کو ٹیون کریں (مثال کے طور پر، کے لیے 0.6–0.8، کے لیے ~0.5–1.2)۔ کے استعمال پر نظر رکھیں اور اگر آپ تک پہنچ جاتے ہیں تو ریزولوشن یا سٹیپس کو کم کریں۔
سوال 5: میری تصاویر کم کنٹراسٹ یا دھلی ہوئی کیوں ہیں؟
ایک مختلف آزمائیں، کم کریں، یا سیمپلرز کو تبدیل کریں۔ کچھ s زیادہ وفادار رنگ اور کنٹراسٹ تیار کرتے ہیں۔ چھوٹی ایڈجسٹمنٹس دھلے ہوئے نتائج کو جلدی ٹھیک کر سکتی ہیں۔