ક્યારેય કોઈ AIને “સુવર્ણ કલાકમાં લાલ ઇંટની દિવાલ પર ઝૂકેલી વિન્ટેજ સાયકલ” દોરવાનું કહેવાનો પ્રયાસ કર્યો છે, અને પરિણામ લાવાના દીવામાં પીગળી ગયેલી ટ્રાઇસિકલ જેવું દેખાય છે? મારી સાથે પણ એવું જ થયું. ત્યારે જ સ્ટેબલ ડિફ્યુઝન XL—જેને સામાન્ય રીતે SDXL તરીકે સંક્ષિપ્ત કરવામાં આવે છે—આર્ટ ક્લાસમાં નવા છોકરાની જેમ આવ્યું, જે, હા, ખરેખર જાણે છે કે સાયકલ કેવી દેખાય છે.
આ SDXL સમીક્ષામાં, હું તમને SDXL શું છે, તે ક્લાસિક સ્ટેબલ ડિફ્યુઝન અનુભવને કેવી રીતે અપગ્રેડ કરે છે, તમને કયું હાર્ડવેર જોઈશે, તમારા મગજમાં રહેલા દેખાવ તરફ તેને કેવી રીતે દોરવું અને તે હજી પણ ક્યાં તેની દોરીઓમાં અટવાય છે તેના વિશે જણાવીશ. આ દરમિયાન, હું તમને બતાવીશ કે વાસ્તવિક લોકો—ડિઝાઇનર્સ, માર્કેટર્સ, શોખીનો—ફોટોરિયલ છબીઓ, સ્વચ્છ ટાઇપોગ્રાફી અને એવી શૈલીઓ માટે તેનો ઉપયોગ કેવી રીતે કરી રહ્યા છે જે પહેલાં મોંઘી સ્ટોક સાઇટ્સ અને પરફેક્શનિસ્ટ ચિત્રકારોનું ક્ષેત્ર હતું.
SDXL શું છે—અને તમારે શા માટે તેની કાળજી લેવી જોઈએ?
સ્ટેબલ ડિફ્યુઝનને 'એન્જિન' તરીકે વિચારો જે તમારા ટેક્સ્ટ પ્રોમ્પ્ટ્સને છબીઓમાં ફેરવે છે. SDXL એ નવીનતમ મુખ્ય એન્જિન અપગ્રેડ છે: વધુ સિલિન્ડરો, વધુ સારું સસ્પેન્શન, વધુ સારો આંતરિક ભાગ. જ્યાં પહેલાનાં સ્ટેબલ ડિફ્યુઝન મોડેલ્સ (જેમ કે 1.5) તોફાની પણ અવ્યવસ્થિત હતાં, SDXL મોટું, શાંત અને નાની વિગતો—આંગળીઓ, આંખો, પ્રકાશ, ફેબ્રિક ટેક્સચર—માટે ઘણું સારું છે. તમે 'એક જ બારીથી પ્રકાશિત ઉદાસીન પોટ્રેટ' માટે પૂછી શકો છો અને તમને ખરેખર એક ઉદાસીન પોટ્રેટ મળે છે જે એક જ બારીથી પ્રકાશિત હોય છે, ડિસ્કો બોલ નહીં.
સાદી ભાષામાં: SDXL ઉચ્ચ-રિઝોલ્યુશન, વધુ સુસંગત છબીઓ ઓછા પ્રોમ્પ્ટ જિમ્નેસ્ટિક્સ સાથે બનાવે છે. તમારે પ્રોમ્પ્ટ-ઇઝમાં પીએચડીની જરૂર નથી.
આ કોના માટે છે?
- સર્જકો જેઓ દિવાલવાળા બગીચાના સબ્સ્ક્રિપ્શન વિના ફોટોરિયલ છબીઓ ઇચ્છે છે.
- માર્કેટર્સ જેમને બ્રાન્ડ-સલામત, સુસંગત વિઝ્યુઅલ્સની જરૂર છે.
- ઇન્ડી ગેમ ડેવલપર્સ જેઓ કન્સેપ્ટ આર્ટની ઝંખના કરે છે જે ખરેખર બ્રીફ સાથે મેળ ખાય છે.
- દરેક દિવસના ટિંકરર્સ જેઓ ફક્ત એટલું જ ઇચ્છે છે કે ડ્રેગનને યોગ્ય સંખ્યામાં પાંખો હોય.
SDXL વિ. જૂની વસ્તુઓ: શું બદલાયું?
અપગ્રેડેડ મગજ: SDXLનું આર્કિટેક્ચર મોટું અને વધુ અભિવ્યક્ત છે, જે ક્રિસ્પ ટેક્સચર, વિશ્વાસપાત્ર લાઇટિંગ અને ઓછી અતિવાસ્તવ શરીરરચનાની ભૂલોમાં ચૂકવણી કરે છે.
ઉચ્ચ મૂળ રિઝોલ્યુશન: SDXL મોટા કદમાં આરામદાયક છે. તમે પ્રિન્ટ-રેડી છબીઓ મેળવવા માટે અપસ્કેલર્સ અથવા પેચવર્ક વર્કફ્લો પર એટલો આધાર રાખતા નથી.
સ્વચ્છ ટેક્સ્ટ રેન્ડરિંગ: અગાઉના મોડેલોએ ટાઇપોગ્રાફીને આધુનિક કલા તરીકે ગણી હતી. SDXL વાંચી શકાય તેવા અક્ષરો અને લોગો માટે ઘણું સારું છે—હજી સંપૂર્ણ નથી, પરંતુ નાટ્યાત્મક રીતે સુધર્યું છે.
શૈલી શ્રેણી: SDXL પેઇન્ટરલી, ફોટોરિયલ, સિનેમેટિક અને ગ્રાફિક દેખાવને ઓછા પ્રોમ્પ્ટ એક્રોબેટિક્સ સાથે હેન્ડલ કરે છે. તમે ચોક્કસ હોઈ શકો છો અથવા તેને હળવાશથી રાખી શકો છો.
ઝડપી એલિવેટર પિચ: જો સ્ટેબલ ડિફ્યુઝન 1.5 સ્ક્રેપી ઇન્ડી હતું, તો SDXL સ્ટુડિયો રિલીઝ છે—વધુ પોલિશ, ઓછી તીક્ષ્ણ ધાર.
તમારા વાળ ખેંચ્યા વિના SDXL કેવી રીતે ચલાવવું
- સૌથી સરળ માર્ગ: હોસ્ટેડ સેવાનો ઉપયોગ કરો. તમે સેટઅપ, ડ્રાઇવરો અને GPU ઝઘડાને ટાળો છો. પરંતુ તમે ગોપનીયતા અને નિયંત્રણનો વેપાર કરો છો, અને તમે છબી દીઠ ચૂકવણી કરી શકો છો.
- DIY માર્ગ: મૈત્રીપૂર્ણ UI (જેમ કે વેબ ઇન્ટરફેસ) સાથે સ્થાનિક રીતે ચલાવો. પ્રો: તમે તમારા મોડેલો, ગોપનીયતા અને ખર્ચને નિયંત્રિત કરો છો. વિપક્ષ: તમારે યોગ્ય VRAM સાથે GPUની જરૂર પડશે.
હાર્ડવેર રિયાલિટી ચેક
- સ્વીટ સ્પોટ GPU: 12 GB અથવા વધુ VRAM સારી ઝડપે SDXL માટે આરામદાયક છે. જો તમારી પાસે 8 GB છે, તો તે હજી પણ ચાલશે—ફક્ત ધીમી પેઢી અને નાના બેચની અપેક્ષા રાખો.
- CPUs ઓછી મહત્વપૂર્ણ છે: SDXL એ GPU-બાઉન્ડ છે. તમારું ગ્રાફિક્સ કાર્ડ સ્ટાર છે.
- RAM અને સ્ટોરેજ: 16 GB સિસ્ટમ RAM અને મોડેલો, LoRAs અને આઉટપુટ્સ માટે થોડાક ડઝન ગીગાબાઇટ્સ તમને સ્વસ્થ રાખશે.
તમારા GPU, બેચ સાઈઝ અને સેમ્પલર સેટિંગ્સના આધારે ઝડપની અપેક્ષાઓ જંગલી રીતે બદલાય છે. જો તમે સાધારણ કાર્ડ પર હોવ, તો સ્માર્ટ કામ કરો: નાનું રેન્ડર કરો, પછી અપસ્કેલ કરો; બેચ સાઈઝ ઓછી રાખો; અને કાર્યક્ષમ સેમ્પલર્સ અજમાવો.
એક મૈત્રીપૂર્ણ પ્રવાસ: તમારી પ્રથમ મહાન SDXL છબી
- સરળ શરૂઆત કરો. આનો પ્રયાસ કરો: '30 વર્ષની સ્ત્રીનું સિનેમેટિક પોટ્રેટ, કુદરતી પ્રકાશ, ફિલ્ડની છીછરી ઊંડાઈ, Fujifilm ફિલ્મ સ્ટોક, 85mm લેન્સ, ફ્રીકલ્સ, સોફ્ટ સ્મિત'.
- તે શા માટે કામ કરે છે: ચોક્કસ કેમેરા ભાષા વિષયને વધુ પડતો સંયમિત કર્યા વિના દેખાવ પર લોક કરવામાં SDXLને મદદ કરે છે.
- નકારાત્મક સાથે ગાર્ડ્રેઇલ ઉમેરો: 'વિકૃત હાથ, વધારાની આંગળીઓ, વોટરમાર્ક, ટેક્સ્ટ, અસ્પષ્ટ, લો-રેસ'.
- નકારાત્મકને દરવાજા પરના બાઉન્સર તરીકે વિચારો, જે મુશ્કેલી સર્જનારાઓને બહાર રાખે છે.
- એક સેમ્પલર અને પગલાં પસંદ કરો. 25-35 પગલાં પર આધુનિક સેમ્પલરથી શરૂઆત કરો. જો તમને વાઇબ ગમતી ન હોય, તો 100 પર સ્ટેપ્સ ક્રેન્ક કરતા પહેલા સેમ્પલર બદલો. તે રસોઇયાને બદલવા જેવું છે, માત્ર વધુ મીઠું માંગવા જેવું નથી.
- બીજ ચક્ર. જો તમે નજીક-પરંતુ-સંપૂર્ણ ન હોવ, તો તમારા બીજને ઠીક કરો અને પ્રોમ્પ્ટ શબ્દો પર પુનરાવર્તન કરો. જો બધું બંધ હોય, તો બીજ બદલો. બીજ એ 'વૈકલ્પિક બ્રહ્માંડ' સ્વીચ છે.
- બુદ્ધિપૂર્વક અપસ્કેલ કરો. જો તમને પ્રિન્ટ ક્વોલિટીની જરૂર હોય, તો પહેલા આરામદાયક કદ પર જનરેટ કરો, પછી સમર્પિત અપસ્કેલરનો ઉપયોગ કરો. વિશાળ પ્રારંભિક રેન્ડરિંગને દબાણ કરવા કરતાં તે ઘણીવાર ઝડપી અને સ્વચ્છ હોય છે.
પ્રોમ્પ્ટ જુડો: તમે જે કહેવા માગો છો તે SDXL પાસે કરાવો
- લુક-આધારિત ભાષાનો ઉપયોગ કરો: 'બેકલાઇટ,' 'રિમ લાઇટ,' 'ઓવરકાસ્ટ,' 'ક્લેમશેલ લાઇટિંગ,' 'portra 400,' '35mm ગ્રેઇન'. SDXL હવાદાર વિશેષણો કરતાં ફોટોગ્રાફિક શબ્દભંડોળને વધુ સારી રીતે પ્રતિસાદ આપે છે.
- એક સમયે એક શૈલી: 'વોટરકલર, ઓઇલ પેઇન્ટિંગ, પિક્સર, સાયબરપંક નોઇર, સ્ટેઇન્ડ ગ્લાસ' ને એકસાથે મેશ કરશો નહીં. એક ગલી પસંદ કરો, પછી શુદ્ધ કરો.
- સંદર્ભ છબીઓ: જ્યારે ઉપલબ્ધ હોય, ત્યારે છબી-કન્ડિશનિંગ સોનામાં તેનું વજન કરવા યોગ્ય છે. ફોટો અથવા સ્કેચ 50 વિશેષણો કરતાં વધુ શૈલીનું સંચાર કરે છે.
- હળવું વજન: જો તમારું UI પ્રોમ્પ્ટ વેઇટિંગને મંજૂરી આપે છે, તો નજ કરો, હથોડી ન મારો. વધારે વજન વિચિત્ર કલાકૃતિઓનું કારણ બની શકે છે.
જ્યાં SDXL ચમકે છે
- ફોટોરિયલ પોટ્રેટ્સ: ત્વચાનું ટેક્સચર, કેચલાઇટ્સ, વાળની વિગત—'અજીબોગરીબ ખીણ' ટ્રીપ હેઝાર્ડને સેન્ડ કરવામાં આવ્યું છે.
- પ્રોડક્ટ શોટ્સ: સ્વચ્છ ધાર, વિશ્વાસપાત્ર સામગ્રી, સુસંગત લાઇટિંગ. મોકઅપ્સ અને કન્સેપ્ટ બોર્ડ્સ માટે સરસ.
- પર્યાવરણો: આર્કિટેક્ચરલ બાહ્ય ભાગો, ઉદાસીન આંતરિક ભાગો, ધુમ્મસવાળા જંગલો—SDXL તમારા લાઇટિંગ ક્યૂઝને સારી રીતે વાંચે છે.
- ગ્રાફિક ડિઝાઇન અને પ્રકાર: જૂના મોડેલો કરતાં વધુ સારા લેટરફોર્મ, જે પોસ્ટર-શૈલીની છબીઓ અને થંબનેલ્સ માટે દરવાજા ખોલે છે. તેમ છતાં, ટેક્સ્ટ-હેવી ડિઝાઇન્સને ડબલ-ચેક કરો.
જ્યાં SDXL હજી પણ ફેસ-પ્લાન્ટ કરે છે
- મુશ્કેલ પોઝમાં જટિલ હાથ: સુધારો, હા. પરંતુ જો તમને સંપૂર્ણ આંગળીઓ સાથે વાયોલિનવાદકની મિડ-સોલોની જરૂર હોય, તો પુનઃ પ્રયાસો અથવા લાઇટ Photoshop પાસની અપેક્ષા રાખો.
- ચુસ્ત ટાઇપોગ્રાફી: ટૂંકા શબ્દો કામ કરે છે. લાંબા, ચોક્કસ પ્રકારના લેઆઉટ? ત્યારબાદ વાસ્તવિક ટેક્સ્ટ કમ્પોઝ કરવાનું વિચારો.
- અલ્ટ્રા-સ્પેસિફિક IP મિમિક્રી: તમામ જવાબદાર મોડેલો અને પ્લેટફોર્મની જેમ, તમારે કૉપિરાઇટ કરેલા અક્ષરો અથવા લોગો પર ચાલતા પ્રોમ્પ્ટ્સને ટાળવા જોઈએ. શૈલી 'દ્વારા પ્રેરિત', 'સમાન' નહીં.
ક્ષેત્ર સામે SDXL
- સ્ટેબલ ડિફ્યુઝન 1.5 ની સરખામણીમાં: SDXL વાસ્તવિકતા, વિગત અને ઓછા પ્રોમ્પ્ટ હેક્સ પર જીતે છે. 1.5 પાસે હજી પણ ફાઇન-ટ્યુન્ડ શૈલીઓનું વિશાળ ઇકોસિસ્ટમ છે જે કેટલાક લોકોને ગમે છે. જો તમારી પાસે મનપસંદ 1.5 LoRA હોય, તો તેને હાથમાં રાખો.
- બંધ મોડેલોની સરખામણીમાં: ચોક્કસ હોસ્ટેડ પ્લેટફોર્મ્સ સાથે, તમને કેટલીકવાર ઝડપી, સુંદર ડિફૉલ્ટ્સ મળશે, પરંતુ જો તમે ઘણી વાર પુનરાવર્તન કરો છો તો ઓછું નિયંત્રણ અને ઊંચા ખર્ચ. SDXLની મહાસત્તા ખુલ્લાપણું અને ટિંકરેબિલિટી છે.
વર્કફ્લો રેસિપી જેનો હું ખરેખર ઉપયોગ કરું છું
રેસિપી A: ફાસ્ટ કન્સેપ્ટ આર્ટ
- પ્રોમ્પ્ટ: 'ઉદાસીન સાયન્સ-ફાઇ કોરિડોર, વોલ્યુમેટ્રિક ધુમ્મસ, ટીલ/ઓરેન્જ, સિનેમેટિક, 24mm લેન્સ, લો એંગલ'.
- સેટિંગ્સ: 512x768, 20–25 પગલાં, બેચ 2, આધુનિક સેમ્પલર.
- પરિણામ: થોડી સેકંડમાં દિશા માટે પૂરતું સારું. જો મને કોઈ ગમે છે, તો 1024x1536 પર અપસ્કેલ કરો અને શુદ્ધ કરો.
રેસિપી B: ક્લીન પ્રોડક્ટ મોકઅપ
- પ્રોમ્પ્ટ: 'મેટ સ્ટોન પર મિનિમલિસ્ટ સ્કિનકેર બોટલ, સોફ્ટ વિન્ડો લાઇટ, સૂક્ષ્મ પડછાયાઓ, 3/4 એંગલ, ઉચ્ચ વિગત, સંપાદકીય ફોટોગ્રાફી'.
- સેટિંગ્સ: 768x768, 30 પગલાં, એકવાર તમે સારી સિલુએટને હિટ કરો પછી બીજ લોક કરો.
- પોલિશ: વિચિત્ર લેબલની ધારને ઠીક કરવા માટે માસ્કિંગ/ઇનપેઇન્ટ પાસનો ઉપયોગ કરો. જો ટેક્સ્ટ મહત્વપૂર્ણ હોય, તો પછી વાસ્તવિક ટેક્સ્ટ ઉમેરો.
રેસિપી C: લોકો જે લોકો જેવા દેખાય છે
- પ્રોમ્પ્ટ: 'કુદરતી પોટ્રેટ, ડેનિમ જેકેટમાં 50 વર્ષનો માણસ, સોફ્ટ સાઇડ-લાઇટ, છિદ્રો અને સૂક્ષ્મ ફ્રીકલ્સ, ફિલ્ડની છીછરી ઊંડાઈ, હવાદાર પૃષ્ઠભૂમિ'.
- સેટિંગ્સ: 768x1024, 28–32 પગલાં.
- કઠિન બિટ્સ: ચહેરાની નજીકના હાથ—ચુસ્ત પાક કરો અથવા ઇનપેઇન્ટ સુધારાઓ.
ફાઇન-ટ્યુન્સ, LoRAs અને શૈલી બફેટ
SDXLની ખુશીઓમાંની એક એ છે કે તે ફાઇન-ટ્યુન્ડ મોડેલ્સ અને LoRAs સાથે સુસંગત છે જે દેખાવમાં ડાયલ કરે છે—નિયોન સાયબરપંક, સંપાદકીય ફેશન, વોટરકલર, તમે તેનું નામ લો. ખાડાઓમાંથી એક ટીપ: LoRAsને મસાલા રેક્સની જેમ ગણો.
- તેમના વિના શરૂઆત કરો, એક બેઝલાઇન મેળવો.
- હળવા વજન (0.5–0.8) પર એક LoRA ઉમેરો. જો છબી પાટા પરથી ઉતરી જાય છે, તો તમારો મસાલો ખૂબ જ મજબૂત છે.
- બે LoRAs સરસ રમી શકે છે; ત્રણ અવ્યવસ્થિત થઈ શકે છે. સ્વાદ સાથે આગળ વધો.
સલામતી, નીતિશાસ્ત્ર અને પુખ્ત વયની વાત
- સંમતિ અને સમાનતાઓ: તેમની પરવાનગી વિના વાસ્તવિક લોકોને જનરેટ કરવાનું ટાળો.
- સંવેદનશીલ સામગ્રી: SDXL UIsમાં સામાન્ય રીતે સલામતી ફિલ્ટર્સનો સમાવેશ થાય છે—જો તમે વ્યાવસાયિક સંદર્ભમાં કામ કરી રહ્યા હોવ તો તેને ચાલુ રાખો.
- કૉપિરાઇટ: 'ની શૈલીમાં' એ કાનૂની અને નૈતિક ગૂંચવણ છે. મૂળ દેખાવ બનાવો, અથવા તમારી માલિકીની સંપત્તિઓ પર ખાનગી LoRAને તાલીમ આપો.
સમસ્યાનિવારણ સાઇડબાર્સ
- મારી છબીઓ મશ છે.
ઓછા વિશેષણો, સ્પષ્ટ લાઇટિંગ અને સરળ રચનાઓનો પ્રયાસ કરો. જો તમે પ્રારંભિક છબીમાંથી શુદ્ધ કરી રહ્યા હોવ તો ડિનોઇઝ શક્તિ ઘટાડો. પગલાં ક્રેન્ક કરતા પહેલા સેમ્પલર બદલો.
- તે મારી રચનાને અનુસરશે નહીં.
સંદર્ભ તરીકે પ્રારંભિક સ્કેચનો ઉપયોગ કરો, અથવા પોઝ અને લેઆઉટ માર્ગદર્શન માટે ઉપલબ્ધ હોય ત્યારે ControlNet-જેવા સાધનોનો પ્રયાસ કરો.
- ચહેરા મીણ જેવા લાગે છે.
ફોટોગ્રાફિક શબ્દો ('વિખરાયેલી વિન્ડો લાઇટ,' '35mm') પર ઝૂકો અને તમારી સ્મૂથિંગ/શક્તિ સેટિંગ્સને ઓછી કરો. જો તમારું UI તેને સમર્થન આપે તો અલગ ચહેરો પુનઃસ્થાપન મોડેલ અજમાવો.
- ટાઇપોગ્રાફી હજી પણ દુર્ગંધ મારે છે.
પૃષ્ઠભૂમિ કલા જનરેટ કરો, પછી ગ્રાફિક્સ એપ્લિકેશનમાં ટેક્સ્ટ ઉમેરો. ટૂંકા શબ્દો માટે, એક સમયે એક લાઇન પ્રોમ્પ્ટ કરો અને કમ્પોઝ કરો.
કિંમત: તે ખરેખર શું ખર્ચ કરે છે
- હોસ્ટેડ: તમે છબી દીઠ અથવા સબ્સ્ક્રિપ્શન ચૂકવો છો. હળવા ઉપયોગ માટે સરસ; જો તમે આખો દિવસ પુનરાવર્તન કરી રહ્યા હોવ તો મોંઘું.
- સ્થાનિક: અગાઉથી હાર્ડવેર, ચાલુ વીજળી. જો તમે ફળદ્રુપ છો, તો તે ઝડપથી સસ્તું થઈ જાય છે.
અહીં એક આશ્ચર્ય છે: Sider.AI તમારી પ્રોમ્પ્ટિંગ અને પુનરાવર્તન માટે કમાન્ડ સેન્ટરની જેમ વર્તે છે. તે પોતાની મેળે SDXL છબીઓ રેન્ડર કરશે નહીં, પરંતુ પ્રોમ્પ્ટ્સ ગોઠવવા, આઉટપુટ્સની તુલના કરવા અને પુનરાવર્તિત વર્કફ્લો બનાવવા માટે તે હાથવગું છે જે તમે ટીમના સાથીદારો સાથે શેર કરી શકો છો. મૂડ બોર્ડ્સ વિશે વિચારો જે ખરેખર પાછા વાત કરે છે. જો તમે બહુવિધ મોડેલ સેટિંગ્સ, LoRAs અને છબી સંદર્ભો સાથે કામ કરી રહ્યા છો, તો તે બધાને એક જ જગ્યાએ રાખવાથી તમને 'final-final-2-REALLY-final' નામના ફોલ્ડર્સમાં ખોદવાની વિધિથી બચાવે છે. વાસ્તવિક દુનિયાના મીની-કેસ સ્ટડીઝ
- બ્રાન્ડ રિફ્રેશ: એક નાની કોફી રોસ્ટરે SDXLમાં બેકગ્રાઉન્ડ્સ જનરેટ કરીને અને ટોચ પર વાસ્તવિક ટેક્સ્ટ મૂકીને નવા પેકેજિંગ વિઝ્યુઅલ્સ—બીન્સ, કપ, લેટ આર્ટ, ઓછામાં ઓછા પ્રકાર—ની મજાક ઉડાવી. ટીમે એક અઠવાડિયાને બદલે એક દિવસમાં પાંચ દિશાઓની શોધ કરી.
- ઇન્ડી ગેમ: બે વ્યક્તિના સ્ટુડિયોએ કન્સેપ્ટ સીન્સ અને કેરેક્ટર મૂડ શીટ્સ માટે SDXLનો ઉપયોગ કર્યો, પછી સુસંગત આર્મર મોટિફ્સ માટે હળવા વજનના LoRAને તાલીમ આપી. તેઓ કહે છે કે તેણે તેમના પ્રીપ્રોડક્શન સમયને અડધો કરી નાખ્યો.
- સર્જકના થંબનેલ હસ્ટલ: એક YouTuber SDXLમાં પ્રતિ વિડિયો ત્રણ થંબનેલ વિકલ્પો બનાવે છે: એક ફોટો-રિયલ, એક ઇલસ્ટ્રેટિવ, એક ગ્રાફિક. જ્યારે પ્રકાર મેન્યુઅલી ઉમેરવામાં આવ્યો અને પૃષ્ઠભૂમિ બોલ્ડ અને સરળ રહી ત્યારે ક્લિક-થ્રુ વધ્યા.
ચુકાદો
SDXL એ રોજિંદા સર્જકો માટે અત્યાર સુધીનું સૌથી ઉપયોગી ઓપન ઇમેજ મોડેલ છે જેઓ વધુ વાસ્તવિકતા, સ્વચ્છ વિગત અને ઓછા પ્રોમ્પ્ટ વૂડૂ ઇચ્છે છે. જ્યારે તમને ડેડલાઇન પર બેસ્પોક પરફેક્શનની જરૂર હોય ત્યારે તે વ્યાવસાયિક ફોટોગ્રાફર અથવા ચિત્રકારને બદલશે નહીં—પરંતુ તે તમને મિનિટોમાં 80% રસ્તે લઈ જશે, અને કેટલીકવાર 100% રસ્તે લઈ જશે જો તમે ધીરજ રાખશો અને નજ કરવા તૈયાર હોવ તો. જો તમે અગાઉના સ્ટેબલ ડિફ્યુઝન વર્ઝનથી દૂર થઈ ગયા છો કારણ કે તે ગંદા લાગતા હતા, તો SDXL એ તમારો 'ઓહ, આ ખરેખર કામ કરે છે' ક્ષણ હોઈ શકે છે.
ચીટ શીટ: સતત મહાન પરિણામો કેવી રીતે મેળવવા
- સ્વચ્છ, ફોટોગ્રાફી-શૈલીના પ્રોમ્પ્ટ્સથી પ્રારંભ કરો.
- સામાન્ય ગ્રેમલિન્સને ફિલ્ટર કરવા માટે નકારાત્મકનો ઉપયોગ કરો.
- તમને ગમતું સેમ્પલર પસંદ કરો; પગલાં વધારતા પહેલા તેને બદલો.
- સારા બીજને લોક કરો; નાની પ્રોમ્પ્ટ સંપાદનો સાથે પુનરાવર્તન કરો.
- પછી અપસ્કેલ કરો; વિશાળ પ્રારંભિક કદને બ્રુટ-ફોર્સ કરશો નહીં.
- કોઈપણ મહત્વપૂર્ણ વસ્તુ માટે પછીથી ટેક્સ્ટ ઉમેરો.
- LoRAsને હળવા અને થોડા રાખો.
- જ્યારે રચના મહત્વપૂર્ણ હોય ત્યારે સંદર્ભ છબીઓનો ઉપયોગ કરો.
- છબી સાથે સેટિંગ્સ સાચવો જેથી તમે જીતને પુનઃઉત્પાદિત કરી શકો.
એક છેલ્લી વાત...
AI આર્ટ જિનીને આદેશ આપવા જેવું લાગી શકે છે: ચોક્કસ ઇચ્છાઓ વધુ સારા પરિણામો મેળવે છે. SDXL જિનીને ઓછો શાબ્દિક અને વધુ પ્રતિભાશાળી બનાવે છે—પરંતુ તમે હજી પણ ડિરેક્ટર છો. જિજ્ઞાસુ બનો, વિવિધતાઓની ચકાસણી કરો અને તમારા શ્રેષ્ઠ પ્રોમ્પ્ટ્સને એવી જગ્યાએ રાખો જ્યાં તમે તેને ગુમાવશો નહીં. જ્યારે આવતા અઠવાડિયાનું 'final-final' આવે, ત્યારે તમને આનંદ થશે કે તમે કર્યું.
FAQ
Q1:જો હું પહેલાથી જ સ્ટેબલ ડિફ્યુઝન 1.5 નો ઉપયોગ કરું છું તો શું SDXL યોગ્ય છે?
હા—SDXL વાસ્તવિકતા, વિગત અને ટેક્સ્ટ હેન્ડલિંગમાં નોંધપાત્ર અપગ્રેડ છે, અને તેને ઓછા પ્રોમ્પ્ટ જિમ્નેસ્ટિક્સની જરૂર છે. ચોક્કસ વિશિષ્ટ શૈલીઓ માટે 1.5 આસપાસ રાખો, પરંતુ રોજિંદા છબી જનરેશન માટે, SDXL સંભવતઃ તમારું ડિફૉલ્ટ બની જશે.
Q2:SDXLને આરામથી ચલાવવા માટે મારે કયા GPUની જરૂર છે?
સરળ, ઝડપી SDXL જનરેશન માટે 12 GB VRAM સાથે GPU માટે લક્ષ્ય રાખો; 8 GB નાના બેચ અને કદ સાથે કામ કરી શકે છે. જો તમે હાર્ડવેર-મર્યાદિત હોવ, તો નાનું જનરેટ કરો અને પછી અપસ્કેલ કરો—તે ઝડપી અને ઘણીવાર સ્વચ્છ હોય છે.
Q3:SDXLને હાથ અને લાંબા ટેક્સ્ટ સાથે શા માટે સંઘર્ષ કરવો પડે છે?
મુશ્કેલ પોઝમાં શરીરરચના અને મલ્ટિ-લાઇન ટાઇપોગ્રાફી હજી પણ મુશ્કેલ સમસ્યાઓ છે. હાથ માટે ઇનપેઇન્ટિંગનો ઉપયોગ કરો અને શ્રેષ્ઠ પરિણામો માટે ડિઝાઇન એપ્લિકેશનમાં પછીથી લાંબો અથવા બ્રાન્ડ-ક્રિટિકલ ટેક્સ્ટ ઉમેરો.
Q4:હું SDXL છબીઓને વધુ ફોટોરિયલ કેવી રીતે બનાવી શકું?
ફોટોગ્રાફિક ભાષા—લાઇટિંગ, લેન્સ, ફિલ્મ સ્ટોક્સ—નો ઉપયોગ કરો અને પ્રોમ્પ્ટ્સને સંક્ષિપ્ત રાખો. લગભગ 25–35 પગલાં પર આધુનિક સેમ્પલર અજમાવો, જ્યારે તમે નજીક હોવ ત્યારે બીજને ઠીક કરો અને દેખાવને ખીલ્યા પછી અપસ્કેલ કરો.
Q5:Sider.AI SDXL વર્કફ્લોમાં ક્યાં બંધ બેસે છે?
Sider.AI તમને પ્રોમ્પ્ટ્સ ગોઠવવામાં, આઉટપુટ્સની તુલના કરવામાં અને પુનરાવર્તિત વર્કફ્લોને માળખું આપવામાં મદદ કરે છે જ્યારે તમે અન્યત્ર SDXL સાથે છબીઓ જનરેટ કરો છો. તે ટીમો અથવા સર્જકો માટે ઉત્તમ છે જેઓ પુનરાવર્તનો, સંદર્ભો અને સંસ્કરણ નિયંત્રણ સાથે કામ કરે છે.