መግቢያ: “ንግግር ላይ ነፃ፣ እንደ አስማት አይደለም” ችግር
ስለ ክፍት ምንጭ AI የምስል መሣሪያዎች ያለው ነገር ሁሉም ያለ የግርጌ ማስታወሻዎች ከሚያብረቀርቁ ማሳያዎች ውጤቶችን ይፈልጋል። ቲክቶኮችን አይተዋል፡ አንድ ቁልፍን ይጫኑ፣ ፎቶግራፍ የሚመስል ዘንዶ ሴሎ ሲጫወት ብቅ ይላል፣ እና በግልጽ “ነፃ” ነው። እንደ ቡችላ ነፃ። ወይም እንደ Home Depot የጣውላ ጋሪ ነፃ - አሁንም ቤቱን መገንባት አለብዎት።
ፈጣሪ ከሆኑ፣ ድምፁ የማይቋቋመው ነው፡ ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች፣ አካባቢያዊ ቁጥጥር፣ አስፈሪ የአገልግሎት ውል የግርጌ ማስታወሻዎች የሉም፣ እና የተዘጉ መድረኮች በሚያምር የተንሸራታች ስብስብ በስተጀርባ በጨዋነት የሚደብቁት አይነት ማስተካከያ። ግን እዚህ ላይ የሚያጠመድ ነገር አለ። ክፍት ምንጭ መሣሪያዎች ውድ እና ደደብ ነገሮችን እንዳያደርጉ የሚከለክል የምርት አስተዳዳሪ ይዘው አይመጡም። ከጠዋቱ 2 ሰዓት ላይ ኤስፕሬሶ በሚጠጡ እና እርስዎም PyTorch ከምንጩ ማጠናቀር እንደሚፈልጉ በእውነት ከሚያምኑ ሰዎች የተጻፉ Readme ፋይሎች ይዘው ይመጣሉ።
ስለዚህ ይህን በትክክል እንመዝነው። በጭብጨባ ሳይሆን በተስፋ መቁረጥ ስሜትም አይደለም። እዚህ ያለው ዓላማ ለፈጣሪዎች በእውነት የሚጠቅመውን በGitHub ኮከቦች ምሽት ላይ ከሚታየው መለየት ነው።
ለምን “ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች” የተሳሳተ ጥያቄ ነው (ግን አሁንም ጠቃሚ ነው)
ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች በሚያደርጉት ነገር ላይ የተመሠረተ ነው፡ ምሳሌ፣ የፎቶ አርትዖት፣ 3D፣ የፅንሰ-ሀሳብ ጥበብ፣ የአኒሜሽን ክፈፎች፣ የንድፍ ማስመሰያዎች ወይም ሙሉ የንብረት መስመሮች። አንድ ነጠላ “ምርጥ” ብሎ መጠየቅ ልክ እንደ ምርጥ ቢላዋ መጠየቅ ነው፡ የሼፍ ቢላዋ፣ የመላጫ ቢላዋ ወይም ቲማቲምን በማየት ብቻ የሚቆርጥ ጃፓናዊ ጂዩቶ? ብቸኛው ሐቀኛ መልስ “እንደ ሁኔታው ይወሰናል” የሚል ሲሆን ከዚያ በኋላ ትክክለኛ ጥቅሞችን እና ጉዳቶችን ማብራሪያ ይሰጣል።
ጠቃሚው ጥያቄ፡ የትኞቹ ክፍት ምንጭ መሣሪያዎች ፈጣሪዎች የሚያጋጥሟቸውን ዋና ዋና ስራዎች ይሸፍናሉ? እና የትኞቹ ወደ ጥገኝነት ገሃነም ከመጎተት ይልቅ ከመንገድ ይወጣሉ?
ጉዳዩ ያላቸው ስራዎች፣ የ buzzwords አይደሉም
- ፈጣን ሃሳብ ማመንጨት፡ ንድፍ ወደ ምስል፣ ጥያቄ ወደ ቅንብር፣ እና የቅጂ ቅጂ የማይመስሉ ልዩነቶች።
- ዝርዝር ቁጥጥር፡ መሸፈኛ፣ ውስጠ-ስዕል፣ ወጥ የሆነ ቁምፊ እና ዘይቤ፣ መቆጣጠር የሚቻል ጥልቀት እና አቀማመጥ።
- የፎቶግራፍ እውነታነት ከቅጥ አሰራር ጋር፡ አንድ ነጠላ ውበት መምረጥ እና ከእሱ ጋር መኖር የለብዎትም - ካልፈለጉ በስተቀር።
- አካባቢያዊ ግላዊነት እና ወጪ፡ በ GPUዎ ላይ ያሂዱ፣ በክሬዲት ካርድዎ ላይ አይደለም።
- የመስመር ዝርጋታ ወዳጃዊነት፡ ስክሪፕት ማድረግ የሚቻል፣ በራስ ሰር የሚሰራ እና CUDA አጠገብ ሲያስነጥሱ የማይሰበር።
ይህን ከግምት ውስጥ በማስገባት፣ ለፈጣሪዎች ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች በእውነቱ የሚያበሩበት ቦታ እዚህ አለ - እና በጣም የማይሰሩበት።
Stable Diffusion (SD 1.5, SDXL): አስተያየት ያለው የስራ ፈረስ
ክፍት ምንጭ AI የምስል ትውልድ ማስኮት ካለው፣ እሱ Stable Diffusion ነው። በእያንዳንዱ መለኪያ ላይ በጣም ሞቃታማው ሞዴል አይደለም፣ ነገር ግን ለመስራት የሚታይ እና የወጪ ሪፖርት የማያቀርብ። SD 1.5 ለአሁንም ለቅጥ በተሰራ ምሳሌ እና ጽንሰ-ሀሳብ ውስጥ በጣም ጠቃሚ ነው; SDXL የውሂብ ማዕከል ሳያስፈልግ የቅንብር እና የዝርዝር ጣሪያውን ከፍ ያደርገዋል።
ለምን ፈጣሪዎች ዙሪያውን ያስቀምጡታል:
- እስከ ጥፋት ድረስ ማስተካከል የሚቻል፡ የሞዴል ልዩነቶች፣ LoRA ጥሩ ማስተካከያዎች፣ ControlNet ሞጁሎች ለአቀማመጥ፣ ጥልቀት፣ ጠርዞች - በአጭሩ ለአቀማመጥ የማጭበርበሪያ ኮዶች።
- አካባቢያዊ-መጀመሪያ፡ በመካከለኛ ደረጃ GPU ላይ ማሄድ ይችላሉ። 8–12GB VRAM የሆነ ቦታ ያደርስዎታል; 24GB ደስ የሚል ያደርገዋል።
- የስነ-ምህዳር ስበት፡ ሁሉም መሳሪያዎች ከStable Diffusion ጋር ይዋሃዳሉ። ፍጹም ስለሆነ አይደለም፣ ነገር ግን በየቦታው ስላለ ነው።
የሚሰናከልበት ቦታ:
- የፎቶግራፍ እውነታ አለመጣጣም፡ እጆች ተሻሽለዋል፣ ከዚያ በቼክ ነጥቦች ላይ በመመስረት እንደገና እንግዳ ሆኑ።
- የጥያቄ ቮዱ፡ “ምርጥ ጥራት፣ ድንቅ ስራ” መስራት የለበትም ነገር ግን አንዳንድ ጊዜ ያደርገዋል። ያ ባህሪ አይደለም፣ አጉል እምነት ነው።
- ማዋቀር ትርፍ፡ “አንድ-ጠቅታ” ጫኝ ሁልጊዜ አንድ ጠቅታ እና 14 የአሽከርካሪዎች ማሻሻያ ነው።
እሱን ለመጠቀም ምርጡ መንገድ:
- SDXL ለሰፊ፣ የበለጸጉ ቅንብሮች እና ለህትመት ተስማሚ ዝርዝር።
- SD 1.5 ለቅጥ ስራ፣ ለአኒሜ እና ለፍጥነት።
- አቀማመጥ/ጥልቀት ለማግኘት ControlNetን ያክሉ። ለወጥ ቁምፊዎች ወይም የምርት ቅጦች LoRAዎችን ይጠቀሙ። የሞዴል መካነ አራዊትዎን ትንሽ ያድርጉት - እንክብካቤ ከመከማቸት ይበልጣል።
ComfyUI እና Automatic1111: ወደ ተመሳሳይ ተራራ ሁለት መንገዶች
ቀጥተኛ እንሁን፡ ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች ሞዴሎች ብቻ አይደሉም። አእምሮዎን እንዳያጡ የሚያደርጉ በይነገጾች ናቸው። የኮረብታው ሁለት ነገሥታት፡ ComfyUI እና Automatic1111።
Automatic1111 (A1111):
- ጥቅሞች፡ ትልልቅ ወዳጃዊ አዝራሮች፣ ብዙ ቅጥያዎች፣ ቀላል ጥያቄ ማስተካከል::
- Cons: ቀላል ይጀምራል፣ ሁሉንም ነገር ካነቁ ወደ ስዊስ ጦር Chainsaw ይቀየራል።
- ምርጥ ለ፡ የስርዓት ምህንድስና ዲግሪ የማይፈልግ GUI ፈጣን ድግግሞሽ ለሚፈልጉ ፈጣሪዎች።
ComfyUI:
- ጥቅሞች፡ Node-graph ቁጥጥር፣ ተደጋጋሚ መስመሮች፣ ሞዱል፣ ፈጣን። ስለ መቼቶች አመጣጥ የሚጨነቁ ከሆነ በጣም ጥሩ።
- Cons: የመጀመሪያው ግራፍዎ እንደ ሴራ ቦርድ ይመስላል። ሁለተኛው ግራፍዎም እንዲሁ ይሆናል።
- ምርጥ ለ፡ ተባዝቶ የሚሰራ ፍሰት፣ እና ከባድ ControlNet የዳንስ ትርኢት ለሚፈልጉ የኃይል ተጠቃሚዎች እና ቡድኖች።
ውሳኔ፡ አዲስ ከሆኑ፣ በAutomatic1111 ላይ ይጀምሩ። መስመር እየገነቡ ወይም እየተባበሩ ከሆነ፣ ወደ ComfyUI ይውጡ። “ምርጥ” የትዕዛዝ ዝርዝርዎን በመሳልዎ ላይ የተመሠረተ ነው።
Krita + Stable Diffusion ተሰኪዎች፡ ትክክለኛ የአርቲስት የስራ ፍሰት
Krita አዲስ አይደለም፣ ነገር ግን AIን ወደ ሰዓሊ የስራ ፍሰት የሚያስገባበት መንገድ ከብዙዎች በተሻለ ሁኔታ የተሻለ ነው። Inpainting ተፈጥሯዊ ስሜት አለው። ጭምብል መጨረሻ ላይ የሚታሰብ ነገር አይደለም። ንብርብሮችን፣ ብሩሾችን እና የእጅ መቆጣጠሪያን ያከብራል።
- ተስማሚው፡ ይህ “AI በእውነተኛ የስነ ጥበብ መተግበሪያ ውስጥ” ነው፣ “በድር ማሳያ ላይ የታሰረ ጥበብ” አይደለም።
- መያዣው፡ አሁንም የእርስዎ አካባቢያዊ SD ቁልል በተቀላጠፈ መስራት ያስፈልግዎታል። አንዴ ከተሰራ፣ Krita እና inpainting በመኪና ውስጥ ክላቹን እንደማግኘት ይሰማዎታል።
InvokeAI: ምክንያታዊው መሃል
InvokeAI በጣም ጮክ ብሎ ለመሆን አይሞክርም; የተረጋጋ ለመሆን ይሞክራል። ንጹህ UI፣ ጥሩ ነባሪዎች፣ ጠንካራ ውስጠ-ስዕል/ውጪ-ስዕል እና “models/Stable-diffusion” የሚባል አቃፊ ለ Stable Diffusion ወይም ለመረጋጋት የታሰበ እንደሆነ እንዳትጠይቁ የሚያደርግ ሞዴል አስተዳዳሪ። Automatic1111 የመንገድ ገበያ ከሆነ እና ComfyUI ላቦራቶሪ ከሆነ፣ InvokeAI ስቱዲዮው ነው።
- ምርጥ ለ፡ ጥቂት ሸካራ ጠርዞች እና ጥሩ ዶክመንቶች ያሉት የተረጋጋ፣ የሚደገፍ ክፍት ምንጭ መሣሪያ ለሚፈልጉ ፈጣሪዎች።
- ድክመት፡ አነስተኛ ተሰኪ አጽናፈ ሰማይ። ያ ባህሪ ሊሆን ይችላል።
ControlNet: ለቁጥጥር ፍሪክስ (ማለትም አርቲስቶች) ሚስጥራዊ መረቅ
ControlNet “AI የሚፈልገውን ያደርጋል” ሰበብ መሆን ያቆመበት ምክንያት ነው። በአንድ ጠርዝ ካርታ፣ ጥልቀት ካርታ፣ አቀማመጥ አጽም ወይም መደበኛ ካርታ ላይ ትውልድን ያስተካክሉ፣ እና በድንገት የፅንሰ-ሀሳብ ጥበብዎ ከባቢ ይልቅ መዋቅር ይኖረዋል።
- በእውነቱ አስፈላጊ የሆኑ የአጠቃቀም ጉዳዮች:
- ወጥ ለሆኑ ቁምፊዎች አቀማመጥ-ወደ-ምስል::
- ቅንብሩን ሳይበላሽ ለማቆየት ጥልቀት-ወደ-ምስል።
- ሞዴሉ ንድፍዎን ችላ ማለቱን እንዲያቆም Canny/Lineart።
- ማስጠንቀቂያ፡ ተጨማሪ ControlNets ሁልጊዜ የተሻሉ አይደሉም። አንድ ወይም ሁለት ጠንካራ ምልክቶች አምስት ቀላል ጥቆማዎችን ይመታሉ።
LoRA እና Textual Inversion: ያለ ክስ ዘይቤ
ሙሉ ጥሩ ማስተካከያዎች ከባድ ናቸው። LoRA የአጠቃላዩን ሞዴል አንጎል ሳይጽፉ ዘይቤን፣ ቁምፊን ወይም የምርት አውድ እንዲያስገቡ ያስችልዎታል። Textual inversion የኪስ ቢላዋ ስሪት ነው - ሞዴሉን ወደ እርስዎ መልክ የሚገፋፉ ትናንሽ የተማሩ ቶከኖች።
- ትንሽ አሰልጥኑ; እያንዳንዱ ምስል አንድ አይነት ፖስተር እስኪሆን ድረስ ከመጠን በላይ መግጠም በጣም ጥሩ ይመስላል።
- በተደጋጋሚ የሚያስፈልጓቸውን ቁምፊዎች እና ብራንዶች ቤተ-መጽሐፍት ያስቀምጡ።
- የመማሪያ ፍጥነቶችዎን እና ደረጃዎችዎን ይመዝግቡ, አለበለዚያ በየወሩ ስህተቶችዎን እንደገና ይፈጥራሉ.
Upscalers: ESRGAN, 4x-UltraSharp, እና “በቂ እውን ይመስላል” ፈተና
AI upscaling ያልተዘመረለት ጀግና ነው። ጥሩ 2x ወይም 4x ማለፊያ የተፈጠረ ምስልን የሚሰጥ እንግዳ የሆነውን ብዥታ ማስተካከል ይችላል።
- ESRGAN እና Real-ESRGAN ልዩነቶች፡ ጠንካራ፣ ፈጣን፣ በመስመር ጥበብ እና ሸካራዎች ላይ ጥሩ።
- በSDXL ውስጥ ያሉ ድብቅ upscalers፡ ብዙውን ጊዜ ለፎቶግራፍ መልክዎች ንጹህ ናቸው።
- የጣት አገዛዝ፡ ቆሻሻን አታሳድጉ። መጀመሪያ የመሠረት ምስሉን ያሻሽሉ (ጥያቄ፣ ደረጃዎች፣ CFG፣ የተሻለ የፍተሻ ነጥብ)፣ ከዚያ ያሳድጉ።
Deforum እና Animatediff: አሁንም በቂ በማይሆንበት ጊዜ
ወደ እንቅስቃሴ እየገቡ ከሆነ፣ Deforum (በድብቅ ቦታ በኩል የካሜራ መንገዶች) እና Animatediff (ለStable Diffusion ጊዜያዊ ወጥነት) ክፍት ምንጭ መግቢያዎች ናቸው። የመማሪያው ኩርባ ወደ ደረጃ የሚቀየር የእግር ጉዞ መንገድ ይመስላል፣ ነገር ግን ክፍያው -የሚሽከረከሩ አኒሜሽን ሸካራዎች፣ የፅንሰ-ሀሳብ ሪልሎች፣ የእንቅስቃሴ ሙከራዎች- እውን ነው።
- በአጫጭር ቀለበቶች ይጀምሩ። እንቅስቃሴ ስህተቶችን ያበዛል።
- ጥያቄዎችን ጥብቅ ያድርጉ; ተንሳፋፊ ቋንቋ ተንሳፋፊ ፍሬሞች ጋር እኩል ነው።
የፎቶግራፍ እውነታነት፡ SDXL የፎቶግራፍ እውነታነት፣ የመብራት LoRAዎች እና የእውነታ ማረጋገጫዎች
ለማምረቻ ፎቶዎች እና ሰዎች፣ የተለየ አስተሳሰብ ያስፈልግዎታል። የመብራት LoRAዎች ከማጂክ ቃላት የበለጠ ጠቃሚ ናቸው። የማጣቀሻ ምስሎች (ከዝቅተኛ ድምጽ ጋር ያለ ምስል ወደ ምስል) የበለጠ ጠቃሚ ናቸው።
- ቁጥጥር የሚደረግበት መብራት ለማግኘት ይሞክሩ፡ softbox መልክ፣ የጀርባ ብርሃን መለያየት፣ ሊያብራሩዋቸው የሚችሏቸው ነጸብራቆች።
- በ ControlNet በኩል የማጣቀሻ አቀማመጦችን ይጠቀሙ። የፎቶግራፍ እውነታ ቅንብር 90% ጂኦሜትሪ እና ብርሃን ነው፣ ድግምት አይደለም።
- ፊቶችን በጥንቃቄ ይያዙ፡ የፊት ማደስን በጥቂቱ ይጨምሩ። በጣም ብዙ እና ሁሉም ከ 1987 እንደ የሳሙና ኦፔራ ይመስላሉ።
ክፍት ምንጭ የምስል አርታኢዎች ከ AI Juice ጋር፡ GIMP፣ Krita እና ጓደኞች
- GIMP ከ AI ተሰኪዎች ጋር፡ ትንሽ ሸካራ፣ ግን ለቡድን አርትዖቶች እና ጭምብሎች የሚቻል።
- Krita (እንደገና): ተፈጥሯዊ ስዕል, ምቹ inpainting.
- Blender (አዎ፣ Blender): በራሱ የምስል መሣሪያ አይደለም፣ ነገር ግን ሸካራዎችን፣ የመብራት ማጣቀሻዎችን ወይም የጀርባ ሳህኖችን እየፈጠሩ ከሆነ፣ Blender እና AI የሸካራነት ማሳደግ የኃይል ጥምረት ነው።
ሃርድዌር፡ ማንም ማንበብ የማይፈልገው ክፍል (ነገር ግን ሁሉም የሚከፍለው)
- VRAM ህይወትዎን ይገዛል:: 8GB ወለሉ ነው; 12GB ሊሰራ የሚችል ነው; 24GB የቡድን መጠኖችን ይቅርታ መጠየቅ የሚያቆሙበት ነው።
- NVIDIA አሁንም በክፍት ምንጭ AI ስነ-ምህዳር ውስጥ ምርጥ ድጋፍ አለው። AMD እየተሻሻለ ነው፣ Apple Silicon ከSDXL ጋር በሚያስደንቅ ሁኔታ ጨዋ ነው -ነገር ግን ጥቂት ራስ ምታት ከፈለጉ CUDA በጣም አነስተኛ የመቋቋም መንገድ ነው።
- የዲስክ ቦታ፡ ሞዴሎች ትልቅ ናቸው። የተዘጋጀ ቤተ-መጽሐፍት ያስቀምጡ እና የማይጠቀሙትን ያስቀምጡ። መከማቸት ስልት አይደለም።
ግላዊነት እና ውሎች፡ ክፍት ምንጭ እዚህ ያለው ምክንያት
ክፍት ምንጭ AI የምስል መሣሪያዎች ስለ ወጪ ብቻ አይደሉም። ስለ ቁጥጥር ነው። በአካባቢው ማሄድ ማለት እየሰሩ ያሉት ስራ፣ የደንበኛዎ ንብረቶች፣ የምርት አቅርቦቶችዎ እና ያልተገለጹ ንድፎችዎ በእርስዎ ማሽን ላይ ይቆያሉ። ምንም “አገልግሎታችንን ለማሻሻል መረጃዎን ልንጠቀምበት እንችላለን” የግርጌ ማስታወሻዎች የሉም፣ ከህጋዊ ድርጅት ምንም እንቅልፍ የሌላቸው እኩለ ሌሊት ኢሜይሎች የሉም።
ያ እውነተኛው መስህብ ነው። “ነፃ” ብቻ ሳይሆን “የእርስዎ” ነው።
አጭር ዝርዝር፡ ለፈጣሪዎች ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች
- Stable Diffusion SDXL እና SD 1.5: እርስዎ በእርግጥ የሚጠቀሙባቸው ዋና ጀነሬተሮች።
- ComfyUI: ለመስመር-ደረጃ የስራ ፍሰቶች እና ተባዝቶ ለመስራት።
- Automatic1111: ለፈጣን ድግግሞሽ እና ትልቅ ተሰኪ ስነ-ምህዳር።
- InvokeAI: ይበልጥ የተረጋጋ, ስቱዲዮ መሰል አካባቢ ለማግኘት.
- ControlNet: ውጤቱን እንዲታዘዝ ለሚያደርግ አቀማመጥ፣ ጥልቀት እና የመስመር ቁጥጥር።
- LoRA/Textual Inversion: በትንንሽ ፋይሎች ዘይቤ እና ቁምፊ ወጥነት ለማግኘት።
- ESRGAN/Real-ESRGAN: ከምስልዎ ላይ ነፍስን ለማያጎድፍ ለማሳደግ።
- Krita (ከ SD ተሰኪዎች ጋር): በእውነተኛ የስነ ጥበብ መተግበሪያ ውስጥ ለስዕል ቁጥጥር።
- Deforum/Animatediff: የፊልም ትምህርት ቤት የማይፈልጉ የእንቅስቃሴ ሙከራዎች ለማድረግ።
ጉድጓዶች እና ተግባራዊ ጥገናዎች
- ከመጠን በላይ ጥያቄ፡ ጥያቄዎ እንደ ቤዛ ማስታወሻ የሚነበብ ከሆነ፣ ምስልዎ እንደ አንድ ይሆናል። ጥቂት ቃላት, ጠንካራ ምልክቶች.
- በጣም ብዙ ተጨማሪዎች፡ ControlNet መደራረብ ወደ ጎተታ ሊቀየር ይችላል። ጉዳዩ ያላቸውን ሁለቱን ይምረጡ።
- የሞዴል ሩሌት፡ በየአምስት ደቂቃው ሞዴሎችን መቀየር የቅጥ ወጥነትዎን ያጠፋል። ለአነስተኛ ስብስብ ቃል ግቡ።
- ዘሮችን ችላ ማለት፡ ለተደጋጋሚነት ዘሮችን ያስቀምጡ። የወደፊት-እርስዎ የተደራጁ ስለሆኑ ያለፈ-እርስዎትን ያመሰግናሉ።
“ምርጥ” በእርስዎ ቀነ-ገደብ ላይ የተመሠረተ ነው።
- የተያዘ ቀነ-ገደብ፣ የፅንሰ-ሀሳብ ጥበብ፡ SD 1.5 + ControlNet Lineart + A1111. ፈጣን፣ ይቅር ባይ፣ በቂ።
- የፖርትፎሊዮ ቁራጭ፣ በቅጥ የተሰራ፡ SDXL + ComfyUI + በእጅ የተስተካከሉ LoRAዎች። ቀስ ብሎ ለስላሳ ነው፣ ለስላሳ ፈጣን ነው።
- የምርት ማስመሰያዎች፣ የፎቶግራፍ እውነታነት፡ SDXL + የመብራት LoRAዎች + የማጣቀሻ ፎቶዎች + ESRGAN። አሰልቺ ያድርጉት; አሰልቺ እውነት ይመስላል።
- የአኒሜሽን ሙከራ፡ Animatediff + ጥብቅ ጥያቄዎች + አጫጭር ቀለበቶች። ትናንሽ ድሎችን ይላኩ።
Sider.AI በእውነቱ መሳሪያዎች ላይ ጥያቄዎችን፣ የቅጥ ማስታወሻዎችን እና ተባዝቶ የሚሠሩ የስራ ፍሰቶችን ሲያመቻቹ ያግዛል። ሌላ “አስማታዊ ሞዴል” አይደለም - ጥያቄዎችን ለማከማቸት፣ ልዩነቶችን ለማነፃፀር እና ክፍት ምንጭ UIs ወደ ንፋስ የሚበትኑትን የወረቀት ዱካ ለማስቀመጥ ጤናማ ቦታ ነው። የእርስዎን ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎችን ክምችት ለመመዝገብ፣ ዘሮችን እና LoRAዎችን ለመከታተል እና ወደ ComfyUI ወይም A1111 ሊለጥፉ የሚችሉ ወጥ የሆኑ አጫጭር መግለጫዎችን ለመፍጠር ይጠቀሙበት። በሌላ አነጋገር፣ ያክ-መላጨት ያነሰ፣ መላክ የበለጠ። Stable Diffusion ወይም Kritaን አይተካም። የእነሱን አጠቃቀምዎትን ያነሰ ትርምስ ያደርገዋል። ይህም ከሁለት ሳምንት በፊት መልክን እንደገና ለመፍጠር ከሰዓት በኋላ ካሳለፉ ከአንድ ተጨማሪ “ከምንጊዜውም የበለጠ ሹል” የፍተሻ ነጥብ በላይ ዋጋ አለው።
የሚበጁ የፈጣሪ የስራ ፍሰቶች
- የቤተ-መጽሐፍት አስተሳሰብ፡ የፍተሻ ነጥቦችዎን፣ LoRAዎችን እና ControlNet ክብደቶችን ይቆጣጠሩ። ሌላ ሰው እንዲረዳቸው በሚያስፈልግ መንገድ ይሰይሟቸው።
- እንደ ስካፎልዲንግ አብነቶች፡ ለተለመዱ ስራዎች ComfyUI ግራፎችን እና A1111 ፈጣን ቅድመ-ቅምጦችን ያስቀምጡ። አብነቶች የእጅ መቆጣጠሪያዎች ናቸው፣ የእጅ ማሰሪያዎች አይደሉም።
- ማጣቀሻ-መጀመሪያ፡ ሞዴሉን ጥሩ ግብዓቶችን ይመግቡ፡ አቀማመጥ ማጣቀሻዎች፣ የመብራት ማጣቀሻዎች፣ የቀለም ቤተ-ስዕሎች። AI ጣዕምን ያሰፋል; አይፈጥረውም።
- ለሥዕሎች የሥሪት ቁጥጥር፡ ዘሮችን፣ ጥያቄዎችን እና መቼቶችን ከሥዕሎቹ አጠገብ ያስቀምጡ። ውጤቶችን እንደ ኮድ ግንባታዎች ይያዙ።
ዲያሌክቲክ፡ ክፍት ምንጭ ነፃነት ከጊዜ ግብር ጋር
ክፍት ምንጭ AI የምስል መሣሪያዎች ለመስራት በጣም ነፃ የሚያወጡ እና በጣም የሚጠይቁ መንገዶች ናቸው። የደንበኝነት ምዝገባዎችን ለማዋቀር፣ የእጅ መቆጣጠሪያዎችን ተለዋዋጭነት፣ መረጋጋትን ለቁጥጥር ይነግዳሉ። አንዳንድ ቀናት እንደ Unix የዴስክቶፕ ዘመን ይሰማዋል - መመሪያውን ካነበቡት ማለቂያ የሌለው ኃይል። ሌሎች ቀናት በተቻለ መጠን በተሻለ መንገድ እንደ ማጭበርበር ይሰማዋል።
የኢንዱስትሪው መስመር “ዲሞክራሲያዊነት” ይላል። እውነታው የእጅ ጥበብ ነው። ምንም መሣሪያ ጣዕምን አያስወግድም, እና ምንም ሞዴል ከመምረጥ ነፃ አያደርግዎትም. ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች ታላቅ ስራ አይፈጥሩም; በፍጥነት እንዲቀርጹት፣ የበለጠ እንዲደግሙ እና ሂደቱን የራስዎ እንዲያደርጉ ያስችሉዎታል።
ያ ትክክለኛ ነፃነት የሚመስል ከሆነ -እና የግብይት አይነት ካልሆነ - እነዚህ መሣሪያዎች የተገነቡት ለእርስዎ ነው። ያስታውሱ፡ ቡችላ ነፃ ነው። ምግቡ፣ ስልጠናው እና ጊዜው አይደሉም።
ተደጋጋሚ ጥያቄዎች
ጥ፡ ለፈጣን ሃሳብ ማመንጨት ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች ምንድን ናቸው?
መ፡ Stable Diffusion SD 1.5 ከ Automatic1111 ጋር አሁንም ከጥያቄ ወደ ምስል ፈጣኑ መንገድ ነው። ለመዋቅር ControlNet lineart ወይም poseን ያክሉ፣ እና በሰዓታት ፋንታ በደቂቃዎች ውስጥ ጥቅም ላይ የሚውል የፅንሰ-ሀሳብ ጥበብ ያገኛሉ።
ጥ፡ ለፎቶግራፍ እውነታነት የትኞቹ ክፍት ምንጭ AI የምስል መሣሪያዎች ምርጥ ናቸው?
መ፡ SDXL በንጹህ የፍተሻ ነጥብ እና የመብራት LoRAዎች አብዛኛውን ጊዜ ያሸንፋል። በማጣቀሻ ፎቶዎች በኩል ControlNetን ይጠቀሙ እና በጥንቃቄ ESRGAN ከፍ ባለ ደረጃ ይጨርሱ - የፎቶግራፍ እውነታነት በአብዛኛው ጂኦሜትሪ እና ብርሃን ነው፣ “ድንቅ ስራ” አይፈለጌ መልዕክት አይደለም።
ጥ፡ ComfyUI ወይም Automatic1111 መጠቀም አለብኝ?
መ፡ ፍጥነት እና ትልቅ ተሰኪ ስነ-ምህዳር ከፈለጉ፣ Automatic1111ን ይምረጡ። ስለ ተባዝቶ የመሥራት እና የመስመር ቁጥጥር የሚያሳስብዎት ከሆነ ComfyUI የተሻለ ነው -የ node graph የመማሪያ ኩርባን ይቀበሉ።
ጥ፡ ክፍት ምንጭ መሣሪያዎችን በመጠቀም በምስሎች ላይ እንዴት ወጥ የሆነ ዘይቤን መጠበቅ እችላለሁ?
መ፡ ትንሽ የ LoRA ስብስብን አሰልጥኑ ወይም ይቀበሉ እና ዘሮችን፣ ጥያቄዎችን እና መቼቶችን በስሪት ያድርጉ። ወጥነት አስማት አይደለም; በሞዴል መቀያየር ላይ ዶክመንቶች እና መገደብ ነው።
ጥ፡ Sider.AI በክፍት ምንጭ የምስል የስራ ፍሰት ውስጥ የት ነው የሚረዳው?
መ፡ Sider.AI ውጤቶችን ከመገመት ይልቅ እንደገና መፍጠር እንዲችሉ ጥያቄዎችዎን፣ ዘሮችዎን እና ልዩነቶችዎን የተደራጁ ያደርጋል። በንድፍ ኃይለኛ ነገር ግን ረስቶ ለተፈጠረ ክፍት ምንጭ ቁልል የጎደለው ማህደረ ትውስታ አድርገው ያስቡት። ተደጋጋሚ ጥያቄ
ጥ1፡ለፈጣን ሃሳብ ማመንጨት ምርጥ ክፍት ምንጭ AI የምስል መሣሪያዎች ምንድን ናቸው?
Stable Diffusion 1.5 ከ Automatic1111 ጋር ከጥያቄ ወደ ምስል በፍጥነት ያደርስዎታል። ለአቀማመጥ ወይም ጠርዞች ControlNetን ያክሉ እና አምስት የተለያዩ መተግበሪያዎችን ሳይጣበቁ መጠቀም የሚቻል የፅንሰ-ሀሳብ ጥበብ ያገኛሉ።
ጥ2፡ለፎቶግራፍ እውነታነት የትኞቹ ክፍት ምንጭ AI የምስል መሣሪያዎች በተሻለ ሁኔታ ይሰራሉ?
SDXL በጠንካራ የፍተሻ ነጥቦች እና የመብራት LoRAዎች ተግባራዊ ምርጫ ነው። ControlNetን ከማጣቀሻ ፎቶዎች ጋር ይጠቀሙ እና ጥርት ያለ፣ ሊታመን የሚችል ዝርዝር ለማግኘት በ ESRGAN ማሳደግ ይጨርሱ።
ጥ3፡ComfyUI ለፈጣሪዎች ከ Automatic1111 የተሻለ ነው?
ComfyUI ተባዝቶ ለሚሰሩ መስመሮች እና የቡድን የስራ ፍሰቶች የተሻለ ነው; Automatic1111 ለፈጣን ድግግሞሽ እና ተሰኪዎች የተሻለ ነው። ፍጥነትን ወይም ቁጥጥርን የበለጠ ዋጋ ይሰጡ እንደሆነ በመመስረት ይምረጡ።
ጥ4፡ክፍት ምንጭ AI መሣሪያዎችን በመጠቀም ዘይቤን እንዴት ወጥ ማድረግ እችላለሁ?
ወደ ትንሽ የ LoRAዎች እና የፍተሻ ነጥቦች ስብስብ ይሂዱ እና ዘሮችን ከእያንዳንዱ ወደ ውጭ ከመላክ ጋር ያስቀምጡ። ወጥነት የሚመጣው ከሰነድ እና ከመገደብ እንጂ ከረዥም ጥያቄዎች አይደለም።
Q5: Sider.AI በክፍት ምንጭ የምስል የስራ ሂደት ውስጥ የት ይገባል?
Sider.AI ጥያቄዎችን፣ ዘሮችን እና ስሪቶችን በተፈላጊነት መልክዎችን እንደገና መፍጠር እንድትችል ያግዛል። Stable Diffusionን አይተካም፤ ቁልልህን ይበልጥ ሥርዓት ባለው እና በተደጋጋሚ እንዲሆን ያደርገዋል።