அறிமுகம்: “பேச்சில் இலவசம், மாயாஜாலத்தில் இல்லை” பிரச்சனை
திறந்த மூல AI பட கருவிகளைப் பொறுத்தவரை, அனைவரும் அடிக்குறிப்புகள் இல்லாமல் பளபளப்பான டெமோக்களிலிருந்து முடிவுகளைப் பெற விரும்புகிறார்கள். நீங்கள் டிக்டாக்குகளைப் பார்த்திருப்பீர்கள்: ஒரு பொத்தானைக் கிளிக் செய்தால், ஒரு ஒளிப்படவியல் டிராகன் செல்லோ வாசிப்பது போல வெளிவரும், மேலும் இது வெளிப்படையாக “இலவசம்”. ஒரு நாய்க்குட்டி போல இலவசம். அல்லது ஒரு ஹோம் டிப்போ வண்டியில் மரம் நிரம்பியது போல இலவசம் - நீங்கள் இன்னும் வீட்டை கட்ட வேண்டும்.
நீங்கள் ஒரு படைப்பாளராக இருந்தால், இந்த யோசனை தவிர்க்கமுடியாதது: சிறந்த திறந்த மூல AI பட கருவிகள், உள்ளூர் கட்டுப்பாடு, பயமுறுத்தும் விதிமுறைகள் மற்றும் நிபந்தனைகள் அடிக்குறிப்புகள் இல்லை, மற்றும் மூடிய தளங்கள் கண்ணியமான சுவிட்சுகளின் தொகுப்புக்கு பின்னால் மறைத்து வைக்கும் அளவிற்கு மாற்றியமைக்கும் திறன். ஆனால் ஒரு சிக்கல் உள்ளது. திறந்த மூல கருவிகள், நீங்கள் செலவு அதிகமான, முட்டாள் தனமான விஷயங்களைச் செய்வதிலிருந்து உங்களைத் தடுக்க ஒரு தயாரிப்பு மேலாளருடன் வருவதில்லை. அவை அதிகாலை 2 மணிக்கு எஸ்பிரெசோ குடிக்கும் நபர்களால் எழுதப்பட்ட ரீட்மீக்களுடன் வருகின்றன. நீங்களும் PyTorch ஐ மூலத்திலிருந்து தொகுக்க விரும்புகிறீர்கள் என்று உண்மையாகவே நம்புகிறார்கள்.
எனவே இதைச் சரியாக எடைபோடுவோம். உற்சாகத்துடன் அல்ல, தோல்வியுடனும் அல்ல. இங்கே நோக்கம், படைப்பாளர்களுக்கு உண்மையாகவே சிறந்தது எது என்பதை GitHub நட்சத்திரங்கள் இரவில் உற்சாகமாகத் தோன்றுவதிலிருந்து பிரிப்பதாகும்.
“சிறந்த திறந்த மூல AI பட கருவிகள்” என்பது ஏன் தவறான கேள்வி (ஆனாலும் பயனுள்ளது)
சிறந்த திறந்த மூல AI பட கருவிகள் நீங்கள் என்ன செய்கிறீர்கள் என்பதைப் பொறுத்தது: விளக்கம், புகைப்படம் எடிட்டிங், 3D, கருத்து கலை, அனிமேஷன் பிரேம்கள், வடிவமைப்பு மாதிரி அல்லது முழு அளவிலான சொத்து குழாய்த்திட்டங்கள். ஒரு ஒற்றை “சிறந்ததை” கேட்பது, சிறந்த கத்தியைக் கேட்பது போன்றது: சமையல்காரரின் கத்தி, தோல் உரிக்கும் கத்தி அல்லது ஒரு ஜப்பானிய க்யுடோ, அது வெறுமனே பார்ப்பதன் மூலம் ஒரு தக்காளியை நறுக்கும்? உண்மையான பதில் “அது சார்ந்தது” என்பதுதான், அதைத் தொடர்ந்து உண்மையான வர்த்தகங்களின் விளக்கம்.
பயனுள்ள கேள்வி என்னவென்றால்: படைப்பாளிகள் உண்மையில் எதிர்கொள்ளும் முக்கிய வேலைகளை எந்த திறந்த மூல கருவிகள் உள்ளடக்குகின்றன? மேலும் சார்பு நரகத்திற்கு உங்களை இழுப்பதற்கு பதிலாக எந்த கருவிகள் தடையாக இல்லாமல் இருக்கின்றன?
முக்கியமான வேலைகள், Buzzwords அல்ல
- வேகமான உருவாக்கம்: படத்திற்கு ஸ்கெட்ச், அமைப்புக்கு தூண்டுதல் மற்றும் நகலின் நகல் போல் இல்லாத வேறுபாடுகள்.
- விரிவான கட்டுப்பாடு: முகமூடி, உள் ஓவியம், நிலையான தன்மை மற்றும் பாணி, கட்டுப்படுத்தக்கூடிய ஆழம் மற்றும் போஸ்.
- ஒளிப்படவியல் vs. ஸ்டைலைசேஷன்: நீங்கள் ஒரு ஒற்றை அழகியலைத் தேர்ந்தெடுத்து அதனுடன் வாழ வேண்டியதில்லை - நீங்கள் விரும்பினால் தவிர.
- உள்ளூர் தனியுரிமை மற்றும் செலவு: உங்கள் GPU இல் இயக்கவும், உங்கள் கிரெடிட் கார்டில் அல்ல.
- குழாய்த்திட்ட நட்பு: ஸ்கிரிப்டிங் செய்யக்கூடிய, தானியக்கமாக்கக்கூடிய மற்றும் நீங்கள் CUDA க்கு அருகில் தும்மும்போது உடைந்துவிடாது.
அதை மனதில் வைத்து, படைப்பாளிகளுக்கான சிறந்த திறந்த மூல AI பட கருவிகள் உண்மையில் எங்கே பிரகாசிக்கின்றன - மேலும் அவை எங்கே மிகவும் அதிகமாக இல்லை.
Stable Diffusion (SD 1.5, SDXL): கருத்துக்களுடன் கூடிய பணிக்குதிரை
திறந்த மூல AI பட உருவாக்கத்திற்கு ஒரு சின்னம் இருந்தால், அது Stable Diffusion. ஒவ்வொரு தரப்படுத்தலிலும் வெப்பமான மாதிரி இல்லை, ஆனால் வேலைக்கு வந்து செலவு அறிக்கையை தாக்கல் செய்யாத ஒன்று. SD 1.5 இன்னும் பகட்டான விளக்கம் மற்றும் கருத்தாக்கத்திற்கு அபத்தமாக பயனுள்ளதாக உள்ளது; SDXL ஒரு தரவு மையத்தின் தேவை இல்லாமல் அமைப்பு மற்றும் விவரங்களுக்கான வரம்பை அதிகரிக்கிறது.
ஏன் படைப்பாளிகள் அதை வைத்திருக்கிறார்கள்:
- ஒரு தவறுக்கு சரிசெய்யக்கூடியது: மாதிரி வகைகள், LoRA ஃபைன்-ட்யூன்கள், போஸ், ஆழம், விளிம்புகளுக்கான ControlNet தொகுதிகள் - அடிப்படையில் கலவைக்கான ஏமாற்று குறியீடுகள்.
- உள்ளூர்-முதல்: நீங்கள் அதை ஒரு நடுத்தர அடுக்கு GPU இல் இயக்கலாம். 8-12GB VRAM உங்களை எங்காவது அழைத்துச் செல்கிறது; 24GB அதை இனிமையாக்குகிறது.
- சூழல் ஈர்ப்பு: ஒவ்வொரு கருவியும் Stable Diffusion உடன் ஒருங்கிணைக்கிறது. அது சரியானதாக இருப்பதால் அல்ல, ஆனால் அது எல்லா இடங்களிலும் இருப்பதால்.
அது எங்கே தடுமாறுகிறது:
- ஒளிப்படவியல் பொருத்தமற்றது: கைகள் நன்றாக இருந்தன, பின்னர் செக்பாயிண்டுகளைப் பொறுத்து மீண்டும் விசித்திரமாகியது.
- தூண்டுதல் வூடூ: “சிறந்த தரம், தலைசிறந்த படைப்பு” வேலை செய்யக்கூடாது, ஆனால் சில நேரங்களில் அது செய்கிறது. அது ஒரு அம்சம் அல்ல, அது ஒரு மூடநம்பிக்கை.
- அமைவு மேல்நிலை: “ஒரு கிளிக்” நிறுவி எப்போதும் ஒரு கிளிக் மற்றும் 14 இயக்கி புதுப்பிப்புகள்.
அதை பயன்படுத்த சிறந்த வழி:
- பரந்த, பணக்கார அமைப்புகள் மற்றும் அச்சுக்கு ஏற்ற விவரங்களுக்கு SDXL.
- பகட்டான வேலை, அனிம் மற்றும் வேகத்திற்கு SD 1.5.
- போஸ் / ஆழத்திற்கு ControlNet ஐச் சேர்க்கவும். நிலையான எழுத்துக்கள் அல்லது தயாரிப்பு பாணிகளுக்கு LoRA களைப் பயன்படுத்தவும். உங்கள் மாதிரி மிருகக்காட்சிசாலையை சிறியதாக வைத்திருங்கள் - சேகரிப்பதை விட க்யூரேஷன் சிறந்தது.
ComfyUI மற்றும் Automatic1111: ஒரே மலைக்கு இரண்டு சாலைகள்
சாதாரணமாகச் சொல்வோம்: சிறந்த திறந்த மூல AI பட கருவிகள் மாதிரிகள் மட்டுமல்ல. அவை உங்கள் மனதை இழக்காமல் தடுக்கும் இடைமுகங்கள். மலையின் இரண்டு ராஜாக்கள்: ComfyUI மற்றும் Automatic1111.
Automatic1111 (A1111):
- நன்மை: பெரிய நட்பு பொத்தான்கள், டன் நீட்டிப்புகள், எளிதான தூண்டுதல் திருத்தம்.
- தீமை: எளிமையாகத் தொடங்குகிறது, நீங்கள் எல்லாவற்றையும் இயக்கினால் ஒரு ஸ்விஸ் இராணுவ செயின்சா போல மாறும்.
- சிறந்தது: சிஸ்டம்ஸ் பொறியியல் பட்டம் தேவையில்லாத GUI உடன் விரைவான மறு செய்கையை விரும்பும் படைப்பாளர்களுக்கு.
ComfyUI:
- நன்மை: நோட்-கிராஃப் கட்டுப்பாடு, மீண்டும் செய்யக்கூடிய குழாய்த்திட்டங்கள், மட்டு, வேகமாக. அமைப்புகளின் ஆதாரம் பற்றி நீங்கள் கவலைப்பட்டால் நல்லது.
- தீமை: உங்கள் முதல் வரைபடம் ஒரு சதி பலகை போல் இருக்கும். உங்கள் இரண்டாவது வரைபடமும் அவ்வாறே இருக்கும்.
- சிறந்தது: இனப்பெருக்கம், தொகுதிக்குரிய பணிப்பாய்வுகள் மற்றும் தீவிரமான ControlNet நடன அமைப்பு ஆகியவற்றை விரும்பும் பவர் பயனர்கள் மற்றும் குழுக்களுக்கு.
தீர்ப்பு: நீங்கள் புதியவராக இருந்தால், Automatic1111 இல் தொடங்கவும். நீங்கள் ஒரு குழாய்த்திட்டத்தை உருவாக்கினால் அல்லது ஒத்துழைக்கிறீர்கள் என்றால், ComfyUI க்கு பட்டம் பெறுங்கள். உங்கள் அறிவுறுத்தல்களின் பட்டியலை வரைவதை நீங்கள் விரும்புகிறீர்களா என்பதைப் பொறுத்து “சிறந்த” இருக்கும்.
Krita + Stable Diffusion Plugins: உண்மையான கலைஞரின் பணிப்பாய்வு
Krita புதியது அல்ல, ஆனால் AI ஒரு ஓவியரின் பணிப்பாய்வுக்குள் பொருந்தும் விதம் மற்றவர்களை விட அமைதியாக சிறப்பாக உள்ளது. உள் ஓவியம் இயற்கையாகவே தெரிகிறது. முகமூடி ஒரு பின்விளைவு அல்ல. இது அடுக்குகள், தூரிகைகள் மற்றும் கை கட்டுப்பாட்டை மதிக்கிறது.
- பொருத்தம்: இது “உண்மையான கலை பயன்பாட்டில் AI”, “வலை டெமோவுடன் இணைக்கப்பட்ட கலை” அல்ல.
- பிடிப்பு: உங்கள் உள்ளூர் SD ஸ்டேக் சீராக இயங்க வேண்டும். ஆனால் அது ஒருமுறை இருந்தால், Krita மற்றும் உள் ஓவியம் நீங்கள் நிறுத்தி வைத்திருக்கும் காரில் கிளட்ச் மிதி கண்டுபிடிப்பது போல் உணர்கிறது.
InvokeAI: அறிவார்ந்த நடு
InvokeAI சத்தமாக இருக்க முயற்சிக்கவில்லை; அது அமைதியாக இருக்க முயற்சிக்கிறது. சுத்தமான UI, நல்ல இயல்புநிலைகள், திடமான உள் ஓவியம் / வெளிப்புற ஓவியம் மற்றும் “models/Stable-diffusion” என்ற பெயர் கொண்ட ஒரு கோப்புறை Stable Diffusion க்காகவா அல்லது ஸ்திரத்தன்மைக்கானதா என்று உங்களை ஆச்சரியப்பட வைக்காத ஒரு மாதிரி மேலாளர். Automatic1111 தெரு சந்தையாகவும், ComfyUI ஆய்வகமாகவும் இருந்தால், InvokeAI ஸ்டுடியோவாகும்.
- சிறந்தது: குறைவான கடினமான விளிம்புகள் மற்றும் நல்ல ஆவணங்களுடன் நிலையான, ஆதரிக்கப்படும் திறந்த மூல கருவியை விரும்பும் படைப்பாளர்களுக்கு.
- பலவீனம்: சிறிய செருகுநிரல் யுனிவர்ஸ். அது ஒரு அம்சமாக இருக்கலாம்.
ControlNet: கட்டுப்பாட்டு வெறியர்களுக்கான ரகசிய சாஸ் (அதாவது, கலைஞர்கள்)
“AI அது விரும்புவதை செய்கிறது” ஒரு சாக்குப்போக்காக இருந்ததை ControlNet நிறுத்தியதற்கு இதுவே காரணம். ஒரு விளிம்பு வரைபடம், ஆழ வரைபடம், போஸ் எலும்புக்கூடு அல்லது சாதாரண வரைபடத்தில் ஒரு தலைமுறையை கட்டுப்படுத்துங்கள், திடீரென்று உங்கள் கருத்து கலை அதிர்வுகளுக்கு பதிலாக கட்டமைப்பைக் கொண்டுள்ளது.
- உண்மையில் முக்கியமான பயன்பாட்டு நிகழ்வுகள்:
- நிலையான எழுத்துக்களுக்கு போஸ்-க்கு-படம்.
- அமைப்பை அப்படியே வைத்திருக்க ஆழத்திற்கு-படம்.
- உங்கள் ஸ்கெட்ச் மாதிரியால் புறக்கணிக்கப்படுவதை நிறுத்த Canny/Lineart.
- எச்சரிக்கை: அதிக ControlNets எப்போதும் சிறந்தது அல்ல. ஒன்று அல்லது இரண்டு வலுவான சமிக்ஞைகள் ஐந்து லேசான ஆலோசனைகளை விட சிறந்தது.
LoRA மற்றும் Textual Inversion: வழக்கு இல்லாமல் பாணி
முழு ஃபைன்-ட்யூன்கள் கனமானவை. முழு மாதிரியின் மூளையையும் மீண்டும் எழுதாமல் ஒரு பாணி, எழுத்து அல்லது தயாரிப்பு சூழலில் செருக LoRA உங்களை அனுமதிக்கிறது. Textual inversion என்பது பாக்கெட் கத்தி பதிப்பு - சிறிய கற்றல் டோக்கன்கள் மாதிரியை உங்கள் தோற்றத்தை நோக்கி நகர்த்துகின்றன.
- சிறியதாகப் பயிற்சி செய்யுங்கள்; ஒவ்வொரு படமும் ஒரே போஸ்டராக இருக்கும் வரை அதிகப்படியான பொருத்தம் நன்றாக இருக்கிறது.
- நீங்கள் மீண்டும் மீண்டும் தேவைப்படும் எழுத்துக்கள் மற்றும் பிராண்டுகளுக்கு ஒரு நூலகத்தை வைத்திருங்கள்.
- உங்கள் கற்றல் விகிதங்கள் மற்றும் படிகளை ஆவணப்படுத்துங்கள், அல்லது ஒவ்வொரு மாதமும் உங்கள் தவறுகளை மீண்டும் கண்டுபிடிப்பீர்கள்.
அதிகரிப்பவர்கள்: ESRGAN, 4x-UltraSharp, மற்றும் “போதுமான உண்மையானதாகத் தெரிகிறது” சோதனை
AI அதிகரிப்பு என்பது பாடப்படாத ஹீரோ. ஒரு நல்ல 2x அல்லது 4x பாஸ் உருவாக்கப்பட்ட படத்தை விட்டுக்கொடுக்கும் விசித்திரமான தெளிவின்மையை சரிசெய்ய முடியும்.
- ESRGAN மற்றும் Real-ESRGAN வகைகள்: திடமான, வேகமான, வரி கலை மற்றும் கட்டமைப்புகளில் நல்லது.
- SDXL க்குள் மறைந்திருக்கும் அதிகரிப்பவர்கள்: பெரும்பாலும் ஒளிப்படவியல் தோற்றங்களுக்கு சுத்தமானவை.
- பொது விதி: குப்பைகளை அதிகரிக்க வேண்டாம். அடிப்படை படத்தை முதலில் மேம்படுத்தவும் (தூண்டுதல், படிகள், CFG, சிறந்த செக்பாயிண்ட்), பின்னர் அதிகரிக்கவும்.
Deforum மற்றும் Animatediff: இன்னும் போதுமானதாக இல்லாதபோது
நீங்கள் இயக்கத்தில் இறங்கினால், Deforum (மறைந்திருக்கும் இடத்தில் கேமரா பாதைகள்) மற்றும் Animatediff (Stable Diffusion க்கான தற்காலிக ஒற்றுமை) ஆகியவை திறந்த மூல நுழைவாயில்கள். கற்றல் வளைவு ஒரு படிக்கட்டாக மாறும் ஒரு நடைபாதை போல் உள்ளது, ஆனால் திரும்பப் பெறுதல் - அனிமேஷன் செய்யப்பட்ட கட்டமைப்புகளை லூப் செய்வது, கருத்து சுருள்கள், இயக்க சோதனைகள் - உண்மையானது.
- குறுகிய சுழல்களுடன் தொடங்கவும். இயக்கம் தவறுகளைப் பெருக்குகிறது.
- உங்களுக்கு நிலைத்தன்மை தேவைப்படும்போது விதைகளை பூட்டவும்.
- தூண்டுதல்களை இறுக்கமாக வைத்திருங்கள்; விலகிச் செல்லும் மொழி விலகிச் செல்லும் பிரேம்களுக்கு சமம்.
ஒளிப்படவியல்: SDXL ஒளிப்படவியல், விளக்கு LoRA கள் மற்றும் உண்மை சரிபார்ப்புகள்
தயாரிப்பு காட்சிகள் மற்றும் மக்களுக்கு, உங்களுக்கு வேறு மனநிலை தேவை. மந்திர வார்த்தைகளை விட விளக்கு LoRA கள் முக்கியம். குறிப்பு படங்கள் (குறைந்த டெனோஸுடன் படம்-க்கு-படம்) இன்னும் முக்கியம்.
- கட்டுப்படுத்தப்பட்ட விளக்குகளை இலக்காகக் கொள்ளுங்கள்: சாஃப்ட்பாக்ஸ் தோற்றம், பின் ஒளி பிரிப்பு, நீங்கள் விளக்கக்கூடிய பிரதிபலிப்புகள்.
- ControlNet வழியாக குறிப்பு போஸ்களைப் பயன்படுத்தவும். ஒளிப்படவியல் அமைப்பு 90% வடிவியல் மற்றும் ஒளி, மந்திரங்கள் அல்ல.
- முகங்களை கவனமாக நடத்துங்கள்: முக மறுசீரமைப்பை குறைவாக சேர்க்கவும். அதிகமாக இருந்தால் அனைவரும் 1987 இலிருந்து ஒரு சோப் ஓபரா போல் இருப்பார்கள்.
AI சாறுடன் கூடிய திறந்த மூல பட எடிட்டர்கள்: GIMP, Krita மற்றும் நண்பர்கள்
- AI செருகுநிரல்களுடன் GIMP: கொஞ்சம் கடினமானது, ஆனால் தொகுதி திருத்தங்கள் மற்றும் முகமூடிகளுக்கு திறமையானது.
- Krita (மீண்டும்): இயற்கையான ஓவியம், வசதியான உள் ஓவியம்.
- Blender (ஆம், Blender): ஒரு பட கருவி அல்ல, ஆனால் நீங்கள் கட்டமைப்புகள், விளக்கு குறிப்புகள் அல்லது பின்னணி தகடுகளை உருவாக்கினால், Blender மற்றும் AI டெக்ஸ்சர் அதிகரிப்பு ஒரு சக்திவாய்ந்த கலவையாகும்.
வன்பொருள்: யாரும் படிக்க விரும்பாத பகுதி (ஆனால் எல்லோரும் செலுத்துகிறார்கள்)
- VRAM உங்கள் வாழ்க்கையை ஆளுகிறது. 8GB தரை; 12GB வேலை செய்யக்கூடியது; 24GB இல் நீங்கள் தொகுதி அளவுகளுக்கு மன்னிப்பு கேட்பதை நிறுத்துவீர்கள்.
- NVIDIA திறந்த மூல AI சூழலில் சிறந்த ஆதரவைக் கொண்டுள்ளது. AMD மேம்பட்டு வருகிறது, Apple Silicon SDXL உடன் அதிர்ச்சியூட்டும் வகையில் ஒழுக்கமானது - ஆனால் உங்களுக்கு குறைவான தலைவலிகள் தேவைப்பட்டால், CUDA தான் குறைந்த எதிர்ப்பின் பாதை.
- வட்டு இடம்: மாதிரிகள் பெரியவை. ஒரு க்யூரேட்டட் நூலகத்தை வைத்திருங்கள் மற்றும் நீங்கள் பயன்படுத்தாததை காப்பகப்படுத்தவும். சேகரிப்பது ஒரு வியூகம் அல்ல.
தனியுரிமை மற்றும் விதிமுறைகள்: திறந்த மூலம் இங்கே இருப்பதற்கான காரணம்
திறந்த மூல AI பட கருவிகள் செலவைப் பற்றியது மட்டுமல்ல. அவை கட்டுப்பாட்டைப் பற்றியது. உள்நாட்டில் இயக்குவது என்றால் உங்கள் பணி-முன்னேற்றம், உங்கள் வாடிக்கையாளர் சொத்துக்கள், உங்கள் தயாரிப்பு ரெண்டர்கள் மற்றும் உங்கள் அறிவிக்கப்படாத வடிவமைப்புகள் உங்கள் கணினியில் இருக்கும். “எங்கள் சேவையை மேம்படுத்த உங்கள் தரவை நாங்கள் பயன்படுத்தலாம்” என்ற அடிக்குறிப்புகள் இல்லை, சட்டத்துறையிலிருந்து தூக்கமில்லாத நள்ளிரவு மின்னஞ்சல்கள் இல்லை.
அதுதான் உண்மையான ஈர்ப்பு. “இலவசம்” மட்டுமல்ல, “உங்களுடையது”.
குறுகிய பட்டியல்: படைப்பாளிகளுக்கான சிறந்த திறந்த மூல AI பட கருவிகள்
- Stable Diffusion SDXL மற்றும் SD 1.5: நீங்கள் உண்மையில் பயன்படுத்தும் முக்கிய ஜெனரேட்டர்கள்.
- ComfyUI: குழாய்த்திட்ட-தரம் பணிப்பாய்வுகள் மற்றும் இனப்பெருக்கம் செய்யக்கூடிய தன்மைக்கு.
- Automatic1111: வேகமான மறு செய்கை மற்றும் ஒரு பெரிய செருகுநிரல் சுற்றுச்சூழல் அமைப்புக்கு.
- InvokeAI: ஒரு அமைதியான, ஸ்டுடியோ போன்ற சூழலுக்கு.
- ControlNet: போஸ், ஆழம் மற்றும் வரி கட்டுப்பாடு வெளியீடு கீழ்ப்படிய வைக்கிறது.
- LoRA/Textual Inversion: சிறிய கோப்புகளுடன் பாணி மற்றும் தன்மை நிலைத்தன்மைக்கு.
- ESRGAN/Real-ESRGAN: உங்கள் படத்தின் ஆன்மாவை அழிக்காத அதிகரிப்புக்கு.
- Krita (SD செருகுநிரல்களுடன்): ஒரு உண்மையான கலை பயன்பாட்டில் ஓவியக் கட்டுப்பாடுக்கு.
- Deforum/Animatediff: ஒரு திரைப்பட பள்ளி தேவையில்லாத இயக்க சோதனைகளுக்கு.
குழிகள் மற்றும் நடைமுறை திருத்தங்கள்
- அதிக தூண்டுதல்: உங்கள் தூண்டுதல் ஒரு கப்பம் குறிப்பு போல் படித்தால், உங்கள் படம் ஒன்றைப் போல் இருக்கும். குறைவான வார்த்தைகள், வலுவான சமிக்ஞைகள்.
- அதிகப்படியான கூடுதல் பொருட்கள்: ControlNet அடுக்கி வைப்பது ஒரு இழுபறிப் போட்டியாக மாறும். முக்கியமான இரண்டைத் தேர்வு செய்யவும்.
- மாடல் ரூலட்: ஒவ்வொரு ஐந்து நிமிடங்களுக்கும் மாதிரிகளை மாற்றுவது உங்கள் பாணி நிலைத்தன்மையை அழிக்கிறது. ஒரு சிறிய தொகுப்பிற்கு உறுதிபூணுங்கள்.
- விதைகளை புறக்கணித்தல்: மீண்டும் செய்யக்கூடிய விதைகளை வைத்திருங்கள். ஒழுங்கமைக்கப்பட்டதற்காக எதிர்கால நீங்கள் கடந்த கால உங்களுக்கு நன்றி தெரிவிப்பார்.
“சிறந்தது” உங்கள் காலக்கெடுவைப் பொறுத்தது
- இறுக்கமான காலக்கெடு, கருத்துக் கலை: SD 1.5 + ControlNet Lineart + A1111. வேகமாக, மன்னிக்கக்கூடியது, போதுமானது.
- போர்ட்ஃபோலியோ துண்டு, பகட்டான: SDXL + ComfyUI + கைமுறையாக சரிசெய்யப்பட்ட LoRA கள். மெதுவாக இருப்பது மென்மையானது, மென்மையானது வேகமாக இருக்கும்.
- தயாரிப்பு மாதிரிகள், ஒளிப்படவியல்: SDXL + விளக்கு LoRA கள் + குறிப்பு புகைப்படங்கள் + ESRGAN. சலிப்பாக வைத்திருங்கள்; சலிப்பாக இருப்பது உண்மையாகத் தெரிகிறது.
- அனிமேஷன் சோதனை: Animatediff + கண்டிப்பான தூண்டுதல்கள் + குறுகிய சுழல்கள். சிறிய வெற்றிகளை அனுப்பவும்.
Sider.AI எங்கே பொருந்துகிறது (மற்றும் எங்கே பொருந்தாது) நீங்கள் தூண்டுதல்கள், பாணி குறிப்புகள் மற்றும் மீண்டும் செய்யக்கூடிய பணிப்பாய்வுகளை கருவிகள் முழுவதும் கையாளும் போது Sider.AI உண்மையில் உதவுகிறது. இது மற்றொரு “மந்திர மாதிரி” அல்ல - இது தூண்டுதல்களைச் சேமிக்கவும், வகைகளை ஒப்பிடவும் மற்றும் திறந்த மூல UI காற்றுக்கு சிதறடிக்கும் காகிதப் பாதையை வைத்திருக்கவும் ஒரு விவேகமான இடம். ComfyUI அல்லது A1111 இல் நீங்கள் ஒட்டக்கூடிய நிலையான சுருக்கங்களை உருவாக்கவும், உங்கள் சிறந்த திறந்த மூல AI பட கருவிகள் ஸ்டேக்கிற்கு ஆவணப்படுத்தவும், விதைகள் மற்றும் LoRA களை கண்காணிக்கவும் இதைப் பயன்படுத்தவும். வேறுவிதமாகக் கூறினால், குறைந்த யாக்-ஷேவிங், அதிக கப்பல். இது Stable Diffusion அல்லது Krita வை மாற்றாது. இது அவற்றின் பயன்பாட்டை குறைவான குழப்பமாக்கும். இரண்டு வாரங்களுக்கு முன்பு ஒரு தோற்றத்தை மீண்டும் உருவாக்க முயற்சிப்பதில் நீங்கள் ஒரு பிற்பகலைச் செலவழித்திருந்தால், “எப்போதையும் விட கூர்மையான” செக்பாயிண்டை விட இது மதிப்புமிக்கது.
வயதுக்கு ஏற்ற படைப்பாளர் பணிப்பாய்வுகள்
- நூலக மனநிலை: உங்கள் செக்பாயிண்டுகள், LoRA க்கள் மற்றும் ControlNet எடைகளை க்யூரேட் செய்யுங்கள். வேறு யாராவது புரிந்து கொள்ள வேண்டும் என்பது போல் அவர்களுக்கு பெயரிடுங்கள்.
- டெம்ப்ளேட்கள் சாரக்கட்டு: பொதுவான வேலைகளுக்கு ComfyUI வரைபடங்களையும் A1111 தூண்டுதல் முன்னமைவுகளையும் சேமிக்கவும். டெம்ப்ளேட்கள் கைகாடிகள், விலங்குகள் அல்ல.
- குறிப்பு-முதல்: மாதிரி நல்ல உள்ளீடுகளை ஊட்டுங்கள்: போஸ் ரெஃப்கள், விளக்கு ரெஃப்கள், வண்ணத் தட்டுகள். AI சுவையை அதிகரிக்கிறது; அது அதை உருவாக்காது.
- படங்களுக்கான பதிப்பு கட்டுப்பாடு: விதைகள், தூண்டுதல்கள் மற்றும் அமைப்புகளை படங்களுக்கு அடுத்ததாக வைத்திருங்கள். வெளியீடுகளை கோட் பில்ட்ஸ் போல நடத்துங்கள்.
வாதவியல்: திறந்த மூல சுதந்திரம் vs. நேர வரி
திறந்த மூல AI பட கருவிகள் மிகவும் விடுதலையான மற்றும் மிகவும் கோருகின்ற வேலை செய்யும் வழி. நீங்கள் அமைவுக்கான சந்தாக்களை, நெகிழ்வுத்தன்மைக்கான காட் ரெயில்களை, கட்டுப்பாட்டுக்கான நிலைத்தன்மையை வர்த்தகம் செய்கிறீர்கள். சில நாட்களில் இது யூனிக்ஸ் டெஸ்க்டாப் சகாப்தம் போல் உணர்கிறது - நீங்கள் கையேட்டைப் படித்தால் முடிவில்லாத சக்தி. மற்ற நாட்களில் இது சாத்தியமான சிறந்த வழியில் ஏமாற்றுவது போல் உணர்கிறது.
தொழில்துறை வரி “ஜனநாயகம்” என்று கூறுகிறது. உண்மை என்னவென்றால் கைவினை. எந்த கருவியும் சுவையை அகற்றாது, எந்த மாதிரியும் உங்களைத் தேர்ந்தெடுப்பதில் இருந்து விடுவிக்காது. சிறந்த திறந்த மூல AI பட கருவிகள் சிறந்த வேலையை உருவாக்காது; அவை அதை வேகமாக வடிவமைக்கவும், மேலும் மேலும் திரும்பச் செய்யவும் மற்றும் செயல்முறையை உங்களுடையதாக வைத்திருக்கவும் உங்களை அனுமதிக்கின்றன.
அது உண்மையான சுதந்திரம் போல் இருந்தால் - மற்றும் மார்க்கெட்டிங் வகை அல்ல - இந்த கருவிகள் யாருக்காக உருவாக்கப்பட்டனவோ அவர்கள்தான் நீங்கள். ஒன்றை மட்டும் நினைவில் கொள்ளுங்கள்: நாய்க்குட்டி இலவசம். உணவு, பயிற்சி மற்றும் நேரம் இலவசம் அல்ல.
அடிக்கடி கேட்கப்படும் கேள்விகள்
கே: வேகமான உருவாக்கத்திற்கான சிறந்த திறந்த மூல AI பட கருவிகள் என்ன?
ப: Automatic1111 உடன் Stable Diffusion SD 1.5 தூண்டுதலிலிருந்து படத்திற்கான விரைவான பாதை. அமைப்புக்கு ControlNet லைனார்ட் அல்லது போஸைச் சேர்க்கவும், மேலும் நீங்கள் மணிநேரங்களுக்கு பதிலாக நிமிடங்களில் பயன்படுத்தக்கூடிய கருத்துக் கலையைப் பெறுவீர்கள்.
கே: ஒளிப்படவியலுக்கு எந்த திறந்த மூல AI பட கருவிகள் சிறந்தவை?
ப: சுத்தமான செக்பாயிண்ட் மற்றும் விளக்கு LoRA களுடன் SDXL பொதுவாக வெல்கிறது. ControlNet வழியாக குறிப்பு புகைப்படங்களைப் பயன்படுத்தவும் மற்றும் கவனமாக ESRGAN அதிகரிப்புடன் முடிக்கவும் - ஒளிப்படவியல் என்பது பெரும்பாலும் வடிவியல் மற்றும் ஒளி, “தலைசிறந்த படைப்பு” ஸ்பேம் அல்ல.
கே: நான் ComfyUI அல்லது Automatic1111 ஐப் பயன்படுத்த வேண்டுமா?
ப: உங்களுக்கு வேகம் மற்றும் ஒரு பெரிய செருகுநிரல் சுற்றுச்சூழல் அமைப்பு தேவைப்பட்டால், Automatic1111 ஐத் தேர்வு செய்யவும். இனப்பெருக்கம் செய்யக்கூடிய தன்மை மற்றும் குழாய்த்திட்ட கட்டுப்பாடு பற்றி நீங்கள் கவலைப்பட்டால், ComfyUI சிறந்தது - நோட் கிராப் கற்றல் வளைவை ஏற்றுக்கொள்ளுங்கள்.
கே: திறந்த மூல கருவிகளுடன் படங்களுக்கு குறுக்கே பாணியை எவ்வாறு நிலைநிறுத்துவது?
ப: LoRA களின் ஒரு சிறிய தொகுப்பைப் பயிற்றுவிக்கவும் அல்லது தத்தெடுக்கவும் மற்றும் விதைகள், தூண்டுதல்கள் மற்றும் அமைப்புகள் பதிப்பு செய்யப்பட வேண்டும். நிலைத்தன்மை மந்திரம் அல்ல; இது ஆவணப்படுத்தல் மற்றும் மாதிரி மாறுதலில் கட்டுப்பாடு.
கே: திறந்த மூல பட பணிப்பாய்வில் Sider.AI எங்கே உதவுகிறது?
ப: Sider.AI உங்கள் தூண்டுதல்கள், விதைகள் மற்றும் மாறுபாடுகளை ஒழுங்கமைக்கிறது, எனவே நீங்கள் யூகிப்பதற்கு பதிலாக முடிவுகளை மீண்டும் உருவாக்கலாம். திறந்த மூல ஸ்டேக்கிற்கான காணாமல் போன நினைவகமாக இதைக் கருதுங்கள், இது சக்திவாய்ந்ததாக இருந்தாலும் வடிவமைப்பின் மூலம் மறக்கக்கூடியது. அடிக்கடி கேட்கப்படும் கேள்வி
கே1: வேகமான உருவாக்கத்திற்கான சிறந்த திறந்த மூல AI பட கருவிகள் என்ன?
Automatic1111 உடன் Stable Diffusion 1.5 உங்களை தூண்டுதலிலிருந்து படத்திற்கு விரைவாக அழைத்துச் செல்கிறது. போஸ் அல்லது விளிம்புகளுக்கான ControlNet ஐச் சேர்க்கவும், மேலும் நீங்கள் ஐந்து வெவ்வேறு பயன்பாடுகளை டக்ட்-டேப்பிங் செய்யாமல் பயன்படுத்தக்கூடிய கருத்துக் கலையைப் பெறுவீர்கள்.
கே2: ஒளிப்படவியலுக்கு எந்த திறந்த மூல AI பட கருவிகள் சிறப்பாகச் செயல்படுகின்றன?
திடமான செக்பாயிண்டுகள் மற்றும் விளக்கு LoRA களுடன் SDXL ஒரு நடைமுறைத் தேர்வு. குறிப்பு புகைப்படங்களுடன் ControlNet ஐப் பயன்படுத்தவும் மற்றும் மிருதுவான, நம்பகமான விவரங்களுக்கு ESRGAN அதிகரிப்புடன் முடிக்கவும்.
கே3: படைப்பாளர்களுக்கு ComfyUI Automatic1111 ஐ விட சிறந்ததா?
மீண்டும் உருவாக்கக்கூடிய குழாய்த்திட்டங்கள் மற்றும் குழு பணிப்பாய்வுகளுக்கு ComfyUI சிறந்தது; விரைவான மறு செய்கை மற்றும் செருகுநிரல்களுக்கு Automatic1111 சிறந்தது. நீங்கள் வேகம் அல்லது கட்டுப்பாடு அதிகமாக மதிப்பிடுகிறீர்களா என்பதை அடிப்படையாகக் கொண்டு தேர்வு செய்யவும்.
கே4: திறந்த மூல AI கருவிகளைப் பயன்படுத்தி பாணியை எவ்வாறு நிலைநிறுத்துவது?
LoRA கள் மற்றும் செக்பாயிண்டுகளின் ஒரு சிறிய தொகுப்பிற்கு ஒட்டிக்கொள்க மற்றும் ஒவ்வொரு ஏற்றுமதியுடனும் விதைகளைச் சேமிக்கவும். நிலைத்தன்மை ஆவணப்படுத்தல் மற்றும் கட்டுப்பாட்டில் இருந்து வருகிறது, நீண்ட தூண்டுதல்கள் அல்ல.
Q5: திறந்த மூல பட வேலைப்பணியில் Sider.AI எங்கே பொருந்துகிறது?
Sider.AI உந்துதல்கள், விதைகள் மற்றும் பதிப்புகளை ஒழுங்கமைக்க உதவுகிறது, இதன் மூலம் நீங்கள் தேவைக்கேற்ப தோற்றங்களை மீண்டும் உருவாக்கலாம். இது Stable Diffusion-ஐ மாற்றாது; இது உங்கள் ஸ்டேக்கை குறைவான குழப்பமானதாகவும், மேலும் மீண்டும் செய்யக்கூடியதாகவும் ஆக்குகிறது.