"பரவல் மாதிரிகளை (diffusion models) மந்திரம் போல உணர வைப்பது எது?"
"ஒற்றை புள்ளிகள் நிறைந்த திரை, படிப்படியாக ஒளிப்படத் தத்ரூப உருவமாகவோ, வாட்டர்கலர் நகரக் காட்சியாகவோ அல்லது நியான்-சைபர்பங்க் நரியாகவோ மாறுகிறது. செயற்கை நுண்ணறிவு கலை நிலையான மங்கலில் இருந்து விரிவான படங்களாக மாறுவதை நீங்கள் பார்த்திருந்தால், அங்கு பரவல் மாதிரிகள் (diffusion models) செயல்படுவதைக் கண்டிருப்பீர்கள். இந்த ஆழமான ஆய்வில், செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கு பரவல் மாதிரிகள் (diffusion models) எவ்வாறு செயல்படுகின்றன, அவை ஏன் முந்தைய முறைகளை விடச் சிறப்பாகச் செயல்படுகின்றன, மேலும் ஒரு PhD பட்டம் தேவையில்லாமல் ஒரு ஆக்கப்பூர்வமான இயக்குனரைப் போல அவற்றை எவ்வாறு வழிநடத்தலாம் என்பதைப் பார்ப்போம்."
"நாங்கள் நடைமுறை மற்றும் தீர்வு சார்ந்த அணுகுமுறையை பின்பற்றுவோம்: தெளிவான விளக்கங்கள், நிஜ உலக உதாரணங்கள் மற்றும் நவீன பரவல் அமைப்புகளிலிருந்து (diffusion systems) சிறந்த முடிவுகளைப் பெறக்கூடிய செயல் சார்ந்த குறிப்புகள்."
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம்"
- "பரவல் மாதிரிகள் (diffusion models), படிப்படியாக இரைச்சல் செயல்முறையை மாற்றுவதன் மூலம் சீரற்ற இரைச்சலை (random noise) ஒருங்கிணைந்த படங்களாக மாற்றுகின்றன."
- "பெரிய தரவுத்தொகுப்புகள் மற்றும் வழிகாட்டுதல் (உரை தூண்டுதல்கள் போன்றவை) மூலம் இரைச்சலைக் குறைக்க அவை கற்றுக்கொள்கின்றன, இது படத்தை உங்கள் நோக்கத்திற்கு ஏற்ப வழிநடத்துகிறது."
- "முக்கிய கூறுகள்: முன்னோக்கிய பரவல் (இரைச்சல் சேர்), தலைகீழ் செயல்முறை (இரைச்சல் அகற்று), ஒரு U-Net இரைச்சல் குறைப்பான், இரைச்சல் அட்டவணைகள் மற்றும் வழிகாட்டுதல் அளவுகள்."
- "புதிய மாறுபாடுகள் (உறைந்த பரவல், ஒருமைப்பாடு மாதிரிகள், சரி செய்யப்பட்ட ஓட்டங்கள் மற்றும் வீடியோ பரவல்) உருவாக்கத்தை வேகமாகவும், கூர்மையாகவும், கட்டுப்படுத்தக்கூடியதாகவும் ஆக்குகின்றன."
- "நடைமுறை வெற்றிகள்: முதன்மை தூண்டுதல் அமைப்பு, வழிகாட்டுதல் அளவு, படிகள், விதைகள் மற்றும் குறிப்பு நிபந்தனை (image, layout, style) ஆகியவற்றில் தேர்ச்சி பெறுங்கள்."
"பெரிய யோசனை: யதார்த்தத்தின் இரைச்சலைக் குறைக்க கற்றுக்கொள்ளுங்கள்"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கத்தின் மையத்தில் ஒரு ஆச்சரியமான எளிய சுழற்சி உள்ளது:"
- "முன்னோக்கிய செயல்முறை: ஒரு உண்மையான படத்தை எடுத்து, பல படிகளில் படிப்படியாக காஸியன் இரைச்சலை (Gaussian noise) சேர்க்கவும், அது தூய இரைச்சலாக மாறும் வரை."
- "தலைகீழ் செயல்முறை: அந்த இரைச்சலை ஒரு நேரத்தில் ஒரு படி அகற்ற ஒரு நரம்பியல் வலையமைப்பிற்குப் பயிற்சி அளிக்கவும், அது ஒரு தெளிவான படத்தை மீண்டும் உருவாக்கும் வரை."
"பயிற்சியின் போது, மாதிரி சுத்தமான படம் மற்றும் அதன் இரைச்சல் பதிப்பு இரண்டையும் மீண்டும் மீண்டும் பார்த்து, இரைச்சலை (noise) அல்லது சுத்தமான படத்தை கணிக்க கற்றுக்கொள்கிறது. பயிற்சி பெற்றதும், நீங்கள் தூய இரைச்சலில் (pure noise) இருந்து தொடங்கி, உங்கள் தூண்டுதலுக்கு பொருந்தக்கூடிய ஒரு புதிய படத்தை உருவாக்க தலைகீழ் செயல்முறையை இயக்கலாம்."
"இது ஏன் மிகவும் நன்றாக வேலை செய்கிறது: பிக்சல்களை நேரடியாக கணிப்பதை விட இரைச்சலைக் (noise) கணிப்பது எளிதானது மற்றும் மிகவும் நிலையானது, மேலும் பல-படி செம்மைப்படுத்துதல் சிறந்த விவரம் மற்றும் உலகளாவிய ஒருமைப்பாட்டைத் தருகிறது."
"பரவல் மாதிரியின் உடற்கூறியல் (கணித தலைவலி இல்லாமல்)"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கத்தை முக்கிய கூறுகளுடன் பார்ப்போம்:"
- "இரைச்சல் அட்டவணை: பயிற்சியில் ஒவ்வொரு அடியிலும் எவ்வளவு இரைச்சல் சேர்க்கப்படுகிறது மற்றும் உருவாக்கத்தின் போது அகற்றப்படுகிறது என்பதை தீர்மானிக்கும் கால அட்டவணை. பொதுவான அட்டவணைகளில் நேரியல் அல்லது கொசைன் ஆகியவை அடங்கும்; அவை கூர்மை, விவரம் மற்றும் உறுதிப்பாடு ஆகியவற்றை வடிவமைக்கின்றன."
- "இரைச்சல் குறைப்பான் முதுகெலும்பு (பொதுவாக ஒரு U-Net): ஒவ்வொரு அடியிலும் இரைச்சலை மதிப்பிடும் ஸ்கிப் இணைப்புகளுடன் கூடிய ஒரு கன்வோல்யூஷனல் நரம்பியல் நெட்வொர்க். விவரங்களை கூர்மைப்படுத்தும் போது கட்டமைப்பைப் பாதுகாப்பதில் U-Net சிறந்து விளங்குகிறது."
- "நேர உட்பொதிவு: மாதிரி எந்த படியில் உள்ளது என்பதை அறிய வேண்டும்; சைனுசாய்டல் அல்லது கற்றல் உட்பொதிவுகள் அந்த "நேர" தகவலைச் சேர்க்கின்றன."
- "நிபந்தனை: ரகசிய சாஸ். உரை (CLIP போன்ற குறியாக்கிகள் மூலம்), image குறிப்புகள், style உட்பொதிவுகள், layout வரைபடங்கள் அல்லது ஆழம்/எட்ஜ் வரைபடங்கள் கூட நீங்கள் விரும்புவதைப் நோக்கி இரைச்சல் குறைப்பானை வழிநடத்துகின்றன."
- "மாதிரி: தலைகீழ் செயல்முறையை இயக்கும் வழிமுறை (எ.கா., DDPM, DDIM, PLMS, Euler, DPM++). வெவ்வேறு மாதிரிகள் வேகம், கூர்மை மற்றும் யதார்த்தத்தை மாற்றுகின்றன."
"பிக்சல்களில் இருந்து மறைந்திருக்கும் நிலைக்கு: ஏன் Stable Diffusion மிகவும் வேகமாக உள்ளது"
"ஆரம்பகால பரவல் மாதிரிகள் (diffusion models) நேரடியாக பிக்சல் இடத்தில் வேலை செய்தன - அழகான முடிவுகள், ஆனால் மெதுவாக இருந்தன. மறைந்திருக்கும் பரவல் மாதிரிகள் (Latent Diffusion Models (LDMs)), Variational Autoencoder (VAE) ஐப் பயன்படுத்தி படங்களை சிறிய, கற்ற மறைந்திருக்கும் இடத்திற்கு அழுத்துகின்றன. இந்த சிறிய இடத்தில் பரவல் ஏற்படுகிறது, பின்னர் ஒரு டிகோடர் முழு தெளிவுத்திறனுக்கு மீண்டும் அதிகரிக்கிறது."
"நீங்கள் உணரக்கூடிய நன்மைகள்:"
- "பிக்சல்-இட பரவலை விட 10–50 மடங்கு வேக அதிகரிப்பு."
- "அதிக கணக்கீட்டு செலவில்லாமல் அதிக தெளிவுத்திறன்."
- "Style பரிமாற்றம் மற்றும் பட எடிட்டிங் மிகவும் நடைமுறைக்குரியதாகின்றன."
"இது பிரபலமான AI கலை கருவிகளின் முதுகெலும்பாகும், அங்கு செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம் பெரும்பாலும் "வலுவான உரை குறியாக்கியுடன் உரை-நிபந்தனை மறைந்திருக்கும் பரவல்" (text-conditional latent diffusion) என்று பொருள்படும்."
"உரையிலிருந்து படத்திற்கு: உங்கள் வார்த்தைகள் எவ்வாறு இரைச்சலை வழிநடத்துகின்றன"
"உரை நிபந்தனை ஒவ்வொரு அடியிலும் இரைச்சல் குறைப்பு திசையைத் தூண்டும் திசையன்களாக வார்த்தைகளை மாற்றுகிறது. நடைமுறையில்:"
- "ஒரு உரை குறியாக்கி (எ.கா., CLIP, T5) "சாயும் நேரத்தில் வாட்டர்கலர் வானலை, மென்மையான டோன்கள், மென்மையான விளக்குகள்" என்பதை உட்பொதிவுகளாக மாற்றுகிறது."
- "பரவல் மாதிரி மறைந்திருக்கும் இரைச்சலுடன் இந்த உட்பொதிவுகளில் கலந்துகொள்கிறது."
- "வழிகாட்டுதல் நுட்பம் (வகைப்படுத்தி இல்லாத வழிகாட்டுதல் போன்றவை) "நிபந்தனையற்ற" படத்திற்கு முந்தையதை விட உரையின் செல்வாக்கை அதிகரிக்கிறது."
"உரையிலிருந்து படத்திற்கு டியூன் செய்வது ஒரு கலை:"
- "வழிகாட்டுதல் அளவு: அதிக மதிப்புகள் படத்தை உங்கள் தூண்டுதலுக்கு நெருக்கமாகத் தள்ளும் (அதிக நேரடியான), ஆனால் அதிகமாக இருந்தால் கலைப்பொருட்கள் அல்லது அதிகப்படியான செறிவு ஏற்படலாம். தொடங்க 5–9 ஐ முயற்சிக்கவும்."
- "படிகள்: அதிக படிகள் பெரும்பாலும் மென்மையான, அதிக விவரமான முடிவுகளைத் தருகின்றன; பல மாதிரிகளுக்கு 20–40 ஒரு நல்ல இடமாகும்."
- "எதிர்மறை தூண்டுதல்கள்: எதைத் தவிர்க்க வேண்டும் என்று மாதிரிக்குச் சொல்லுங்கள் ("மங்கலான," "கூடுதல் விரல்கள்," "குறைந்த மாறுபாடு") - வெளியீடுகளை மெருகூட்டுவதற்கு மிகவும் பயனுள்ளதாக இருக்கும்."
"படத்திலிருந்து படத்திற்கு, உள் ஓவியம் மற்றும் கட்டுப்பாடு: தூய உரைக்கு அப்பால்"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம் உரை தூண்டுதல்களைப் பற்றியது மட்டுமல்ல. நீங்கள் கட்டமைப்பு, கலவை மற்றும் பாணியை இதன் மூலம் வழிநடத்தலாம்:"
- "படத்திலிருந்து படத்திற்கு: ஒரு மூல படம் மற்றும் ஒரு தூண்டுதலை வழங்கவும். வெளியீடு மூலத்திலிருந்து எவ்வளவு விலகிச் செல்கிறது என்பதை வலிமை அளவுரு கட்டுப்படுத்துகிறது."
- "உள் ஓவியம்: மாற்றுவதற்கு ஒரு பகுதியை மறைக்கவும். மாதிரி அந்த பகுதியை மட்டும் நிரப்புகிறது, தடையற்ற எடிட்டிங்கிற்கான சூழலுடன் கலக்கிறது (பொருள் அகற்றுதல் அல்லது ஆடை மாற்றங்கள் பற்றி சிந்தியுங்கள்)."
- "கட்டுப்பாட்டு வலைகள் (ControlNets): விளிம்புகள், போஸ், ஆழம் அல்லது பிரிவினை ஆகியவற்றில் பரவல் செயல்முறையை நிபந்தனை செய்யும் கூடுதல் நெட்வொர்க்குகள், தளவமைப்பு மற்றும் போஸில் பிக்சல்-நிலை கட்டுப்பாட்டை வழங்குகின்றன."
- "LoRA/உட்பொதிவுகள்: முழு மாதிரியையும் மீண்டும் பயிற்சி செய்யாமல் புதிய பாணிகள் அல்லது எழுத்துக்களைச் சேர்க்கும் இலகுரக அடாப்டர்கள் அல்லது கற்ற டோக்கன்கள்."
"மாதிரிகள் டிகோட் செய்யப்பட்டன: உங்கள் படங்கள் Euler அல்லது DPM++ உடன் ஏன் வித்தியாசமாகத் தெரிகின்றன"
"மாதிரிகள் தலைகீழ் பரவல் பாதையை கட்டுப்படுத்துகின்றன. ஒரே காட்சிக்கான வெவ்வேறு கேமரா லென்ஸ்கள் என்று நினைத்துப் பாருங்கள்:"
- "DDIM: வேகமான, மென்மையான பாதைகள் குறைவான படிகளுடன் - நல்ல பொது-நோக்க அடிப்படை."
- "PLMS: போலி-நேரியல் மல்டிஸ்டெப் மிதமான வேகத்தில் விவரம் மற்றும் நிலைத்தன்மையை மேம்படுத்துகிறது."
- "Euler/Euler a: மிருதுவான அமைப்புகள்; "Euler a" கட்டுப்படுத்தப்பட்ட சீரற்ற தன்மையைச் சேர்க்கிறது."
- "DPM++ (2M/2S/3M): குறைவான படிகளில் கூர்மை மற்றும் நிலைத்தன்மைக்கான அதிநவீன தொழில்நுட்பம்."
"நடைமுறை குறிப்பு: ஒரு படம் அதிகமாக மென்மையாக்கப்பட்டதாக தோன்றினால், Euler a அல்லது DPM++ 2M SDE ஐ முயற்சிக்கவும். அது மிகவும் இரைச்சலாக இருந்தால், படிகளை அதிகரிக்கவும் அல்லது DDIM போன்ற ஒரு உறுதியான மாதிரியை முயற்சிக்கவும்."
"விதைகள் மற்றும் இனப்பெருக்கம்: மகிழ்ச்சியான விபத்துக்களை மீண்டும் செய்யக்கூடியதாக ஆக்குங்கள்"
"ஒரு விதை சீரற்ற இரைச்சலைத் தொடங்குகிறது. சிறிய மாறுபாடுகளுடன் அதே கலவையை மீண்டும் உருவாக்க விதையை வைத்திருங்கள்:"
- "அதே விதை + அதே தூண்டுதல் + அதே அமைப்புகள் = கிட்டத்தட்ட ஒரே மாதிரியான முடிவுகள்."
- "வெவ்வேறு கலவைகளை விரைவாக ஆராய விதையை மாற்றவும்."
- "வாக்குறுதியளிக்கும் தளவமைப்புகளைக் கண்டறிய விதை ஸ்வீப்களைப் பயன்படுத்தவும், பின்னர் வழிகாட்டுதல் அளவு மற்றும் படிகளைச் செம்மைப்படுத்தவும்."
"கலைக்கான பழைய அணுகுமுறைகளை பரவல் ஏன் அடிக்கிறது"
"GAN கள் (Generative Adversarial Networks) பல ஆண்டுகளாக தங்கத் தரமாக இருந்தன, ஆனால் முறை சரிவு மற்றும் பயிற்சி உறுதியற்ற தன்மையால் பாதிக்கப்பட்டன. ஆட்டோ ரெக்ரஸிவ் மாதிரிகள் (auto regressive models) (ஆரம்ப டிரான்ஸ்பார்மர் அடிப்படையிலான பட ஜெனரேட்டர்கள் போன்றவை) அதிக நம்பகத்தன்மை கொண்டதாக இருக்கலாம், ஆனால் மெதுவாக இருக்கும்."
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம் தெளிவான நன்மைகளைக் காட்டுகிறது:"
- "நிலைத்தன்மை: GAN களை விட பயிற்சி எளிமையானது மற்றும் வலிமையானது."
- "பன்முகத்தன்மை: முறை சரிவு சிக்கல்கள் குறைவு, மாறுபட்ட பாணிகள் மற்றும் கலவைகளை செயல்படுத்துகிறது."
- "விவரம்: பல-படி செம்மைப்படுத்துதல் மிருதுவான அமைப்புகள் மற்றும் உலகளாவிய ஒருமைப்பாட்டைத் தருகிறது."
- "கட்டுப்பாடு: நிபந்தனை முறைகள் (உரை, படம், கட்டுப்பாட்டு வலைகள் (ControlNets)) நுணுக்கமான திசையை வழங்குகின்றன."
"உள்ளே: நோக்கத்தைப் பற்றிய ஒரு மென்மையான பார்வை"
"பெரும்பாலான பரவல் மாதிரிகள் (diffusion models) ஒவ்வொரு படி t இல் சேர்க்கப்படும் இரைச்சல் ε ஐக் கணிக்கக் கற்றுக்கொள்கின்றன, கணிக்கப்பட்ட மற்றும் உண்மையான இரைச்சலுக்கு இடையிலான இடைவெளியைக் குறைக்கின்றன. வகைப்படுத்தி இல்லாத வழிகாட்டுதல், உங்கள் தூண்டுதலுடன் ஒரு முறை மற்றும் "நிபந்தனையற்ற" ஒரு முறை என இரண்டு முறை மாதிரியை இயக்குவதன் மூலம் செயல்படுகிறது - மேலும் உங்கள் தூண்டுதலை நோக்கி சாய்வதற்கு வெளியீடுகளை இணைக்கிறது."
"அவற்றை நன்றாகப் பயன்படுத்த உங்களுக்கு சமன்பாடுகள் தேவையில்லை, ஆனால் இந்த அமைப்பை அங்கீகரிப்பது வழிகாட்டுதல் அளவு ஏன் முக்கியமானது என்பதை விளக்குகிறது: மிகக் குறைவாக இருந்தால் படம் விலகிச் செல்லும்; மிக அதிகமாக இருந்தால் அது டோக்கன்களைத் தூண்டி கலைப்பொருட்களை அறிமுகப்படுத்துகிறது."
"நடைமுறை விளையாட்டு புத்தகம்: தொடர்ந்து சிறந்த முடிவுகளைப் பெறுதல்"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கத்தை நம்பகமான வெளியீடுகளாக மாற்ற இங்கே ஒரு போர்-சோதனை செய்யப்பட்ட பணிப்பாய்வு உள்ளது:"
- "உங்கள் தூண்டுதலை கட்டமைக்கவும்"
- "பொருள் மூலம் தொடங்கவும்: "வெள்ளி முடி கொண்ட ஒரு ஆய்வாளரின் உருவப்படம்""
- "மாற்றியமைப்பாளர்களைச் சேர்க்கவும்: பாணி, சகாப்தம், விளக்கு, வண்ணத் தட்டு"
- "நடுத்தரத்தை குறிப்பிடவும்: வாட்டர்கலர், எண்ணெய், ஒளிப்படம், 35 மிமீ ஃபிலிம்"
- "கலவை குறிப்புகளைச் சேர்க்கவும்: நெருக்கமான, பரந்த கோணம், மூன்றில் ஒரு பங்கு விதி"
- "தரமான குறிச்சொற்களுடன் குறைவாக முடிக்கவும்: "கூர்மையான கவனம், உயர் விவரம், இயற்கை தோல் தொனி""
- "முக்கிய அளவுருக்களை சரிசெய்யவும்"
- "படிகள்: வேகம்/தர சமநிலைக்கு 25–40; சிக்கலான காட்சிகளுக்கு 60+"
- "வழிகாட்டுதல் அளவு: 5–9 வழக்கமானது; வரம்புகளை அறிய 3–12 ஐ ஆராயுங்கள்"
- "தெளிவுத்திறன்: குறுகிய விளிம்பில் 512–768 இல் தொடங்கவும்; தேவைப்பட்டால் உயர்தர அப்ஸ்கேலர்களுடன் மேம்படுத்தவும்"
- "மாதிரி: வேகத்திற்கு DDIM ஐ முயற்சிக்கவும், கூர்மைக்கு DPM++ ஐ முயற்சிக்கவும், அமைப்புக்கு Euler a ஐ முயற்சிக்கவும்"
- "எதிர்மறை தூண்டுதல்களில் தேர்ச்சி பெறுங்கள்"
- "பொதுவான எதிர்மறைகள்: "குறைந்த ரெஸ், மங்கலான, jpeg கலைப்பொருட்கள், கூடுதல் விரல்கள், சிதைந்த கைகள், வாட்டர்மார்க், உரை""
- "காட்சி-குறிப்பிட்ட எதிர்மறைகள்: "மூடுபனி, கடுமையான நிழல்கள், கழுவப்பட்ட வண்ணங்கள்""
- "குறிப்புகளைப் பயன்படுத்தவும்"
- "கட்டமைப்பைப் பராமரிக்க வலிமையுடன் 0.25–0.6 உடன் படத்திலிருந்து படத்திற்கு ஆனால் பாணியை மாற்றவும்"
- "தொடர்ச்சியான தளவமைப்புக்காக கேன்னி எட்ஜ்கள் அல்லது ஆழமான வரைபடங்களுடன் கட்டுப்பாடு வலை (ControlNet) தொடர் முழுவதும்"
- "விதைகளுடன் மீண்டும் செய்யவும்"
- "நீங்கள் கலவையை விரும்பும்போது ஒரு விதையைப் பூட்டவும்; வழிகாட்டுதல் மற்றும் படிகளை மெருகூட்ட மாறுபடும்"
- "மாறுபாடு தொகுதிகளைச் செய்யுங்கள்: விதை சரி செய்யப்பட்டது, சிறிய சீரற்ற இரைச்சல் நடுக்கம்"
- "புத்திசாலித்தனமாக பிந்தைய செயல்முறை"
- "விவரத்தைப் பாதுகாக்க வலுவான VAE அல்லது வெளிப்புற மேம்பாட்டாளரைப் பயன்படுத்தவும் (மறைந்திருக்கும் அல்லது பரவல் அடிப்படையிலானது)"
- "இறுதி பளபளப்புக்கு ஒரு புகைப்பட எடிட்டரில் ஒளி வண்ண தரப்படுத்தல் அல்லது இரைச்சலைக் குறைக்கவும்"
"மேம்பட்ட ஸ்டீயரிங்: பாணி, எழுத்துக்கள் மற்றும் காட்சிகள் மீண்டும் மீண்டும்"
- "LoRA libraries: நுட்பமான செல்வாக்கிற்காக குறைந்த எடைகளில் (0.4–0.8) style LoRA களை இணைக்கவும்; சிறந்த சமநிலைக்கு ஒன்றை அதிகமாகக் குவிப்பதற்கு பதிலாக இரண்டு லேசாக அடுக்கவும்."
- "Textual Inversion: நீங்கள் மீண்டும் பயன்படுத்த விரும்பும் பிராண்ட் எழுத்து, தயாரிப்பு அல்லது குறிப்பிட்ட கலை பாணிக்கான தனிப்பயன் டோக்கன்களைக் கற்றுக்கொள்ளுங்கள்."
- "Multi-condition control: பிரேம்கள் அல்லது பேனல்கள் முழுவதும் சினிமா நிலைத்தன்மைக்கு போஸ் + ஆழம் + சாதாரண வரைபடங்களை இணைக்கவும்."
- "Refiners: முகங்கள் அல்லது அமைப்புகளை கூர்மைப்படுத்த பிந்தைய படிகளில் ஒரு இரண்டாம் நிலை பரவல் மாதிரியைப் (diffusion model) பயன்படுத்தவும்."
"ஆன்மாவை இழக்காமல் வேகப்படுத்துதல்"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம் பெரும்பாலும் ஒரு கவலையை எழுப்புகிறது: வேகம். விருப்பங்களில் பின்வருவன அடங்கும்:"
- "குறைவான படிகள் + சிறந்த மாதிரிகள் (டியூன் செய்யப்பட்ட eta உடன் DPM++ 2M, DDIM)"
- "குறைந்த படிகளில் பல-படி முடிவுகளை நெருங்கும் வடிகட்டப்பட்ட அல்லது ஒருமைப்பாடு மாதிரிகள்"
- "மறைந்திருக்கும் மேம்பாடு: சிறியதாக உருவாக்கவும், பின்னர் விவரம் மேம்பாட்டுடன் மேம்படுத்தவும்"
- "வன்பொருள் முடுக்கம்: xFormers, ஃபிளாஷ் கவனம், TensorRT அல்லது ONNX ரன்டைம்களுடன் மேம்படுத்தவும்"
"நிலையான படங்களுக்கு அப்பால்: வீடியோ பரவல் மற்றும் இயக்கம் வழிகாட்டுதல்"
"வீடியோ பரவல் நேரத்துடன் பட பரவலை நீட்டிக்கிறது: மாதிரி தற்காலிக கவனத்துடன் ஒரு வரிசையை இரைச்சல் குறைக்கிறது, பிரேம்கள் முழுவதும் ஒருமைப்பாட்டைப் பாதுகாக்கிறது. ஆப்டிகல் ஃப்ளோ அல்லது போஸ் வரிசைகள் போன்ற கட்டுப்பாட்டு சமிக்ஞைகள் இயக்கத்தை வழிநடத்துகின்றன. எதிர்பார்க்கவும்:"
- "லூப் செய்யக்கூடிய சினிமா கிராஃப்கள் மற்றும் குறுகிய ரீல்கள்"
- "முக்கிய போஸ்களால் வழிநடத்தப்படும் நிலையான எழுத்து அனிமேஷன்"
- "கேமரா இயக்கம் மற்றும் விளக்கு தொடர்ச்சியுடன் காட்சிகளை ஒருங்கிணைக்கும் உரையிலிருந்து வீடியோ மாதிரிகள்"
"நெறிமுறைகள் மற்றும் பாதுகாப்பு: ஆக்கப்பூர்வமான சக்தி சோதனை"
"சிறந்த உற்பத்தி சக்தியுடன் பொறுப்பு வருகிறது:"
- "ஒப்புதல் மற்றும் பண்புக்கூறு: கலைஞர்களின் உரிமைகளை மதிக்கவும்; முடிந்தவரை உரிமம் பெற்ற அல்லது விருப்பத் தரவுத்தொகுப்புகளைப் பயன்படுத்தவும்."
- "சார்பு மற்றும் பிரதிநிதித்துவம்: தூண்டுதல்கள் மற்றும் தரவுத்தொகுப்புகள் சமூக சார்புகளை பிரதிபலிக்க முடியும் - அவற்றை வெளிப்படையாக எதிர்க்கவும்."
- "தவறான பயன்பாடு தடுப்பு: வாட்டர்மார்க்ஸ், ஆதார மெட்டாடேட்டா (எ.கா., C2PA) மற்றும் உள்ளடக்க வடிப்பான்கள் தீங்கு விளைவிப்பதைக் குறைக்க உதவுகின்றன."
"சரிசெய்தல்: முடிவுகள் பக்கவாட்டாகச் செல்லும்போது"
- "தூண்டுதலுக்கு அதிகமாகப் பொருந்துதல்: வழிகாட்டுதல் அளவைக் குறைக்கவும் அல்லது உரிச்சொற்களை எளிதாக்கவும்."
- "உடற்கூறியல் குறைபாடுகள்: "உடற்கூறு ரீதியாக சரியான" என்பதைச் சேர்க்கவும், முகம் அல்லது கை-குறிப்பிட்ட செம்மைப்படுத்தியைப் பயன்படுத்தவும் அல்லது போஸ் கட்டுப்பாட்டை வழங்கவும்."
- "சேற்று அமைப்புகள்: படிகளை அதிகரிக்கவும், வேறு மாதிரியை முயற்சிக்கவும் அல்லது எதிர்மறை தூண்டுதல் ஆக்கிரமிப்பை குறைக்கவும்."
- "திரும்பத் திரும்ப அல்லது ஓடு: விதையை மாற்றவும், கலவை குறிப்புகளை மாற்றவும் அல்லது எதிர்மறை தூண்டுதலுக்கு "ஓடு இல்லை" என்பதைச் சேர்க்கவும்."
"குறிப்பிடத்தக்கது: உதவி AI உடன் ஆக்கப்பூர்வமான பணிப்பாய்வுகளை நெறிப்படுத்துதல்"
"நீங்கள் தூண்டுதல்களை மீண்டும் செய்கிறீர்கள் என்றால், மாதிரிகளைச் சோதிக்கிறீர்கள், மேலும் முடிவுகளை ஒழுங்கமைக்கிறீர்கள் என்றால், பதிப்புகள், விதைகள் மற்றும் அமைப்புகளை சீரமைக்கும் ஒரு பணிச்சூழல் மணிநேரங்களைச் சேமிக்க முடியும். மூலம், Sider.AI போன்ற கருவிகள் கட்டமைக்கப்பட்ட தூண்டுதல்களை உருவாக்கவும், பக்கவாட்டாக உருவாக்கங்களை ஒப்பிடவும், அளவுரு மாற்றங்களை சுருக்கவும் உதவும், எனவே படம் உண்மையில் என்ன மேம்படுத்தியது என்பதை நீங்கள் கற்றுக்கொள்கிறீர்கள். நீங்கள் LoRA கள், கட்டுப்பாடு வலைகள் (ControlNets) மற்றும் ஒரு திட்ட சுருக்கம் முழுவதும் பல விதைகளை கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும்." "நீங்கள் இன்று செயல்படக்கூடிய முக்கிய யோசனைகள்"
- "கட்டுப்பாடுகளில் சிந்தியுங்கள்: பொருள், பாணி, கலவை, விளக்கு மற்றும் நடுத்தரம்."
- "எளிமையாகத் தொடங்கவும்; கலவையை பூட்டிய பின் மாற்றியமைப்பாளர்களைச் சேர்க்கவும்."
- "வழிகாட்டுதல் அளவு மற்றும் படிகளை வெளிப்பாடு மற்றும் ISO போல நடத்துங்கள் - அவற்றை வேண்டுமென்றே டியூன் செய்யுங்கள்."
- "துல்லியம் மற்றும் மீண்டும் செய்யக்கூடிய தன்மைக்கு எதிர்மறை தூண்டுதல்கள், கட்டுப்பாடு வலைகள் (ControlNets) மற்றும் விதைகளைப் பயன்படுத்தவும்."
- "உற்பத்திக்குத் தயாரான பளபளப்புக்கு செம்மைப்படுத்திகள் மற்றும் மேம்படுத்திகளைப் பயன்படுத்தவும்."
"பரவல் மாதிரிகளுக்கான சாலை"
"செயற்கை நுண்ணறிவு கலை உருவாக்கத்திற்கான பரவல் மாதிரிகள் (diffusion models) விளக்கம் இன்னும் வேகமாக உருவாகி வருகிறது. எதிர்பார்க்கவும்:"
- "ஒருமைப்பாடு பயிற்சி மற்றும் சரி செய்யப்பட்ட ஓட்டங்கள் மூலம் இன்னும் வேகமான மாதிரிகள்"
- "வலுவான மல்டிமோடல் நிபந்தனை (ஸ்கெட்ச்கள், ஆடியோ பீட்ஸ், தளவமைப்பு வரைபடங்கள்)"
- "காட்சிகள் மற்றும் வீடியோக்கள் முழுவதும் சிறந்த எழுத்து மற்றும் அடையாள பாதுகாப்பு"
- "உள்ளூர் ஆதாரக் குறிச்சொற்கள் மற்றும் பாதுகாப்பான இயல்புநிலைகள்"
"பிக்சல்களுக்குப் பின்னால் உள்ள மந்திரம் மந்திரம் அல்ல - இது உங்கள் நோக்கத்தால் வழிநடத்தப்படும் இரைச்சல் மற்றும் கட்டமைப்புக்கு இடையிலான ஒழுக்கமான நடனம். கட்டுப்பாடுகளில் தேர்ச்சி பெறுங்கள், பரவல் லாட்டரியாக இல்லாமல் கருவியாக மாறும்."
"FAQ"
"Q1: செயற்கை நுண்ணறிவு கலை உருவாக்கத்தில் பரவல் மாதிரிகள் (diffusion models) என்றால் என்ன?
பரவல் மாதிரிகள் (diffusion models) இரைச்சல் செயல்முறையை மாற்றியமைக்க கற்றுக்கொள்கின்றன, உங்கள் தூண்டுதலுடன் பொருந்தக்கூடிய படங்களாக சீரற்ற இரைச்சலை மாற்றுகின்றன. கற்றல் வழிகாட்டுதலுடன் படிப்படியாக இரைச்சலைக் குறைப்பதன் மூலம், அவை விரிவான, ஒத்திசைவான கலையை உருவாக்குகின்றன.
""Q2: உரை தூண்டுதல்கள் எவ்வாறு பரவல் மாதிரிகளை (diffusion models) வழிநடத்துகின்றன?
ஒரு உரை குறியாக்கி ஒவ்வொரு படியிலும் இரைச்சலைக் குறைப்பதை வழிநடத்தும் உட்பொதிவுகளாக உங்கள் தூண்டுதலை மாற்றுகிறது. வகைப்படுத்தி இல்லாத வழிகாட்டுதலுடன், படம் உங்கள் தூண்டுதலை எவ்வளவு வலுவாகப் பின்பற்றுகிறது என்பதைக் கட்டுப்படுத்துகிறீர்கள்.
""Q3: பிக்சல் பரவலை விட மறைந்திருக்கும் பரவலை ஏன் பயன்படுத்த வேண்டும்?
மறைந்திருக்கும் பரவல் சுருக்கப்பட்ட இடத்தில் இயங்குகிறது, இது அதிக தரம் பராமரிக்கும் போது உருவாக்கத்தை வேகமாகவும் நினைவகத்தை திறமையாகவும் ஆக்குகிறது. இது அதிக தெளிவுத்திறன் மற்றும் நடைமுறை எடிட்டிங் பணிப்பாய்வுகளை செயல்படுத்துகிறது.
""Q4: பரவல் மாதிரிகளுடன் AI கலைக்கு எந்த மாதிரி சிறந்தது?
இது உங்கள் இலக்குகளைப் பொறுத்தது: வேகத்திற்கு DDIM, அமைக்கப்பட்ட விவரங்களுக்கு Euler a, மற்றும் கூர்மை மற்றும் நிலைத்தன்மைக்கு DPM++ வகைகள். வலுவான தொடக்க புள்ளியாக DPM++ உடன் 25–40 படிகளை முயற்சிக்கவும்.
""Q5: கூடுதல் விரல்கள் போன்ற பொதுவான பரவல் கலைப்பொருட்களை நான் எவ்வாறு சரிசெய்வது?
எதிர்மறை தூண்டுதல்களைப் பயன்படுத்தவும் (எ.கா., 'கூடுதல் விரல்கள், சிதைந்த கைகள்'), வழிகாட்டுதல் அளவை சற்று குறைக்கவும், படிகளை அதிகரிக்கவும் அல்லது ஒரு செம்மைப்படுத்தும் மாதிரியைப் பயன்படுத்தவும். போஸ் வழிகாட்டுதலுடன் கட்டுப்பாடு வலை (ControlNet) உடற்கூறியலையும் மேம்படுத்துகிறது.
"