“Prompt Engineering” பிரச்சனையில் இருப்பது Prompts அல்ல
Sora 2 prompt engineering-ஐப் பற்றி எல்லோரும் புரிந்துகொண்டதுபோல் பாசாங்கு செய்கிறார்கள்—அவர்களது வீடியோ உருளைக்கிழங்கில் எடுக்கப்பட்ட காய்ச்சல் கனவு போல் இருக்கும் வரை. அதிகமாக வார்த்தைகளைச் சேர்ப்பது, சில தொழில் சார்ந்த வார்த்தைகளைத் தூவுவது, மாதிரி மனதைப் படிக்கும் என்று நம்புவது போன்ற எதிர்வினை ஏற்படுகிறது. அது நடக்காது. Sora 2 ஒரு சிறந்த autocomplete போல புத்திசாலி: ஆச்சரியமாக இருக்கிறது, ஆனால் மிகவும் நேரடியானது. நீங்கள் என்ன சொல்ல வருகிறீர்கள் என்பதைச் சொல்லுங்கள். ஒரு கலைக்களஞ்சியத்திற்குள் முன்னுரையை புதைக்க வேண்டாம்.
தொழில் துறையின் விளம்பர எந்திரம் prompt engineering-ஐ ஒரு மாயவித்தை ஆக்க விரும்புகிறது. அது அப்படி இல்லை. இது எடிட்டிங். இது இயக்கம். ஒரு இயந்திரத்திடம் நீங்கள் என்ன விரும்புகிறீர்கள் என்பதை, அது தவறாகப் புரிந்து கொள்ள முடியாத வகையில் சொல்லுவதற்கு நீங்கள் பொறுப்பேற்க வேண்டும். மற்றவை—“ரகசிய மந்திரங்கள்,” நகலெடுத்து ஒட்டும் சூனியம்—வேலை செய்யாத வரை சரியாக வேலை செய்யும். Sora 2 அதை விட சிறந்தது. நீங்கள் சொல்வதை அப்படியே எடுத்துக்கொண்டு dailies-ஐ பார்க்காத ஒரு கூட்டாளி போல் அதை நடத்துங்கள்.
உண்மையில் நாம் எதைப் பற்றி பேசுகிறோம்
குறிப்பாகச் சொல்ல வேண்டுமென்றால்: Sora 2 prompt engineering என்பது சரியான, கட்டுப்படுத்தக்கூடிய வீடியோவை உருவாக்கும் prompt உரையை (மற்றும், கிடைக்கக்கூடிய இடங்களில், reference உள்ளீடுகள் மற்றும் controls) எழுதும் கலை. “உத்வேகம்” அல்ல. “Vibes” அல்ல. நீங்கள் கட்டுப்பாடுகளை உருவாக்குகிறீர்கள்—subject, action, camera, lighting, style, duration, pacing, மற்றும் continuity—எனவே மாதிரி உங்கள் நகரக் காட்சியின் நடுவில் ஒரு ஊதா நிற குதிரையை கண்டுபிடிக்காது.
அதைப் பற்றி யோசிப்பதற்கான சிறந்த வழி: நீங்கள் வார்த்தைகளில் கதைப் பலகைகளை உருவாக்குகிறீர்கள். உங்கள் prompt ஒரு point of view உடன் ஒரு இறுக்கமான shot list போல எவ்வளவு நெருக்கமாக இருக்கிறதோ, அவ்வளவு அதிகமாக Sora 2 செயல்படுகிறது. அது எவ்வளவு தளர்வாக இருக்கிறதோ—கையசைக்கும் adjectives, ஐந்து போட்டியிடும் கலை styles, time-of-day schizophrenia—அந்த வெளியீடு மாதிரி பாதி நினைவில் வைத்திருக்கும் விஷயங்களின் ஒரு collage போல இருக்கும்.
Sora 2 Prompts க்கான எளிய கட்டமைப்பு
எனக்கு கட்டமைப்புகள் பிடிக்காது, ஆனால் இது அதன் மதிப்பை நிரூபிக்கிறது. Sora 2 prompts ஐ ஐந்து அடுக்குகளாக அடுக்கப்பட்டதாக நினைத்துப் பாருங்கள். உங்களுக்குத் தேவையில்லாத எந்த அடுக்கையும் நீங்கள் புறக்கணிக்கலாம், ஆனால் ஒரு அடுக்கு காணவில்லை என்றால், மாதிரி அதை clichés உடன் நிரப்புகிறது.
- Subject மற்றும் Intent (“என்ன” மற்றும் “ஏன்”)
- ஒரு முக்கிய subject. ஒரு supporting subject இருக்கலாம். அவ்வளவுதான்.
- Intent: பார்வையாளர் என்ன உணர வேண்டும் அல்லது புரிந்து கொள்ள வேண்டும்.
- உதாரணம்: “ஒரு தனி சைக்கிள் ஓட்டுநர் விடியற்காலையில் ஒரு மூடுபனி பாலத்தின் குறுக்கே விடாமுயற்சியையும் அமைதியான மன உறுதியையும் குறிக்கும் வகையில் சவாரி செய்கிறார்.”
- காட்சி உண்மைகள் (“எங்கே” மற்றும் “எப்போது”)
- நாள் நேரம், வானிலை, இருப்பிட விவரங்கள். கவிதை நவுன்களை விட உறுதியான நவுன்கள் சிறந்தது.
- “Golden hour” என்பது “அழகான லைட்டிங்கை” விட சிறந்தது. “நியோனை பிரதிபலிக்கும் ஈரமான நிலக்கீல்” என்பது “cyberpunky” ஐ விட சிறந்தது.
- கேமரா மற்றும் இயக்கம் (“எப்படி”)
- Shot வகை, lens vibe, கேமரா இயக்கம், வேகம்.
- “50mm-சமானத்தில் மெதுவான dolly-in; குறைந்தபட்சமாக வைக்கப்பட்ட handheld micro-jitter” என்பது “cinematic” ஐ விட சிறந்தது.
- காட்சி Style மற்றும் கட்டுப்பாடுகள் (“தோற்றம்”)
- ஒரு aesthetic பாதையைத் தேர்ந்தெடுக்கவும்: photoreal, 16mm film, cel animation, watercolor. மூன்று தோற்றங்களை கலப்பது என்பது தற்காலிக குழப்பத்தை கேட்பதாகும்.
- Palette, texture மற்றும் era reference-ஐ கட்டுப்படுத்துங்கள்.
- Continuity மற்றும் செய்யக்கூடாதவை (“அதை நிலையாக வைத்திருங்கள்”)
- Lock character attributes, props மற்றும் canonical விவரங்கள்.
- வெளிப்படையான எதிர்மறைகள்: “ஆடை மாற்றங்கள் இல்லை; text overlays இல்லை; உருமாறும் பொருட்கள் இல்லை.”
Sora 2 prompt engineering என்பது அதிகமான வார்த்தைகளை திணிப்பது பற்றியது அல்ல; இது ஓட்டைகளை அகற்றுவது பற்றியது. நீங்கள் ஒரு பிடிவாதமான நேரடியான கூட்டாளியுடன் ஒரு ஒப்பந்தத்தை எழுதுகிறீர்கள். ஓட்டைகளை அடைக்கவும்.
உங்களை சிக்கலில் ஆழ்த்தும் சொற்களின் குறுகிய பட்டியல்
- “Cinematic.” எல்லாவற்றையும் குறிக்கும் மற்றும் எதையும் குறிக்காது. கேமரா, லென்ஸ் மற்றும் நீங்கள் உண்மையில் விரும்பும் இயக்கத்துடன் மாற்றவும்.
- “Epic.” “நான் முடிவு செய்யவில்லை” என்பதற்கான ஒரு சொல்.
- “Hyperrealistic.” துளைகளில் அதிகமாக கவனம் செலுத்துகிறது, கலவையை மறக்கிறது.
- “Vibe.” நீங்கள் அந்த vibe-ஐ நவுன்களில் பெயரிட முடியாவிட்டால், உங்களிடம் அது இல்லை.
- “[கலைஞரின் பெயர்] AI-style.” வெளிப்படையான சிக்கல்களுக்கு கூடுதலாக, இது கட்டமைப்பின் மீது மேற்பரப்பு style உடன் மாதிரியை குழப்புகிறது. Tribute acts அல்ல, reference பொருட்கள்.
Sora 2 நோக்கத்தை மதிக்காது; அது அறிவுறுத்தலை மதிக்கிறது. உங்கள் prompt ஒரு trailer voiceover போல் இருந்தால், trailer cuts ஐ எதிர்பார்க்கலாம்: விரைவான, தொடர்பில்லாத, அனைத்து frosting.
ஒரு Dialectic: சுருக்கம் மற்றும் விவரம்
- “குறுகிய prompt” முகாம் Sora 2 ஐ தனியாக விட்டுவிட்டால் சிறந்தது என்று வாதிடுகிறது—மாதிரியை நம்புங்கள். சில நேரங்களில் உண்மை. உங்கள் கருத்து சின்னமாகவும், பார்வைக்கு அதிகமாகவும் இருக்கும்போது குறுகியது நல்லது: “ஒரு இடியுடன் கூடிய மழை Monument Valley மீது அந்தி நேரத்தில் பரவலாக உருண்டு வருகிறது, பரந்த shot.” Sora 2 அதை ஆயிரம் முறை பார்த்திருக்கிறது; priors மற்றதைச் செய்கின்றன.
- “Novella prompt” முகாம் அறிவுறுத்தல்களை குவித்து வைக்கிறது. சில நேரங்களில் அவசியம். உங்களுக்கு 8 வினாடிகளில் continuity தேவைப்பட்டால்—அதே ஜாக்கெட், அதே நாய், அதே காபி கோப்பை—சுருக்கம் உங்களை கொன்றுவிடும். குறிப்பிடவும் அல்லது கஷ்டப்படவும்.
சாரம்சம்: priors வலுவாக இருக்கும் இடத்தில் சுருக்கமாக இருங்கள் (பொதுவான காட்சிகள், நன்கு தெரிந்த இயற்பியல்), priors பலவீனமாக இருக்கும் இடத்தில் முழு விவரமாக இருங்கள் (புதிய props, தந்திரமான choreography, கலவையான லைட்டிங், பிராண்ட் செய்யப்பட்ட விவரங்கள்). நீங்கள் எந்த bucket-ல் இருக்கிறீர்கள் என்று உங்களுக்குத் தெரியாவிட்டால், நீங்கள் இரண்டாவது bucket-ல் இருக்கிறீர்கள்.
நடைமுறையில் வேலை செய்யும் Sora 2 Prompt Patterns
இவற்றை வேதமாக அல்ல, சமையல் குறிப்புகளாக பயன்படுத்தவும். அடைப்புக்குறிகளை நிரப்பவும்; பஞ்சுபோன்றவற்றை அகற்றவும்.
- ஒற்றை-Subject செயல், கட்டுப்படுத்தப்பட்ட கேமரா
Prompt: “Photoreal வீடியோ, 8 வினாடிகள். [Subject] [ஒரு செயலை செய்கிறது] [இடம்]-ல் [நாள் நேரம்]. Locked tripod, நடுத்தர shot, இயற்கை வேகம். மென்மையான மேகமூட்டமான ஒளி; ஆழமற்ற ஆழம். நிலையான ஆடை: [விளக்கம்]. வெட்டுகள் இல்லை, உரை இல்லை, நேர-தவறல் இல்லை.”
ஏன் இது வேலை செய்கிறது: இயக்கத்தை கட்டுப்படுத்துகிறது, continuity-ஐ lock செய்கிறது, மாதிரி மாண்டேஜ் செய்ய தூண்டுகிறது.
- ஒரு Smash Cut இல்லாமல் நிலைநிறுத்துதல்-க்கு-விவரம்
Prompt: “[இடம்] பரந்த நிலைப்படுத்தும் ஷாட்டில் 10 வினாடிகள் தொடங்கவும்; மெதுவான 5-வினாடி டாலி-இன். 6 வது வினாடியில், திரை இடது பக்கம் சட்டத்தை பராமரித்து [subject] நடுத்தர ஷாட்டுக்கு எளிதாக்குங்கள். கோல்டன் ஹவர் பின் ஒளி; லென்ஸ் ஒளிக்கீற்றுகள் நுட்பமானவை. கலர் தட்டு சூடான ஆரஞ்சு மற்றும் மியூட் செய்யப்பட்ட நீல நிறமாக வைக்கவும். ரேக் கவனம் இல்லை; திடீர் கோண மாற்றங்கள் இல்லை.”
ஏன் இது வேலை செய்கிறது: குழப்பத்தை அழைக்காமல் வரிசைமுறையை Sora 2 க்கு கற்பிக்கிறது.
- தற்காலிக மனநிலையுடன் கூடிய ஸ்டைலிஸ் செய்யப்பட்ட அனிமேஷன்
Prompt: “கை-வரையப்பட்ட, செல்-style அனிமேஷன், 12 fps. தட்டையான வண்ணங்கள், தடிமனான வெளிப்புறங்கள், வரையறுக்கப்பட்ட தட்டு [4 வண்ணங்களின் பட்டியல்]. [Character] [அமைப்பின்] மூலம் இடமிருந்து வலமாக செல்கிறது. பக்க-ஸ்க்ரோலர் கேமரா; பின்னணியில் மட்டும் பாரலாக்ஸ். கேமரா சுழற்சி இல்லை, முன்னோக்கு மாற்றங்கள் இல்லை. லூப் செய்யக்கூடிய முடிவு: எழுத்து சட்டகத்தை வலதுபுறமாக வெளியேற்றுகிறது.”
ஏன் இது வேலை செய்கிறது: அனிமேஷன் styles priors-வசதியானவை, ஆனால் கேமரா மாற்றங்களுக்கு உணர்திறன் கொண்டவை. விமானத்தை பூட்டுங்கள்.
- வானிலை மற்றும் அமைப்பு முன்னணி
Prompt: “[மேற்பரப்பின்] மேக்ரோ close-up, 6 வினாடிகள், tripod. மழை மணிகள் உருவாகி ஒன்றிணைந்து, நிகழ்நேரம். மென்மையான மேல்-ஒளி, இருண்ட பின்னணி. ஆடியோ மறைமுகமாக ஆனால் எதுவும் தெரியவில்லை. வெட்டுகள் இல்லை, மனித subjectகள் இல்லை, கேமராவின் பிரதிபலிப்புகள் இல்லை.”
ஏன் இது வேலை செய்கிறது: அமைப்பு priors வலுவானது; கட்டுப்பாடுகள் வினோதமான ஊடுருவல்களைத் தடுக்கின்றன.
- உரையாடல் இல்லாத மைக்ரோ-டிராமா
Prompt: “Photoreal, 9 வினாடிகள். [Character A], [வயது/பாலினம்], [குறிப்பிட்ட அலமாரியில்], [இடம்] காத்திருக்கிறார். அவள் ஒரு உரையைச் சரிபார்க்கிறாள், நுட்பமாக புன்னகைக்கிறாள், தொலைபேசியை பாக்கெட்டில் போடுகிறாள். ஓவர்-தி-ஷோல்டர் நடுத்தர ஷாட்; ஆழமற்ற DOF; நகர bokeh. இயற்கையான கை இயக்கம், உதட்டு அசைவு இல்லை. முடி நீளத்தை [சரியாக], இடது ஆள்காட்டி விரலில் மோதிரத்தை வைத்திருங்கள். பின்னணி எழுத்து மாதிரி மாற்றங்கள் இல்லை.”
ஏன் இது வேலை செய்கிறது: சிறிய, மனித-அளவிலான துடிப்புகள்; continuity நங்கூரங்கள் கிளிப் நடுவில் props அல்லது faces ஐ மாற்றுவதிலிருந்து Sora 2 ஐத் தடுக்கிறது.
Continuity பிரச்சனை (அதை எப்படி தோற்கடிக்காமல் இருப்பது)
Sora 2 இன் மிகப்பெரிய party trick அதன் Achilles heel ஆகும்: அது கண்டுபிடிக்கும். ஒரு காபி குவளை frames க்கு இடையில் ஒரு மேசை முழுவதும் இடம்பெயரும் வரை அது நன்றாக இருக்கிறது. Continuity இடைவெளிகள் generative மாதிரிகளில் சுடப்படுகின்றன; அவை கடைசியாக பொருந்துவதற்கு ஒரு சார்புடன் ஒவ்வொரு தருணத்தையும் யூகித்துக்கொண்டிருக்கின்றன. உங்கள் prompt தெளிவற்றதாக இருக்கும்போது, யூகம் விலகிச் செல்கிறது.
சரியானவை மாயாஜாலங்கள் அல்ல:
- தனி நவுன்களை பூட்டவும். “மேசையின் கிழக்குப் பக்கத்தில் சிதைந்த விளிம்புடன் ஒரு சிவப்பு பீங்கான் குவளை.” “ஒரு குவளை” அல்ல.
- ஆடையை உறைய வைக்கவும். “இரண்டு மார்பு பாக்கெட்டுகள் கொண்ட நீல டெனிம் ஜாக்கெட், தாமிர பொத்தான்கள், திட்டுகள் இல்லை. மாற்ற வேண்டாம்.”
- எதிர்மறை இடத்தை கட்டளையிடவும். “வெற்று மேசை; குவளை தவிர வேறு எதுவும் இல்லை.” நீங்கள் அதைத் தடை செய்யாவிட்டால், மாதிரி அதை நிரப்புகிறது.
- கேமரா நகர்வுகளை கட்டுப்படுத்தவும். இயக்கத்தின் ஒவ்வொரு கூடுதல் அச்சும் continuity ஐ உடைக்க ஒரு வாய்ப்பாகும்.
- நங்கூர துடிப்புகளைப் பயன்படுத்தவும். “3 வது வினாடியில், subject கீழே பார்க்கிறார்; 6 வது வினாடியில், subject வெளிப்படையாக மூச்சு விடுகிறார்.” நேரம் வெளிப்படையாக இருக்கும்போது, விலகலுக்கு ஊடுருவ இடமில்லை.
Sora 2 prompt engineering பெரும்பாலும் continuity engineering ஆகும். அதை ஏற்றுக்கொள், உங்கள் வெளியீடுகள் ஒரு தரத்தில் குதிக்கின்றன.
Style என்பது ஒரு ஆடை அல்ல, இது ஒரு கட்டுப்பாடு
மக்கள் “Wes Anderson” ஐ “espresso” கேட்பது போல் கேட்கிறார்கள்—அதாவது பொதுவாக அவர்களுக்கு சர்க்கரை வேண்டும். Style என்பது நீங்கள் எந்த subject மீதும் மூடக்கூடிய ஒரு ஆடை அல்ல. Sora 2 இல், style மாதிரி பயன்படுத்தும் விதிகளைத் தேர்ந்தெடுக்கிறது: நிறம், கலவை, இயக்கம், லென்ஸ் நடத்தை கூட.
ஒன்றைத் தேர்ந்தெடுக்கவும்:
- Photoreal: தோல் துளைகள், லென்ஸ் பிறழ்ச்சிகள், யதார்த்தமான இயற்பியல். தயாரிப்புகள் மற்றும் மனித உணர்ச்சிக்கு சிறந்தது. சோம்பேறி prompts க்கு மன்னிக்க முடியாதது.
- Film stock emulation (16mm, 35mm): கரடுமுரடான துகள், ஹலேஷன், மென்மையான ரோலோஃப், குறைந்த செறிவு. குறைவாகப் பயன்படுத்தவும், பங்கு சகாப்தத்தைக் குறிப்பிடவும், லைட்டிங்கை எளிமையாக வைத்திருக்கவும்.
- அனிமேஷன் (cel, stop motion, watercolor): தெளிவான நிழற்படங்கள், நிலையான வெளிப்புறங்கள் மற்றும் பூட்டப்பட்ட கேமரா விமானங்கள் ஆகியவற்றை விரும்புகிறது. அதிகப்படியான விவரம் தற்காலிக நிலைத்தன்மையை குறைக்கிறது.
- Graphic/விளக்கப்படம்: தட்டையான டோன்கள், அதிக மாறுபாடு, தைரியமான வடிவியல். இயக்கம் குறைவாகவும் வேண்டுமென்றே இருக்கும்போது வேலை செய்கிறது.
விளக்கமான line art உடன் photoreal லைட்டிங்கைக் கேட்பது தவறு. அது நடக்கலாம், ஆனால் மாதிரி தன்னுடன் வாதிடும்போது தற்காலிக சத்தத்தை எதிர்பார்க்கலாம்.
“அதிகமான Adjectives = சிறந்த வீடியோ” என்ற கட்டுக்கதை
நீங்கள் குறிப்பிட்ட வெளியீடுகளை விரும்பினால், குறிப்பிட்ட நவுன்கள் மற்றும் வினைச்சொற்களைப் பயன்படுத்தவும். Adjectives என்பது அலங்காரம்:
- மோசமானது: “ஒரு எதிர்கால சைபர்பங்க் நகரத்தின் வழியாக விரைவாக பந்தயத்தில் செல்லும் ஒரு அழகான காரின் cinematic, epic, hyperreal shot.”
- நல்லது: “Photoreal shot, 6 வினாடிகள். ஆரஞ்சு நிறத்தில் ஒரு 1971 Datsun 240Z இரவு நேரத்தில் ஷிபுயாவின் வழியாக லேசான மழையில் விரைகிறது. பொருத்தப்பட்ட ஹூட் கேமரா, 24 மிமீ-சமானம், சிறிய மோஷன் மங்கலானது, ஈரமான நிலக்கீல் நியான் விளக்குகளை பிரதிபலிக்கிறது. மிதமான போக்குவரத்து அடர்த்தியை வைத்திருங்கள்; காவல்காரர்கள் இல்லை; லோகோ close-ups இல்லை.”
நல்ல prompt கத்தாது. அது என்ன நடக்கிறது, எங்கே, எப்படி, என்ன செய்யக்கூடாது என்று சரியாக சொல்கிறது.
நீங்கள் உண்மையில் எப்போது நீண்ட Prompts ஐ பயன்படுத்த வேண்டும்
- ஒரு டேக்கில் மல்டி-பீட் செயல். கேமரா அல்லது subject சரியான நேரங்களில் நடத்தையை மாற்ற வேண்டும் என்றால், அதை விவரிக்கவும்.
- பிராண்ட் செய்யப்பட்ட அல்லது கட்டுப்படுத்தப்பட்ட உள்ளடக்கம். நீங்கள் மாயத்தோற்ற லோகோக்கள் அல்லது பாதுகாப்பற்ற நடத்தைகளை வாங்க முடியாது. எதிர்மறை prompts என்பது பேச்சுவார்த்தைக்குட்படாதவை.
- கண்டுபிடிக்கப்பட்ட பொருட்கள் அல்லது உலகங்கள். நீங்கள் “தெரு விளக்குகளை விலக்கும் ஒரு கண்ணாடி குடை” உருவாக்குகிறீர்கள் என்றால், கட்டுமானம் மற்றும் நடத்தையை வரையறுக்கவும்.
- Post உடன் Interop. நீங்கள் கலக்கப்போகிறீர்கள் என்று உங்களுக்குத் தெரிந்தால், லைட்டிங், மோஷன் மங்கலானது மற்றும் பிளேட் தூய்மையை கட்டுப்படுத்துங்கள்.
இல்லையெனில், சொற்களை உப்பாக கருதுங்கள். நீங்கள் அதைச் சேர்க்கலாம்; நீங்கள் அதை திரும்பப் பெற முடியாது.
மீண்டும் மீண்டும் செய்வது: சலிப்பான ரகசியம்
முதல் முயற்சி பரபரப்பாக இருக்க வேண்டும் என்று ஆக்கப்பூர்வமானவர்கள் நினைக்க விரும்புகிறார்கள். Sora 2 போதுமான வேகமானது, நீங்கள் சலிப்பாகவும் முறையாகவும் இருக்கலாம்:
- நடுநிலையாக தொடங்கவும். ஒரு subject, ஒரு செயல், ஒரு கேமரா. Continuity ஐ ஆணித்தரமாக செய்யுங்கள்.
- ஒரு நேரத்தில் ஒரு விஷயத்தை மாற்றவும். ஒரே பாஸில் லைட்டிங் மற்றும் கேமராவை நீங்கள் மாற்றினால், என்ன உடைந்தது என்று உங்களுக்குத் தெரியாது.
- Prompts மற்றும் வெளியீடுகளின் changelog ஐ வைத்திருங்கள். ஒரு Google Doc கூட. எதிர்கால-நீங்கள் உங்களுக்கு நன்றி சொல்வார்கள்.
- கிடைக்கும்போது விதை மறுபயன்பாட்டை ஆதரிக்கவும். கட்டுப்பாடு கணிக்கக்கூடிய தன்மையை உருவாக்குகிறது.
வீடியோ இறுதியாக நடந்து கொள்ளும்போது மூன்றாவது வரைவில் பரவசம் இருக்கிறது, நீங்கள் எதுவும் செய்யவில்லை என்று சத்தியம் செய்கிறீர்கள். நீங்கள் செய்தீர்கள்: மாதிரிக்கான சாக்குகளைக் கொடுப்பதை நீங்கள் நிறுத்தினீர்கள்.
மணிநேரத்தை சேமிக்கும் Guardrails
- தற்காலிக மொழி முக்கியமானது. “4 வது வினாடியில்” “பின்னர்” ஐ விட சிறந்தது.
- இடஞ்சார்ந்த நங்கூரங்கள் முக்கியம். “திரை இடது” என்பது “இடதுபுறம்” ஐ விட சிறந்தது.
- இயற்பியல் முக்கியமானது. அடிப்படை இயக்கத்தை மீறும் ஐந்து விஷயங்களைக் கேட்க வேண்டாம். மாதிரி உலகைப் பார்த்து இயற்பியலைக் கற்றுக் கொண்டது; அதை gaslight செய்ய வேண்டாம்.
- Faces கடினமானது. நீங்கள் நிலைத்தன்மையை விரும்பினால், தலை கோணம், லைட்டிங் மற்றும் தூரத்தைப் பூட்டவும். உருகி வழிய விரும்பவில்லை என்றால், faces இல் விரைவான புஷ்-இன்களைத் தவிர்க்கவும்.
- Crowds என்பது குழப்பம். நீங்கள் செய்ய வேண்டும் என்றால், அவற்றை ஆழத்துடன் மங்கலாக்கவும் அல்லது குறைந்த ஒளியுடன் மங்கலாக்கவும். எக்ஸ்ட்ராக்களை நட்சத்திரமாக மாற்ற வேண்டாம்.
Sora 2 Prompt Engineering க்கான ஒரு வேலை டெம்ப்ளேட்
நகலெடுத்து, பின்னர் தனிப்பயனாக்கவும். உங்களுக்குத் தேவையில்லாத எந்த வரியையும் அழிக்கவும்.
தலைப்பு/Tag: Sora 2 prompt engineering — [திட்டத்தின் பெயர்]
Intent: [பார்வையாளர் ஒரு வாக்கியத்தில் என்ன உணர அல்லது நினைக்க வேண்டும் என்று நீங்கள் விரும்புகிறீர்கள்.]
Duration: [X] வினாடிகள், தொடர்ச்சியான ஒரு ஷாட். குறிப்பிடப்படாவிட்டால் வெட்டுகள் இல்லை.
Subject: ஒரு [தெளிவான subject], [வயது/விளக்கம்], [ஆடை விவரங்கள்].
காட்சி: [இடம்], [நாள் நேரம்], [வானிலை]. முக்கிய props: [நவுன்கள்]. எதிர்மறை இடம்: [என்ன காலியாக இருக்க வேண்டும்].
கேமரா: [ஷாட் வகை], [லென்ஸ் vibe], [இயக்கம்], [pacing]. அடிவானத்தை [சமமாக/சாய்வாக] வைத்திருங்கள். Framing: subject [திரை நிலையில்] இருக்கிறது.
Lighting: [மூலம்], [தரம்], [திசை]. [விரும்பத்தகாத லைட்டிங் கலைப்பொருட்களை] தவிர்க்கவும்.
Style: [photoreal / film stock / cel animation / மற்றவை], palette [சில வண்ணங்களின் பட்டியல்]. அமைப்பு/துகள் [ஏதேனும் இருந்தால்].
செயல் காலவரிசை:
Continuity locks: [ஆடை விவரங்கள்], [prop நிலை], [முடி/கண் நிறம்], [text overlays இல்லை], [லோகோ மாற்றங்கள் இல்லை].
எதிர்மறைகள்: உருமாற்றம் இல்லை, jump cuts இல்லை, time-lapse இல்லை, மாயத்தோற்ற அடையாளங்கள் இல்லை, கேமரா பிரதிபலிப்புகள் இல்லை.
உண்மைச் சரிபார்ப்பு: கருவிகள் சுவையை மாற்றாது
உங்கள் சுவை மோசமாக இருந்தால், நீங்கள் உலகின் தூய்மையான Sora 2 prompt ஐ எழுதலாம் மற்றும் இன்னும் பார்க்க முடியாத கிளிப்பைப் பெறலாம். கலவை, ரிதம், ஒளி. இவை விருப்பங்கள் அல்ல; அவை சட்டங்கள், மற்றும் Sora 2 அவற்றைக் கற்றுக்கொள்வதிலிருந்து உங்களை விலக்கவில்லை. நிறைய “prompt engineering” என்பது தவிர்ப்பின் மூலம் வடிவமைப்பு: மாதிரி செய்ய விரும்பும் சீஸி விஷயத்தைச் செய்ய விடாதீர்கள். உணர்ச்சிக்கு இன்னும் தேவைப்படும்போது கேமராவைத் திருப்ப விடாதீர்கள்.
Sora 2 prompt engineering க்கு ஒரு மறைக்கப்பட்ட superpower இருந்தால், அது கட்டுப்பாடுதான். குறைவாகக் கேளுங்கள், அதிகமாகப் பெறுங்கள். எல்லாவற்றையும் கேளுங்கள், சூப் கிடைக்கும்.
Sider.AI உண்மையில் எங்கு உதவுகிறது (எங்கே இல்லை)
Sider.AI உண்மையில் வேலை செய்கிறது—குறைந்தபட்சம் நீங்கள் அதை எதற்காகப் பயன்படுத்துகிறீர்கள் என்பதற்காகப் பயன்படுத்தும்போது, அது என்னவென்றால், எல்லோரும் பெருமை பேசுவது அல்ல. இது “கலை உருவாக்கு” பொத்தான் அல்ல. இது “வெளிப்படையான கட்டுப்பாடுகளை மறக்காதே” உதவியாளர். உங்கள் Sora 2 prompt ஐ உருவாக்கவும், பின்னர் Sider.AI அதை ஒரு கோட் எடிட்டர் போல அர்த்தத்திற்காக lint செய்யட்டும்: வரம்பற்ற adjectives, முரண்பாடான கேமரா நகர்வுகள், காணாமல் போன continuity locks ஐக் குறிக்கிறது. இது “handheld மற்றும் tripod ஐ ஒரே நேரத்தில் கேட்டீர்கள்” என்று சொல்லும் தூண்டுதல். அது எங்கு உதவாது: சுவையை கண்டுபிடிப்பது அல்லது உறுதியற்ற தன்மையைத் தீர்ப்பது. உங்கள் கிளிப்பிற்கு ஒரு dolly வேண்டுமா அல்லது lock-off வேண்டுமா என்று உங்களுக்குத் தெரியாவிட்டால், எந்த கருவியும் அதற்கு பதிலளிக்க முடியாது. ஆனால் நீங்கள் முடிவு செய்ததும், prompt ஐ தெளிவானதாகவும், மீண்டும் செய்யக்கூடியதாகவும், இரக்கமின்றி சுருக்கமாகவும் மாற்றுவதில் Sider.AI சிறந்தது. வேலை செய்த உதாரணங்கள்: முன்னும் பின்னும்
உதாரணம் 1: தயாரிப்பு ஹீரோ ஷாட்
- முன்னர்: “சலவைக்கல் மேசையில் எங்கள் புதிய ஸ்மார்ட்வாட்சின் cinematic, epic ஷாட், வியத்தகு லைட்டிங், நீர் துளிகள், அல்ட்ரா-விவரம்.”
- பின்னர்: “Photoreal மேக்ரோ, 6 வினாடிகள். மேட் வெள்ளை சலவைக்கல்லில் எங்கள் ஸ்மார்ட்வாட்ச் (41 மிமீ, வெள்ளி அலுமினியம், கருப்பு ஃப்ளூரோலாஸ்டோமர் பேண்ட்). நிலையான tripod; மெதுவான 2% புஷ்-இன் சிமுலேட் செய்யப்பட்டது, handheld இல்லை. ஒற்றை மேல் சாஃப்ட் பாக்ஸ்; சிறிய துளிகளை உருவாக்கும் கிரிஸ்டலில் லேசான மூடுபனி. திரை ஆஃப், கிரீடம் 3 மணிக்கு. எங்களுடையது தவிர வேறு லோகோக்கள் இல்லை; text overlays இல்லை.”
என்ன மாறியது: ஒவ்வொரு மாறியும் கட்டப்பட்டுள்ளது; “epic” இல்லை. இதன் விளைவாக ஒரு மனநிலைப் பலகை அல்ல, ஒரு ஷாட் பட்டியல் போல் இருக்கிறது.
உதாரணம் 2: மனித துடிப்புடன் கூடிய தெரு காட்சி
- முன்னர்: “ஒரு நபருடன் நியான் vibes, cinematic உடன் நடக்கும் ஒரு கூல் சைபர்பங்க் நகர காட்சி.”
- பின்னர்: “8 வினாடிகள், photoreal. லேசான மழையில் இரவு ஷின்ஜுகு பக்க தெரு; நியான் அடையாளங்களை பிரதிபலிக்கும் ஈரமான நிலக்கீல். ஒரு நபர்: பெண், 30 கள், கடற்படை அகழி, வெள்ளை ஸ்னீக்கர்கள், குட்டையான கருப்பு பாப் ஹேர்ஸ்டைல். நடுத்தர-பரந்த, கண்-நிலை, மென்மையான நிலைப்படுத்தலுடன் கூடிய நிலையான கேம்; subject கேமராவை நோக்கி நகரும் திரை வலது பக்கத்தில் இருக்கிறார். கலர் தட்டு குளிர் நீலம் எப்போதாவது மெஜந்தாவுடன். ஆங்கிலத்தில் அடையாளம் இல்லை; குடைகள் இல்லை; லென்ஸ் மாற்றங்கள் இல்லை.”
என்ன மாறியது: ஒரு subject, ஒரு இயக்கம், அர்த்தமுள்ள மொழி. கிளிப் ஒருங்கிணைகிறது.
உதாரணம் 3: ஸ்டைலிஸ் செய்யப்பட்ட லூப்
- முன்னர்: “ஒரு மந்திர காட்டில் பூனையின் ஒரு வினோதமான அனிமேஷன் லூப், ஸ்டுடியோ ஜிப்லி vibes.”
- பின்னர்: “செல்-style அனிமேஷன், 12 fps. ஒரு கலிகோ பூனை ஒரு சிறிய கிளியரிங்கில் ஒரு பாசி பதிவில் உட்கார்ந்திருக்கிறது; மின்மினிப் பூச்சிகள் நகர்கின்றன. பூட்டப்பட்ட கேமரா, பக்கத்திலிருந்து. வரையறுக்கப்பட்ட தட்டு: வன பச்சை, வெளிர் மஞ்சள், சூடான பழுப்பு, கிரீம். மென்மையான தென்றல் இலைகளை நகர்த்துகிறது; பூனை வால் ஒவ்வொரு 2 வினாடிகளிலும் சுழல்கிறது. லூப் செய்யக்கூடிய முடிவு: தென்றலும் மின்மினிப் பூச்சிகளும் ஆரம்ப நிலைகளுக்குத் திரும்புகின்றன; கேமரா குலுக்கல் இல்லை.”
என்ன மாறியது: பெயர்-துளி இல்லை; style குறிப்புகளால் அல்ல, விதிகளால் வரையறுக்கப்படுகிறது.
Sora 2 அணிகளுக்கான Prompt Engineering
நீங்கள் பங்குதாரர்களுடன் பணிபுரிந்தால், உங்கள் மிகப்பெரிய எதிரி adjective மூலம் ஒருமித்த கருத்து. எல்லோரும் “அதிக ஆற்றல்” மற்றும் “அதிக cinematic” விரும்புகிறார்கள்.
- அதிகபட்சம் ஒரு பக்கம் நீளமான prompt spec ஐ உருவாக்கவும். இது வாக்கியங்களில் ஒரு ஷாட் பட்டியல்.
- ஒரு ஒப்புதல் சரிபார்ப்பு பட்டியலைச் சேர்க்கவும்: காலம், subject எண்ணிக்கை, கேமரா, லைட்டிங், style, continuity locks, எதிர்மறைகள். ஒரு பெட்டி சரிபார்க்கப்படவில்லை என்றால், நீங்கள் முடிக்கவில்லை.
- வெளியீடுகள் மற்றும் குறிப்புகளுடன் prompts ஐ சேமிக்கவும். அவற்றை பதிப்பிக்கவும். உங்கள் “தங்க prompts” சொத்துக்களாக மாறும்.
Sora 2 prompts ஐ உற்பத்தி ஆவணங்களாகக் கருதும் அணிகள் கண்டுபிடிக்கப்பட்டதைப் போல அல்லாமல், உற்பத்தி செய்யப்பட்டவை போல் தோற்றமளிக்கும் முடிவுகளைப் பெறுகின்றன.
டாரோட் கார்டுகள் இல்லாமல் பிழைகளைச் சரிசெய்தல்
- திடீரென துண்டிக்கப்படுகிறது. வெட்டுவது போல் நீங்கள் சொல்லியிருக்கலாம் (“அதே நேரத்தில்,” “திடீரென,” பல செயல்கள்) அல்லது மாண்டேஜ் மொழியைப் பயன்படுத்தியிருக்கலாம். “தொடர்ச்சியான ஒற்றை ஷாட்” என்பதை வலியுறுத்தி, போட்டியிடும் beat-களை அகற்றவும்.
- முகங்கள் மாறிக்கொண்டே இருக்கின்றன. தலை நோக்குநிலை, தூரம் மற்றும் லைட்டிங் ஆகியவற்றை லாக் செய்யுங்கள். அசைவுகளைக் குறைத்து, வேகமான புஷ்-இன்களைத் தடை செய்யுங்கள். உணர்ச்சி பற்றிய உரிச்சொற்களைக் குறைத்து, உடல் செயல்பாடு பற்றி அதிகம் சொல்லுங்கள்.
- Props டெலிபோர்ட் ஆகின்றன. Prop-இன் பெயரைச் சொல்லி, frame அல்லது set-ஐப் பொறுத்து அதன் நிலையைக் குறிப்பிடவும், மேலும் குறிப்பிடாத வரை அசைவுகளைத் தடைசெய்யவும். “எப்போதும் [position]-இல் இருக்கும்” என்று பயன்படுத்தவும்.
- ஷாட் பரபரப்பாக இருப்பது போல் உள்ளது. நீங்கள் மாடல் வெற்றிடத்தை நிரப்ப அனுமதித்தீர்கள். எதிர்மறை இடத்தை (negative space) அறிவித்து பின்னணி அசைவைக் குறைக்கவும்.
- Style சிமிட்டுகிறது. நீங்கள் இரண்டு தோற்றங்களைக் கேட்டீர்கள். ஒன்றைத் தேர்ந்தெடுக்கவும் அல்லது நேரக்குறியீடுகளில் மாற்றங்களை அனுமதிக்கவும்.
ஒழுக்கம் மற்றும் ஆதாரம் பற்றிய ஒரு வார்த்தை
Prompt engineering உங்களை ஆதாரங்களைப் பற்றி சிந்திப்பதிலிருந்து விடுவிக்காது. நீங்கள் ஒரு உயிருள்ள கலைஞரின் தோற்றத்தை இலக்காகக் கொண்டிருந்தால், ஏன் என்று உங்களை நீங்களே கேட்டுக்கொள்ளுங்கள். பதில் “அது பிரபலமானது என்பதால்” என்றால், நீங்கள் ஏற்கனவே கதையை இழந்துவிட்டீர்கள். கட்டமைப்பு நுண்ணறிவுகளைப் (structural insights) பெறுங்கள் - கலர் பிளாக்கிங், சமச்சீரற்ற தன்மை, ஆழமற்ற DOF - மற்றும் அவற்றை விவரிக்கவும். உங்களுக்கு சுத்தமான, நிலையான மற்றும் உங்களுடையதாக ஒன்று கிடைக்கும்.
அமைதியான முடிவு
Sora 2 prompt engineering, அதன் சிறந்த நிலையில், காகிதத்தில் மந்தமாகவும் திரையில் ஆச்சரியமாக நகரும் தன்மையையும் கொண்டுள்ளது. ஏனென்றால் நீங்கள் மந்திர வார்த்தைகளைக் கண்டுபிடிக்கவில்லை, ஆனால் முக்கியமான பகுதிகளில் இயந்திரத்தை மேம்படுத்த (improvise) நீங்கள் அனுமதிக்கவில்லை. ஒரு மாடலை இயக்குவதில் வேடிக்கையான விஷயம் என்னவென்றால், அது உண்மையான செட்களைப் போலவே அதே ஒழுக்கத்தை அளிக்கிறது: உங்கள் பொருள் என்னவென்று தெரிந்து கொள்ளுங்கள், உங்கள் ஷாட்டை லாக் செய்யுங்கள், நோக்கத்துடன் லைட்டிங் செய்யுங்கள், பின்னணி காட்சியின் கவனத்தை திசை திருப்பாமல் பார்த்துக்கொள்ளுங்கள்.
உங்களுக்கு ஒரு மந்திரம் தேவை என்றால், இதோ ஒன்று: குறைவான உரிச்சொற்கள், அதிகமான பெயர்ச்சொற்கள்; குறைவான உணர்வுகள், அதிகமான வினைச்சொற்கள். நீங்கள் என்ன சொல்ல வருகிறீர்களோ அதைச் சொல்லுங்கள். மாடல் அதைத்தான் செய்யும் - அதிகமாகவோ குறைவாகவோ இல்லை. அதுதான் முக்கியம்.
முக்கிய வார்த்தை குறிப்புகள் (அக்கறை உள்ளவர்களுக்கு)
இந்த கட்டுரை Sora 2 prompt engineering-ஐ உள்ளடக்கியது, Sora 2-க்காக தெளிவான prompts எழுதுவது எப்படி, Sora 2 வீடியோ prompt எடுத்துக்காட்டுகள், continuity locks, கேமரா அறிவுறுத்தல்கள் மற்றும் style கட்டுப்பாடுகள் ஆகியவை அடங்கும். நீங்கள் கீழே வரை படித்திருந்தால், வாழ்த்துகள்: இந்த வணிகத்தில் “cinematic” ஏன் மிகவும் cinematic இல்லாத சொல் என்பதை இப்போது நீங்கள் அறிவீர்கள்.
அடிக்கடி கேட்கப்படும் கேள்விகள்
கே1: Sora 2 prompt engineering என்றால் என்ன?
Sora 2-க்கான துல்லியமான ஷாட் அறிவுறுத்தல்களை எழுதுவது - பொருள், கேமரா, லைட்டிங், style மற்றும் continuity - இதனால் மாடல் உங்களை தவறாகப் படிக்க முடியாது. உங்கள் Sora 2 prompt-இல் உள்ள ஓட்டைகள் எவ்வளவு குறைவாக உள்ளதோ, அவ்வளவு சிறப்பாக வீடியோ இருக்கும்.
கே2: ஒரு கவிஞனைப் போல் இல்லாமல், சிறந்த Sora 2 prompts-களை நான் எப்படி எழுதுவது?
பெயர்ச்சொற்களையும் வினைச்சொற்களையும் பயன்படுத்தவும்: யார் என்ன செய்கிறார்கள், எங்கே, எப்படி. Sora 2 prompt engineering-க்கு, “cinematic” என்பதை லென்ஸ், அசைவு மற்றும் நேரம் என்று மாற்றவும்; “vibe” என்பதை காட்சி உண்மைகள் மற்றும் எதிர்மறை இடம் (negative space) என்று மாற்றவும்.
கே3: எனது Sora 2 வீடியோ ஷாட்டின் நடுவில் உடைகள் மற்றும் props-களை ஏன் மாற்றுகிறது?
Continuity drift. Sora 2 prompt-இல் உடை, prop நிலைகள் மற்றும் கதாபாத்திர பண்புகளை வெளிப்படையாக லாக் செய்து, மாற்றங்களைத் தடை செய்யுங்கள். நீங்கள் அதைத் தடை செய்யாவிட்டால், மாடல் அதைச் சரியான விளையாட்டாகக் கருதுகிறது.
கே4: Sora 2 prompts சிறியதாக இருக்க வேண்டுமா அல்லது பெரியதாக இருக்க வேண்டுமா?
நீங்கள் வலுவான முன்தகவல்களைச் சார்ந்திருக்கும்போது சிறியது (எளிய, சின்ன காட்சியமைப்புகள்), நீங்கள் புதிய விவரங்கள் அல்லது நேர beats தேவைப்படும்போது பெரியது. Sora 2 prompt engineering-இல், வார்த்தை ஜாலம் ஒரு கருவி, ஒரு நல்லொழுக்கம் அல்ல.
கே5: இன்று Sora 2 முடிவுகளை மேம்படுத்துவதற்கான விரைவான வழி எது?
உரிச்சொற்களை வெட்டுங்கள், கேமராவை லாக் செய்யுங்கள், மேலும் ஒரு பொருள் மற்றும் செயலைக் குறிப்பிடவும். Continuity locks மற்றும் negatives சேர்க்கவும் - Sora 2 prompt engineering என்பது பெரும்பாலும் ஓட்டைகளை மூடுவது பற்றியது.