“Prompt Engineering” સાથે સમસ્યા પ્રોમ્પ્ટ્સમાં નથી
Sora 2 prompt engineering વિશેની વાત એ છે કે દરેક વ્યક્તિ તેને સમજી લે તેવું ભાન કરાવે છે—જ્યારે તેમની વિડીયો એવી લાગે છે જે કોઈ ઊંચી તાવની ચીમણી પર બનાવી હોય. માનસિક સ્વીકાર એ છે કે વધુ શબ્દો ઉમેરો, થોડુંજું જટિલ શબ્દજાળ પહોંચાડો અને આશા રાખો કે મોડલ તમારી મનની આસ્થા વાંચી લેશે. તે અચૂક નહીં. Sora 2 એટલી બુદ્ધિશાળી છે જેમ કે એક શ્રેષ્ઠ autocomplete: આશ્ચર્યજનક, પણ ખૂબ જ ચોક્કસ. તમે જે કહેવાનું છે તે واضح રીતે કહો. પ્રવેશકથા ને thesaurusની અંદર છુપાવશો નહીં.
ઉદ્યોગની વધાવટ એ છે કે prompt engineering એક રાસાયણ તરીકે હોવી જોઈએ. તે નથી. તે સંપાદન છે. તે દિશા નિર્દેશ છે. તે તમે મશીનને એ જવાબદારી આપવી કે તમે શું માંગો છો તે એવો પગાર આપવો જે તે કદી ન સમજાય. બાકીનું—“ગુપ્ત જાદૂ,” copy-paste વૂડૂ—અચૂક કાર્યક્ષમ હોય છે ત્યાં સુધી તે ચાલે છે. Sora 2 એ તેના કરતા વધુ સારો છે. તેને સહયોગી તરીકે માનો જે તમે જે કહો તે કહી લે અને રોજિંદા ડિસ્ક પર નજર રાખતો નથી.
અસલમાં શું ચર્ચા કરી રહ્યા છીએ
ચલશો સ્પષ્ટ બનીને કહીશું: Sora 2 prompt engineering એ એ કૌશલ્ય છે જેમાં prompt લખાય છે (અને જ્યાં ઉપલબ્ધ હોય ત્યાં સંદર્ભ ઇનપુટ અને નિયંત્રણો) જેથી રેખાધારિત અને નિયંત્રિત વિડીયો મળે. “પ્રેરણા” નથી. “ભાવના” નથી. તમે પ્રતિબંધો રચી રહ્યા છો—વિષય, ક્રિયા, કેમેરા, લાઇટિંગ, શૈલી, સમયગાળો, ગતિ અને કોન્ટિન્યુટરિ—તાટે મોડલ તમારા શહેરના દ્રશ્યમાં અર્ધમાર્ગે જ એક આબાદ ઘોડો ન રોકે.
સૌભાગ્યથી વિચારવાનો શ્રેષ્ઠ રસ્તો એ છે કે તમે શબ્દોમાં સ્ટોરીબોર્ડ કરી રહ્યા છો. તમારા પ્રોમ્પ્ટનું વાંચન જેટલું ટાઇટ શોટ લિસ્ટ સમજે તેવું હશે, એટલું જ Sora 2 શક્ય તેટલું વર્તન કરશે. જો તે ઢીલું અને વિવાદાસ્પદ હોય, જેમ કે હાથવાળો વિશેષણો, પાંચ શૈલીઓના અથડામણ, દિવસના સમયનું schizophrenic વર્તન હોય ત્યારે આઉટપુટ મોડલનું અવ્યક્તમાન સ્મૃતિનો એક કોલાજ જેવું લાગે.
Sora 2 પ્રોમ્પ્ટ માટે સરળ અને સ્પષ્ટ ફ્રેમવર્ક
મારે પણ ફ્રેમવર્કમાં રસ નથી, પરંતુ આ ફ્રેમવર્ક યોગ્ય છે. Sora 2 પ્રોમ્પ્ટને પાંચ સ્તરોમાં વિચારવા. તમે કોઈ પણ સ્તર અવગણાવી શકો છો, પણ જો કોઈ સ્તર ગેરહાજર હોય તો મોડલ તેને kliše સાથે ભરી દે છે.
- વિષય અને ઇરાદો (શું અને શા માટે)
- એક મુખ્ય વિષય. કદાચ એક સહાયક વિષય. બસ એટલું જ.
- ઇરાદો: જોવા વાળાને શું લાગવું કે સમજવું જોઈએ.
- ઉદાહરણ: “એકલો સાયકલસવાર શાંતિ અને દ્રઢnata દર્શાવવા માટે ભૂરા ધુમ્મસવાળું પુલ પાર કરે છે.”
- દ્રશ્ય વિગતો (કहाँ અને ક્યારે)
- સમય, હવામાન, સ્થાનની ચોક્કસ વિગતો. સ્પષ્ટ સત્વો કાવ્યાત્મક વિશેષણોથી વધારે સારાં છે.
- “સુવર્ણ કલાક” એ “સુંદર લાઇટિંગ” કરતાં શ્રેષ્ઠ છે. “ભેજવાયું એસ્ફલ્ટ જે નીઓન પ્રતિબિંબ આપે છે” એ “સાયબરપંકી” કરતાં વધુ અસરકારક છે.
- શૉટ પ્રકાર, લેન્સ વાઇબ, કેમેરાનો હલનચલન, ગતિ.
- “સ્લો ડોલી-ઇન 50mm-برابر લેન્સ સાથે; હેન્ડહેલ્ડ માઇક્રો જીટર મિનિમમ” એ “સિનેમેટિક” કરતાં ઉત્તમ.
- દૃશ્ય શૈલી અને પ્રતિબંધો (કેસે દેખાય)
- એક જ શૈલી પસંદ કરો: ફોટોરિયલિસ્ટિક, 16mm ફિલ્મ, સેલ એનિમેશન, વાટરકલર. ત્રણ શૈલીઓ ભેળવવાની કોશિશ ન કરો.
- પેલેટ, ટેક્સચર, અને યુગ સંદર્ભોમાં મર્યાદા રાખો.
- કાંટીન્યુઈટી અને ના-ના (સ્થિર રાખો)
- પાત્રના લક્ષણો, પ્રોપ્સ અને આધિકારીક વિગતો કડક રાખો.
- સ્પષ્ટ નકારાત્મક: “કોઈ પોશાક બદલ નહીં; કોઈ લખાણ.overlay નહીં; કોઈ વોતળતા આકૃતિ નહીં.”
Sora 2 પ્રોમ્પ્ટ એ વધુ શબ્દો ભરવું નથી; તે ખામીઓ દૂર કરવાનો છે. તમે વિનમ્ર અને ચોક્કસ સહયોગી સાથે કરાર લખી રહ્યા છો. ખામીઓને બંધ કરો.
શબ્દોનું ટૂંકુ યાદી જે તમને મુશ્કેલીમાં મૂકે છે
- “સિનેમેટિક.” અર્થ બધું અને કંઈ નથી. તેના બદલે તમે જે કેમેરા, લેન્સ અને ગતિ જોઈએ તે સ્પષ્ટ કરો.
- “એપિક.” એ છે “મેં નક્કી કર્યું નથી”નો સમાન શબ્દ.
- “હાઇપરરીઅલિસ્ટિક.” છિદ્ર પર વધારે ધ્યાન આપે છે, કમ્પોઝિશન ભૂલી જાય છે.
- “વાઇબ.” જો તમે નાઉનથી વર્ણવી શકતા નથી, તો તમારી પાસે વાઇબ નથી.
- “AI-style [કલાકાર નું નામ].” સ્પષ્ટ સમસ્યાઓ સિવાય, તે મોડલ માટે દેખાવ સહિયાર તુલનામાં વિધાન મહત્વનું છે. સંદર્ભ સામગ્રી ઉપયોગ કરો,tribute નથી.
Sora 2 ઇરાદાને નહીં પરંતુ નિર્દેશને માન આપે છે. જો તમારું પ્રોમ્પ્ટ ટ્રેલર વોઇસઓવર જેવી લાગે, તો ટ્રેલર જેવા સરળ કટ્સ અપેક્ષાઓ: ઝડપી, અસંબંધિત, ફક્ત શણગાર.
એક તર્ક: સંક્ષિપ્તતા અને નિર્દેશ્ટતા
- “ટૂંકા પ્રોમ્પ્ટ” વાળા મત છે કે Sora 2 સારી રીતે કામ કરે છે જ્યારે તેને વેદન વિનાનું આપી દેવું. ક્યારેક સાચું. ટૂંકુ સારું છે જ્યારે તમારું કલ્પના પ્રતીકાત્મક અને દૃશ્યતઃ સ્પષ્ટ હોય: “મોન્યુમેન્ટ વેલીમાં ધૂપ-વાદળના વચ્ચે પહાડની વાતાવરણ.” Sora 2 એને હજારો વાર જોઈ ચૂકી છે; પૂર્વગ્રહ બાકી કામ કરે છે.
- “નૉવેલા પ્રોમ્પ્ટ” વાળા વધુ સૂચનો ઉમેરે છે. ક્યારેક જરૂરી હોય છે. જો તમારે 8 સેકંડમાં સતતતા જોઈએ—એકજ જરૂરી કપડાં, એકજ કૂતરો, એકજ કૉફી કપ—ટૂંકાશ તમને નુકસાન પહોંચાડે છે. સ્પષ્ટ કરો નહીં તો સતાવટ હવિશે.
સારાંશ: જ્યાં પૂર્વગ્રહ મજબૂત હોય ત્યાં ટૂંકુ રહો (સામાન્ય દ્રશ્યો, સામાન્ય ભૌતિકશાસ્ત્ર), જ્યાં પૂર્વગ્રહ નબળા હોય ત્યાં પુર્ણ નિર્દેશ કરો (નવી વસ્તુઓ, જટિલ ક્રમ, મિશ્ર પ્રકાશ, બ્રાન્ડેડ વિગતો). જો તમે ખબર ન હોય કે તમે કયા ગુટકામાં છો, તો તમે બીજામાં છો.
પ્રાયોગિક Sora 2 પ્રોમ્પ્ટ પેટર્ન જે વાસ્તવમાં કાર્ય કરે છે
આને નુસ्खા તરીકે ઉપયોગ કરો, ધાર્મિક ગ્રંથ તરીકે નહિ. ખાલી જગ્યો ભરો, અશોભન બતાવનાર શબ્દો કાઢી નાખો.
- એક વિષય સાથે ક્રિયા, નિયંત્રિત કેમેરા
પ્રોમ્પ્ટ: “ફોટોરિયલ વિડીયો, 8 સેકંડ. [વિષય] [એક ક્રિયા કરે છે] [સ્થળ]માં [દિવસનો સમય]. બંધ ત્રાઈપોડ, મધ્યમ શૉટ, કુદરતી ગતિ. નરમ મેઘમુખ અવકાશ પ્રકાશ; ઘણી ઊંડાઈ ન હોવી. સ્થિર વસ્ત્ર: [વર્ણન]. કટીંગ નહીં, લેખનનલેખન નહીં, સમય લાપ્સ નહીં.”
કેમ કાર્ય કરે છે: ગતિ મર્યાદિત કરે છે, સતતતા કડક રાખે છે, મોડલે મોન્ટેજ કરવાની ઇચ્છા ટાળો છે.
- સ્થાપન થી વિગત સુધી વિના તીવ્ર કટ
પ્રોમ્પ્ટ: “10 સેકંડ. [સ્થળ]નું વ્યાપક દ્રશ્ય સાથે શરૂઆત; ધીમે 5 સેકંડ ડોલી-ઇન. 6મા સેકંડે, [વિષય]ની મધ્યમ શૉટમાં સરળ સામાયિક ફેરફાર સાથે. સુવર્ણ કલાકના પૃષ્ઠપ્રકાશ; લેન્સ ફ્લેર મૃદુ. રંગ પેલેટ ગરમ નારંગી અને હળવા નીલા રાખો. કોઇ રેક ફોકસ નહીં; અચાનક એંગલ બદલાવ ਨਹੀਂ.”
કેમ કાર્ય કરે છે: Sora 2 ને ક્રમ શીખવે છે અને ગડબડ ટાળે છે.
- શૈલીવાળી એનિમેશન સાથે સમયનું સુસંગતતા
પ્રોમ્પ્ટ: “હાથ સાથે દોરેલી, સેલ શૈલી એનિમેશન, 12 fps. સપાટી રંગો, જાડા આઉટલાઈન, મર્યાદિત પેલેટ [4 રંગ]. [પાત્ર] ડાબેથી જમણે [સ્થળ]માં ચાલે છે. સાઇડ-સ્ક્રોલર કેમેરા; પાછળનું ફળાક માત્ર પ્લેંટ પર. કેમેરા રોટેશન નહીં, દ્રષ્ટિકોણ બદલાવ નહીં. લૂપેબલ અંત: પાત્ર ફ્રેમ જમણે છૂટે.”
કેમ કાર્ય કરે છે: એનિમેશન શૈલીઓ પૂર્વગ્રહથી ભરપૂર છે પણ કેમેરા ફેરફારને સહન નથી કરતા. પ્લેન કડક રાખો.
- હવામાન અને ટેક્સચર ને મુખ્યતા
પ્રોમ્પ્ટ: “[સતહ]નું મૈક્રો બંધ દૃશ્ય, 6 સેકંડ, ત્રાઇપોડ. વરસાદનાં કણો બન્ને અને જોડાઈ રહ્યા છે, માટે વાસ્તવિક સમય. નરમ ટોપ-લાઇટ, અંધારું પૃષ્ઠભૂમિ. ઓડિયો સૂચિત પણ દેખાતું નથી. કટીંગ નહીં, માનવ પાત્ર નહીં, કેમેરા પ્રતિબિંબ નહીં.”
કેમ કાર્ય કરે છે: ટેક્સચર માટે કોર પૂર્વગ્રહ છે; પ્રતિબંધ અવાંછિત પ્રવેશ રોકે છે.
- ડાયલોગ વિનાનું નાનકડુ નાટક
પ્રોમ્પ્ટ: “ફોટોરિયલ, 9 સેકંડ. [પાત્ર A], [ઉંમર/લિંગ], [નિર્દિષ્ટ વસ્ત્ર], [સ્થળ] ખાતે રાહ જોઈ રહ્યો છે. તે ટેસ્ટ ચેક કરે, હળવો સ્મિત કરે, ફોન પોકેટમાં મૂકે. ઓવર-દ-શોલ્ડર મધ્યમ શૉટ; ઊંડું DOF; શહેર બોકેહ. કુદરતી હાથની ગતિ, હોઠ ન હલાવે. વાળની લંબાઈ [નિર્દિષ્ટ], ડાબા અનુખે રિંગ સતત. પૃષ્ઠભૂમિ પાત્ર બદલાવ નહીં.”
કેમ કાર્ય કરે છે: નાનો, માનવાકૃતિ માપદંડ; સતતતા એન્કર્સ Sora 2 ને પ્રોપ અથવા ચહેરા બદલવાની મનાઈ આપે છે.
કાંટીન્યુટી સમસ્યા (અને તેને અટકાવવાનો ઉપાય)
Sora 2 નું મોટું જાદૂ પણ તેની નબળી જગ્યાઓમાંથી એક છે: તે નવાઈનું સર્જન કરે છે. તે અગત્યનું છે ત્યાં સુધી kaffe mug એક ફ્રેમથી બીજા ફ્રેમ સુધી ટેબલના એકદમ વિભિન્ન જગ્યાએ ચાલતું રહે. કાંટીન્યુટી તૂટવાનું મૂળ જુનરેટિવ મોડલ્સમાં હોય છે; તે દરેક ક્ષણની આગાહી કરે છે અને છેલ્લું મેચ કરવાનો ઝુકાવ રાખે છે. જ્યારે તમારું પ્રોમ્પ્ટ અસપષ્ટ હોય ત્યારે આગાહી ભટકે છે.
ઉપાય કે જાદૂ નથી:
- એકલવ્યક્તિ વધારાઓ કડક કરો. “ટેબલના પૂર્વ તરફ એક લાલ સીરામિક કપ જેમાં ખૂટ્ટો છે.” ‘‘એક કપ’’ ના કહો.
- પોશાક કડક ઠેરવો. “બ્લૂ ડેનિમ જેકેટ બે છાતીની કેપ સાથે, તાંબાની બટનો સાથે, કેોચી વગર. બદલશો નહીં.”
- ખાલી જગ્યા ઉપર નિયંત્રણ રાખો. “ખાલી ટેબલ; કપ સિવાય બધું ખાલી.” જો તમે નહિ કહો તો મોડલ ભરશે.
- કેમેરા હલનચલન મર્યાદિત કરો. હળવે અવકાશમાં વધુ ગતિ નો ઉમેરો વધુ તૂટફૂટ કરવાનો મોકો છે.
- એન્કર બિટ્સ વાપરો. “3 સેકંડે વિષય નીચે જોઈ; 6 સેકંડે વિષય visibly શ્વાસ ફેંકે.” જ્યારે સમય સ્પષ્ટ હોય ત્યારે ભટકેવા માટે જગ્યા ઓછી રહે.
Sora 2 prompt engineering મોટાભાગે સતતતા ઇજનેરી છે. આને સ્વીકારો અને તમારા આઉટપુટ વધુ સારું થશે.
શૈલી એ કપડા નથી, તે પ્રતિબંધ છે
લોકો “વેસ એન્ડરસન” માંગે છે તે રીતે જેમ “એસ્પ્રેસો” માંગે છે—જે લોકોને સામાન્ય રીતે ખાંડ માંગવી હોય તેવા. શૈલી એ કપડા નથી જે તમે કોઈ પણ વિષય પર મૂકી શકો. Sora 2 માં શૈલી એ નિયમ પસંદ કરે છે જેમ કે રંગ, રચનાત્મકતા, ગતિ, અને લેન્સ વર્તન.
એક પસંદ કરો:
- ફોટોરિયલ: ત્વચાના છિદ્રો, લેન્સના ખામી, વાસ્તવિક ભૌતિકશાસ્ત્ર. ઉત્પાદન અને માનવીય ભાવના માટે શ્રેષ્ઠ. સોસાવેલા પ્રોમ્પ્ટ માટે કડક.
- ફિલ્મ સ્ટોક અનુકરણ (16mm, 35mm): દાણેદાર, હેલેશન, નરમ રોલઓફ, ઓછું સેચ્યૂરેશન. સંયમથી વાપરો, સ્ટોક યુગ સ્પષ્ટ કરો, અને લાઇટિંગ સરળ રાખો.
- એનિમેશન (સેલ, સ્ટોપ મોશન, વાટરકલર): સ્પષ્ટ પરિબળો, સતત રેખાઓ, સ્થિર કેમેરા પ્લેનને પ્રાધાન્ય આપે છે. વધુ વિગતો સમયસીમાને બગાડે છે.
- ગ્રાફિક/ચાલિત: સપાટી રંગો, વધુ તફાવત, બહાદુર જ્યોમિત્રિ. ગતિ ઓછા અને નિમિત્તમિતી હોય ત્યારે ეფექტકારક.
ભૂલ એphotoreal લાઇટિંગ સાથે illustrative line art માંગવી. તે થઈ શકે છે, પરંતુ મોડલ પોતાની જાત સાથે વિવાદ કરે એટલે સમયને અવાજમય બનાવો.
“વધારે વિશેષણ = ઉત્તમ વિડીયો” ની ખોટી કલ્પના
જો તમને ચોક્કસ આઉટપુટ જોઈએ તો ચોક્કસ સત્વો અને ક્રિયાઓ વાપરો. વિશેષણ તો માત્ર શણગાર છે:
- ખોટું: “એક સિનેમેટિક, એપિક, હાઇપરરીઅલ શૉટ એક સુંદર કારનો futurisitic cyberpunk શહેરમાં ઝડપી દોડતો.”
- જમણું: “ફોટોરિયલ શોટ, 6 સેકંડ. 1971 Datsun 240Z નારંગી રંગમાં શિબુયા રાત્રિના હળવા વિષ્ણુપર્વ વરસાદમાં. માઉન્ટેડ હૂડ કેમેરા, 24mm-برابر, થોડીક મૂવિંગ બ્લર સાથે, ભેજવાંએસફાલ્ટમાં નીઓન સાઈન પ્રતિબિંબતા. ટ્રાફિક મધ्यम રાખો; પોલીસ ના કારી; લોગો ક્લોઝ અપ ના.”
સારો પ્રોમ્પ્ટ ચીડવતો નથી. તે તમને ચોક્કસ કહે છે શું થશે, ક્યા, કેવી રીતે, અને શું ના કરવું.
જ્યારે લાંબા પ્રોમ્પ્ટની જરૂર હોય
- એક સાથે વધુ ક્રિયાઓ. જો કેમેરા અથવા વિષય ચોક્કસ સમય પર વર્તન બદલવું હોય તો સ્પષ્ટ લેખો.
- બ્રાન્ડેડ અથવા નિયમિત સામગ્રી. તમને ક્ષણભ્રમ લોગો અથવા અસુરક્ષિત વર્તન ન જોઈએ. નકારાત્મક પ્રોમ્પ્ટ અનિવાર્ય.
- નવાં વસ્તુઓ અથવા વિશ્વ. જો તમે “ગ્લાસ છત્રી જે સ્ટ્રિટલાઇટ્સને વિભાજિત કરે” બનાવી રહ્યા છો, એની રચના અને વર્તન નિર્દિષ્ટ કરો.
- પોસ્ટ સાથે ઇંટરઓપરેબિલિટી. જો કૉમ્પોઝિટ થવાનું હોય તો લાઇટિંગ, ગતિ બ્લર અને પ્લેટની સફાઈ મર્યાદિત કરો.
બીજો કે, verbosity સોડિયમ જેમ સમજો. તમે ઉમેરી શકો છો; પાછું લઈ શકતા નથી.
ઈટેરેશન: એક બોરિંગ પરંતું રહસ્યમય
સ્ફૂર્તિશીલ લોકો માને છે કે પહેલી વાર પ્રયાસ જ રોમાંચક હોવો જોઈએ. Sora 2 એટલો ઝડપી છે કે તમે શાંતિપૂર્વક અને દૃઢ પદ્ધતિથી કામ કરી શકો છો:
- ન્યૂટ્રલથી શરુ કરાઓ. એક વિષય, એક ક્રિયા, એક કેમેરો. સતતતા કડક કરો.
- એક વખતે એક જ બધલો. જો લાઇટિંગ અને કેમેરા બંને બદલશો તો ખોટું શું તોડી રહ્યું તે સમજાશે નહીં.
- પ્રોમ્પ્ટ અને આઉટપુટનો લોગ રાખો. ગૂગલ ડોક પણ ચાલે. ભવિષ્યનું તમે આભાર માનશે.
- સીડ ફરીથી ઉપયોગનું સમર્થન કરો જ્યાં ઉપલબ્ધ હોય. નિયંત્રણ પૂર્વાનુમાન લાવે છે.
રોમાંચ ત્રીજા ડ્રાફ્ટમાં આવે છે જયારે વિડીયો વહીવટ કરે અને તમે વચન આપો કે તમે કાંઇ કર્યું જ નથી. તમે કર્યું છે: તમે મોડલને બહાનું આપવાનું બંધ કર્યું.
ઘણો સમય બચાવતા માર્ગદર્શન
- કાળવ્યાપારક ભાષા મહત્વની. “4 સેકંડે” એ “પછી” કરતાં વધુ અસરકારક.
- સ્થાનિક એન્કરો મહત્વના. “સ્ક્રીન-ડાબા” એ “ડાબા તરફ” કરતાં ઉત્તમ.
- ભૌતિકશાસ્ત્ર મહત્વનો. મૂળભૂત ગતિના નિયમો લંગડાવવાના પાંચ તત્વો ન માંગો. મોડલે દુનિયા જોતા ભૌતિકશાસ્ત્ર શીખ્યો છે; તેને ગેસલાઇટ ન કરો.
- ચહેરા મુશ્કેલ છે. થોકનો ઢાંચો, લાઇટિંગ અને અંતર કડક રાખો જો સ્થિરતા જોઈએ. ચહેરા પર તેજ રીતે ઝડપી ઝૂમ ન કરો નહિ તો વિખૂટો થશે.
- ભીડ ગડબડ છે. જો જરૂરી હોય તો તેને ડિપ્થ ઓફ ફીલ્ડ અથવા ઓછા પ્રકાશથી ધુમસાવો. એકત્રિત વ્યક્તિઓને તારાં સ્ટાર ના બનાવો.
Sora 2 પ્રોમ્પ્ટ ઇજનેરિંગ માટે કાર્યરત ટેમ્પલેટ
કૉપી કરો અને પછી તમારી જરૂર મુજબ બદલો. જે લખવાનું ન હોય તે લાઈનો કાઢી નાખો.
શીર્ષક/ટૅગ: Sora 2 prompt engineering — [પ્રોજેક્ટનું નામ]
ઇરાદો: [એક વાક્યમાં જોવા વાળા માટે લાગણી કે વિઝન].
સમયગાળો: [X] સેકંડ, એક સતત શૉટ. કટીંગ વિનાનું, નહિં તો જણાવો.
વિષય: એક [સ્પષ્ટ વિષય], [ઉંમર/વર્ણન], [વસ્ત્રની વિશેષતાઓ].
દ્રશ્ય: [સ્થળ], [દિવસનો સમય], [હવામાન]. મુખ્ય પ્રોપ્સ: [નાઉન]. નકારાત્મક જગ્યા: [ખાલી રહે તે].
કેમેરા: [શૉટ પ્રકાર], [લેન્સ મૂડ], [ચાલ-ફેર], [પેસ]. افق ના નિમિત્તે [સંયમિત/ઝૂકી]. ફ્રેમિંગ: વિષય [સ્ક્રીન સ્થિતિ].
લાઇટિંગ: [સ્ત્રોત], [ગુણવત્તા], [દિશા]. ટાળો [અનિચ્છનીય પ્રકાશ].
શૈલી: [ફોટોરિયલ/ફિલ્મ સ્ટોક/સેલ એનિમેશન/અન્ય], પેલેટ [જોડી ત્રણ-ચાર રંગ]. ટેક્સચર/કણ [જો હોય].
ક્રિયા સમયરેખા:
- 5 સેકંડથી અંત સુધી: [ક્રિયા]
કાંટીન્યુટી તાળા: [વસ્ત્ર વિગતો], [પ્રોપ સ્થિતિ], [વાળ/આંખનો રંગ], [લેખન.overlay ન હોય], [લોગો બદલાવ ન કરો].
નકારાત્મક: مورફિંગ નહીં, જમ્પ કટ નહીં, સમય લાપ્સ નહીં, કલ્પિત સાઇનજો નહીં, કેમેરા પ્રતિબિંબ નહીં.
વાસ્તવિકતા ચેક: સાધનો સ્વાદ બદલી શકતા નથી
તમારે સૌથી શુદ્ધ Sora 2 પ્રોમ્પ્ટ લખી શકો, છતાં તમારું સ્વાદ ખોટું હોય તો અલોચનપાત્ર ક્લિપ મળશે. રચના, લય, પ્રકાશ. આ ફેશન નથી, કાયદા છે, અને Sora 2 તમને શીખવાથી મુક્ત નથી. વધારે પ્રોમ્પ્ટ એ ડિઝાઇનનો અભાવ છે: મોડલે તેની પસંદगी પ્રમાણે અનમને ટેકવી ના દે.
જોયું તો Sora 2 prompt engineering નું રહસ્ય છે સંયમ. ઓછું માંગો અને વધુ મેળવો. બધું માંગો અને સૂપ મળશે.
જ્યાં Sider.AI મદદ કરે છે (અને જ્યાં નથી)
Sider.AI ખરેખર કાર્યકર છે—ખાસ કરીને જ્યારે તમે એને તેની મજબૂતી માટે ઉપયોગ કરશો, જે સાહજિક રીતે બધાએ જવા માટે શોખ વ્યક્ત નથી કરતા. તે “આર્ટ બનાવો” બટન નથી. તે “સાધારણ પ્રતિબંધો ભૂલશો નહીં” સહાયક છે. તમારું Sora 2 પ્રોમ્પ્ટ તૈયાર કરો, પછી Sider.AI ને કોડ સંપાદક જેવી રીતે પરીક્ષા માટે આપો: અનિયંત્રિત વિશેષણો, વિધાન વિવાદાસ્પદ કેમેરા ચળવળો, કાંટીન્યુટી તાળા ગુમવાના ચિતાવે છે. એ એ પ્રેરણા છે જે કહે છે, “તમે એક સાથે હેન્ડહેલ્ડ અને ત્રાઈપોડ માંગ્યા.” જ્યાં મદદ નહીં કરે: સ્વાદ શોધવામાં અથવા અણિશ્ચિતતાનો ઉકેલ લાવવામાં. જો તમને ખબર ન હોય કે તમારું ક્લિપ ડોલી કે લોક-ઓફ ચાહે છે, તો કોઈ સાધન જવાબ આપી શકતું નથી. પણ જ્યારે નક્કી થાય, Sider.AI પ્રોમ્પ્ટને સ્પષ્ટ, પુનરાવર્તિત અને સુંદર ટૂંકું બનાવવામાં સારો છે. ખૂબ કાર્યક્ષમ ઉદાહરણ: પહેલાં અને પછી
ઉદાહરણ 1: ઉત્પાદન હીરો શૉટ
- પહેલા: “સિનેમેટિક, એપિક શૉટ અમારા નવીન સ્માર્ટવોચનું માર્બલ ટેબલ પર, ડ્રામેટિક લાઇટિંગ, પાણીના બૂંદો, અત્યંત વિગતવાર.”
- પછી: “ફોટોરિયલ મૈક્રો, 6 સેકંડ. અમારી સ્માર્ટવોચ (41 એમએમ, સીલ્વર એલ્યુમિનિયમ, કાળો ફ્લુઓરોએલાસ્ટોમર બૅન્ડ) મેટ વ્હાઈટ માર્બલ પર. સ્થિર ત્રાઈપોડ; ધીમું 2% પ્રવર્તિત પોશ, હેન્ડહેલ્ડ નહીં. એક ટોપ સોફ્ટબોક્સ; ક્રિસ્ટલ પર હળવા ધૂળા થવાથી નાના બૂંદો બનતા. સ્ક્રીન બંધ, ક્રોન 3 વાગ્યે. માત્ર અમારી લોગો; કોઈ લખાણ.overlay ના.”
શા માટે બદલાયું: દરેક પરથી નિશ્ચિત, “એપિક” દૂર કર્યું. પરિણામ શૉટ લિસ્ટ જેવું છે, મૂડ બોર્ડ જેવું નહીં.
ઉદાહરણ 2: સ્ટ્રીટ દ્રશ્ય માનવીય તાલ સાથે
- પહેલા: “એક ઠંડો સાઇબરપંક શહેર દ્રશ્ય જ્યાં એક વ્યક્તિ નીઓન વાઇબ્સ સાથે ચાલે, સિનેમેટિક.”
- પછી: “8 સેકંડ, ફોટોરિયલ. રાત્રિ શિજયુકુ બાજુ માર્ગ હળવા વરસાદમાં; ભેજવાં આસ્ફાલ્ટ નીઓન સાઈન પ્રતિબિંબતા. એક વ્યક્તિ: સ્ત્રી, 30 વય, નાવી ટ્રેંચ, સફેદ સ્નીકર્સ, કરુણ કાળા બોબ વાળ. મધ્યમ-વિસ્તૃત, આંખ સ્થીતિવાળી, સ્થિર કેમેરા; વિષય સ્ક્રીન-જમણા રહેતાં કેમેરા તરફ વધે છે. પેલેટ ઠંડા નિલા અને ક્યારેક મેજેન્ટા. અંગ્રેજી સાઈનેજ નહીં; છત્રી નહીં; લેન્સ બદલી નહીં.”
શા માટે બદલાયું: એક વિષય, એક ગતિ, અર્થવંત ભાષા. ક્લિપ સમર્થ છે.
ઉદાહરણ 3: શૈલિવાળું લૂપ
- પહેલા: “એક વિસ્મયકારક એનિમેટેડ લૂપ એક બિલાડીની જાદૂઈ જંગલમાં, સ્ટુડિયો گھિબલી વાઇબ્સ.”
- પછી: “સેલ શૈલી એનિમેશન, 12 fps. કાલિકો બિલાડી કાંકડિયા લાકડાં પર બેસી છે નાના ખૂણામાં; જ્યોતીમધુરો ફરતા રહે છે. નિશ્ચિત કેમેરા, બાજુથી. મર્યાદિત પેલેટ: જંગલી લીલો, પીલ નારંગી, ગરમ ભૂરા,クリーム. હળવી પવન પાંદડાઓ હલાવે; બિલાડી પાંજરો દરેક 2 સેકંડ. લૂપેબલ અંત: પવન અને ജ્યોતીમധുരો પાછા શરુઆત ના સ્થાન પર આવે; કેમેરા હલાવ timeline નહીં.”
શા માટે બદલાયું: નામ જપવાનું ટાળ્યું; શૈલી નિયમો દ્વારા નિર્ધારિત.
Sora 2 ટીમો માટે પ્રોમ્પ્ટ ઇજનેરિંગ
જોકે તમને સ્ટેકહોલ્ડર્સ સાથે કામ કરવું હોય, તમારું સૌથી મોટુ શત્રુ એ એડજેક્ટિવ દ્વારા સહમતી મેળવવું છે. બધાએ 'જરૂરથી ઊર્જા વધારવી' અને 'જમતી સિનેમેટિક' માગે છે એ કોઈ નિયંત્રણ રૂપ છે. એડજેક્ટિવને ચોઇસથી બદલો.
- એક પ્રોમ્પ્ટ સ્પેક્સ એક પૃષ્ઠમાં બનાવો. એ વાક્યોના શૉટ લિસ્ટ જેવું હોય.
- એક મંજૂરી તપાસ સૂચિ ઉમેરો: સમયગાળો, વિષયોની સંખ્યા, કેમેરા, લાઇટિંગ, શૈલી, સતતતા તાળા, નકારાત્મક મુદ્દા. જો કોઈ બોક્સ ચેક ન હોય તો પૂરું નથી.
- પ્રોમ્પ્ટ અને આઉટપુટ સાથે નોંધો સંગ્રહો. વર્ઝનિંગ કરો. તમારી “ગોલ્ડન પ્રોમ્પ્ટ્સ” સંપત્તિ બની જશે.
ટીમો જે Sora 2 પ્રોમ્પ્ટને ઉત્પાદન દસ્તાવેજની જેમ માનશે તેમને એવા પરિણામ મળશે જે ઉત્પાદન જેવા લાગશે, શોધેલ નહિ.
"ટેરોટ કાર્ડ્સ" વગર સમસ્યાનું નિરાકરણ
- તે અણધારી રીતે કટ થયા કરે છે. તમે સંભવતઃ કટ સૂચવ્યું ("દરમિયાન", "અચાનક", બહુવિધ ક્રિયાઓ) અથવા મોન્ટેજ ભાષાનો ઉપયોગ કર્યો. "સિંગલ કંટીન્યુઅસ શૉટ" ને ફરજિયાત કરો અને સ્પર્ધાત્મક બીટ્સ દૂર કરો.
- ચહેરા મોર્ફ થયા કરે છે. હેડ ઓરિએન્ટેશન, અંતર અને લાઇટિંગ લૉક કરો. ગતિ ઓછી કરો અને ઝડપી પુશ-ઇન્સને પ્રતિબંધિત કરો. લાગણી વિશે ઓછા વિશેષણો, શારીરિક ક્રિયા વિશે વધુ.
- પ્રોપ્સ ટેલિપોર્ટ થાય છે. પ્રોપને નામ આપો, તેને ફ્રેમ અથવા સેટના સંબંધમાં મૂકો અને ઉલ્લેખિત ન હોય ત્યાં સુધી હલનચલનને પ્રતિબંધિત કરો. "આખા દરમિયાન [સ્થાન] પર રહે છે" નો ઉપયોગ કરો.
- શૉટ વ્યસ્ત લાગે છે. તમે મોડેલને ખાલી જગ્યા ભરવા દીધી. નેગેટિવ સ્પેસ જાહેર કરો અને પૃષ્ઠભૂમિની ગતિ ઓછી કરો.
- શૈલી ટમટમે છે. તમે બે લૂક્સ માટે પૂછ્યું. એક પસંદ કરો, અથવા સ્પષ્ટ ટાઇમસ્ટેમ્પ્સ પર સંક્રમણોને મંજૂરી આપો.
નીતિશાસ્ત્ર અને મૂળ વિશે એક શબ્દ
પ્રોમ્પ્ટ એન્જિનિયરિંગ તમને સ્રોતો વિશે વિચારવાથી મુક્ત કરતું નથી. જો તમે જીવંત કલાકારના દેખાવને નિશાન બનાવી રહ્યા છો, તો તમારી જાતને પૂછો કે શા માટે. જો જવાબ "કારણ કે તે લોકપ્રિય છે," તો તમે પહેલાથી જ પ્લોટ ગુમાવી દીધો છે. માળખાકીય આંતરદૃષ્ટિ લો—કલર બ્લોકિંગ, અસમપ્રમાણતા, છીછરી DOF—અને તેનું વર્ણન કરો. તમને કંઈક વધુ સ્વચ્છ, વધુ સુસંગત અને તમારું પોતાનું મળશે.
શાંત નિષ્કર્ષ
Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગ, તેની શ્રેષ્ઠતા પર, કાગળ પર નીરસ અને સ્ક્રીન પર આશ્ચર્યજનક રીતે હલનચલનવાળું છે. કારણ કે તમને જાદુઈ શબ્દો મળ્યા નથી, પરંતુ કારણ કે તમે મશીનને મહત્વના ભાગો પર સુધારવાની મંજૂરી આપી નથી. મોડેલને દિગ્દર્શન આપવાની રમુજી વાત એ છે કે તે વાસ્તવિક સેટ કરે છે તેવી જ શિસ્તને પુરસ્કાર આપે છે: તમારા વિષયને જાણો, તમારા શૉટને લૉક કરો, ઇરાદાપૂર્વક પ્રકાશ કરો, પૃષ્ઠભૂમિને દૃશ્ય ચોરતા અટકાવો.
જો તમને મંત્ર જોઈએ છે, તો અહીં એક છે: ઓછા વિશેષણો, વધુ સંજ્ઞાઓ; ઓછી વાઇબ્સ, વધુ ક્રિયાપદો. તમે શું કહેવા માગો છો તે કહો. મોડેલ બરાબર તે જ કરશે—ઓછું નહીં, વધુ નહીં. જે મુદ્દો છે.
કીવર્ડ નોંધો (જેઓ કાળજી લે છે તેમના માટે)
આ ભાગ Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગને આવરી લે છે, જેમાં Sora 2 માટે સ્પષ્ટ પ્રોમ્પ્ટ્સ કેવી રીતે લખવા, Sora 2 વિડિયો પ્રોમ્પ્ટ્સના ઉદાહરણો, સાતત્ય લૉક્સ, કૅમેરા સૂચનાઓ અને શૈલી અવરોધોનો સમાવેશ થાય છે. જો તમે અહીં સુધી વાંચ્યું હોય, તો અભિનંદન: હવે તમે જાણો છો કે આ વ્યવસાયમાં "સિનેમેટિક" એ સૌથી ઓછો સિનેમેટિક શબ્દ શા માટે છે.
FAQ
Q1: Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગ ખરેખર શું છે?
તે Sora 2 માટે શૉટ-ચોક્કસ સૂચનાઓ લખી રહ્યું છે—વિષય, કૅમેરો, લાઇટિંગ, શૈલી અને સાતત્ય—જેથી મોડેલ તમને ખોટી રીતે ન વાંચી શકે. તમારા Sora 2 પ્રોમ્પ્ટમાં જેટલા ઓછા લૂપહોલ્સ, તેટલો જ સારો વિડિયો.
Q2: કવિ જેવા લાગ્યા વિના હું વધુ સારા Sora 2 પ્રોમ્પ્ટ્સ કેવી રીતે લખી શકું?
સંજ્ઞાઓ અને ક્રિયાપદોનો ઉપયોગ કરો: કોણ શું કરે છે, ક્યાં અને કેવી રીતે. Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગ માટે, "સિનેમેટિક" ને લેન્સ, મૂવમેન્ટ અને ટાઇમિંગ સાથે બદલો; "વાઇબ" ને દૃશ્ય તથ્યો અને નેગેટિવ સ્પેસ સાથે બદલો.
Q3: મારા Sora 2 વિડિયો શા માટે મિડ-શૉટમાં આઉટફિટ્સ અને પ્રોપ્સ બદલતો રહે છે?
સાતત્ય ડ્રિફ્ટ. Sora 2 પ્રોમ્પ્ટમાં કપડાં, પ્રોપ પોઝિશન્સ અને કેરેક્ટર ટ્રેટ્સને સ્પષ્ટપણે લૉક કરો અને સ્વેપ્સને પ્રતિબંધિત કરો. જો તમે તેને પ્રતિબંધિત ન કરો તો, મોડેલ તેને યોગ્ય રમત તરીકે ગણે છે.
Q4: Sora 2 પ્રોમ્પ્ટ્સ ટૂંકા હોવા જોઈએ કે લાંબા?
જ્યારે તમે મજબૂત પ્રાયર્સ (સરળ, આઇકોનિક દ્રશ્યો) પર ઝૂકશો ત્યારે ટૂંકા, જ્યારે તમને નવલકથાની વિગતો અથવા ટાઇમ્ડ બીટ્સની જરૂર હોય ત્યારે લાંબા. Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગમાં, શાબ્દિકતા એ એક સાધન છે, સદ્ગુણ નથી.
Q5: આજે Sora 2 પરિણામોને સુધારવાનો સૌથી ઝડપી રસ્તો કયો છે?
વિશેષણો કાપો, કેમેરા લૉક કરો અને એક જ વિષય અને ક્રિયા સ્પષ્ટ કરો. સાતત્ય લૉક્સ અને નકારાત્મકતાઓ ઉમેરો—Sora 2 પ્રોમ્પ્ટ એન્જિનિયરિંગ મોટે ભાગે લૂપહોલ્સ બંધ કરવા વિશે છે.