በጽሑፍ ላይ የተመሠረተ ምስል (text-to-image) በተመለከተ ሁሉም ሰው እስኪጠቀሙበት ድረስ አስማት ነው የሚመስለው፡፡ ሲጠቀሙት ግን የውኃ ቧንቧ ይመስላል፡፡ Grok Image 0.9–በተለምዶ “Grok Imagine” ተብሎ የሚጠራው–የተለመደውን ነገር ቃል መተየብ፣ ሥዕል ማግኘት፣ ሲኒማዊ ስሜት ካለዎት ደግሞ አጭር ቪዲዮም ቢሆን ማግኘት እንደሚቻል ቃል ይገባል፡፡ ዋናው ቁም ነገር የሚሰራ መሆኑ አይደለም፡፡ ቁም ነገሩ በእርስዎ ፍላጎት መሠረት፣ በተከታታይ፣ እያንዳንዱን ፒክስል እንደ አንድ መድረክ ላይ ያለች እናት ሳትጠብቁት እንዲሰራ ማድረግ ነው፡፡
ስለዚህ Grok Image 0.9ን በመጠቀም ጥያቄዎችን ወደ ምስላዊ ይዘቶች ለመለወጥ የሚረዳ ቀጥተኛ መመሪያ እነሆ–መሣሪያው የት ጎልቶ እንደሚታይ፣ የት እንደሚቀብር እና የት ግብይት ላይ ማተኮር እንዳለቦት በተጠራጣሪ ዓይን ይመልከቱ፡፡ እዚያ አካባቢ “Aurora engines”፣ የሚያማምሩ የቪዲዮ የይገባኛል ጥያቄዎች እና ስያሜዎችን ስለ መቀየር ወሬዎችን ጨምሮ ጫጫታ አለ፡፡ አንዳንዶቹ እውን ናቸው፣ አንዳንዶቹ ደግሞ ምኞታዊ ናቸው፡፡ “መስራት የሚችለውን” ከ “በንግግር ጊዜ ጥሩ ከሚመስለው” እንለያለን፡፡ እንደ አውድ፣ የxAI’s Grok ይፋዊ የመልቲሞዳል ችሎታዎች አሉት–የነገር መለየት እና በቋንቋ የሚመራ እይታ በሰነድ ተመዝግቧል፣ ይህም በምርት ስሙ ስር እውነተኛ መሠረት እንዳለ ያሳያል፡፡ እንዲሁም እንደ 0.9 ያሉ ስያሜዎችን የያዙ እና ከፍተኛ የባህሪ ዝርዝሮች ያሏቸው ጽሑፍን ወደ ምስል እና ጽሑፍን ወደ ቪዲዮ የሚቀይሩ “Grok Imagine” የፊት ገጽታዎች እያደገ የመጣ የጎጆ ኢንዱስትሪ አለ፡፡ እንደ ሁልጊዜው ተጠንቀቁ፡፡
ለምን Grok Image 0.9, እና ለምን አሁን?
- ምክንያቱም ጽሑፍን ወደ ምስል መቀየር ሁለቱም ዲሞክራሲያዊ እና አስቆጪ ናቸው፡፡ ሁሉም ሰው መሞከር ይችላል, እና በመጀመሪያው ቀን ማንም በአግባቡ ሊመራው አይችልም. የአዕምሮ ሞዴል ያስፈልግዎታል.
- ምክንያቱም አዲሱ የGrok-ብራንድ ምስሎች የፎቶ-እውነታዊነት እና የቪዲዮ ፈጠራን ይጠይቃሉ፡፡ ግማሹ እንኳን ቢሳካ ጊዜዎን መዋዕለ ንዋይ ማፍሰስ ተገቢ ነው–በተለይ ለፈጣን ቅንብር፣ የስሜት መግለጫ ሰሌዳዎች (mood boards)፣ የትዕይንት ንድፎች (storyboards) እና ጥቃቅን ፅንሰ-ሀሳቦች፡፡
- ምክንያቱም መልቲሞዳሊቲ–ጽሑፍ፣ ምስል፣ ምናልባትም እንቅስቃሴ–“አሪፍ እንዲሆን አድርገው” ከሚለው እና ከጸሎት ይልቅ የተሻለ የጥያቄ ትምህርት ይጠይቃል፡፡
ይህ መመሪያ በተግባር ላይ ያተኮረ ነው፡- Grok በአግባቡ የሚያከብራቸውን ጥያቄዎች እንዴት መጻፍ እንደሚቻል፣ ሳይባክን እንዴት መድገም እንደሚቻል፣ ስልቱን እንዴት መቆጣጠር እንደሚቻል እና ስርዓቱ ሊሄድባቸው የሚችሉ ቦታዎች ላይ ያተኩራል።
ሆን ብለው ቀላል ይጀምሩ
ሰዎች የስክሪን ድራማዎችን እንደሚጽፉ ጥያቄዎችን ይጽፋሉ፣ ከዚያ ሞዴሉ ሲያሻሽል ይደነቃሉ። በአንድ መዋቅር ይጀምሩ
- ርዕሰ ጉዳይ፡ አንድ ግልጽ የሆነ የስም ሀረግ። “ወርቃማ ሪትሪቨር ቡችላ።”
- ዐውደ-ጽሑፍ፡ የት/መቼ/እንዴት “በኩሽና ውስጥ ፀሐይ ስትወጣ።”
- አመለካከት እና ሌንስ፡ “35ሚሜ፣ ጥልቀት የሌለው የመስክ ጥልቀት፣ f/2.0, የቅርብ-መጠን።”
- ድምጽ/ቅጥ፡ “ለስላሳ የተፈጥሮ ብርሃን፣ ሞቅ ያለ የቀለም ቅደም ተከተል።”
- የውጤት ቅርጸት፡ “4፡5 ምስል፣ 2048×2560”
ይኼው ነው፡፡ በአንድ መስመር አንድ ዓረፍተ ነገር፡፡ ሞዴሉ መሠረታዊ ነገሮችን በአግባቡ እስኪመታ ድረስ ቅጽሎችን ያስወግዱ፡፡ በGrok Image 0.9–ወይም በማንኛውም ጽሑፍ-ወደ-ምስል ሞተር–የመጀመሪያው ድል ብልህ መሆን እንዲያቆም ማድረግ ነው፡፡ ብልህነት ለአንተ ነው; ቀጥተኛነት ደግሞ ለሞዴሉ ነው፡፡
እንደ ዳይሬክተር ይድገሙ፣ እንደ ቁማርተኛ አይደለም
- በእያንዳንዱ ድግግሞሽ አንድ ተለዋዋጭ ነገር ይቀይሩ፡፡ መብራትን፣ አቀማመጥን እና አቀማመጥን ካስተካከሉ፣ ውጤቱ ለምን እንደተሻሻለ (ወይም እንደወደቀ) አያውቁም።
- A/B መጠየቅን ይጠቀሙ፡፡ ጥያቄውን ያባዙት፣ አንድ አንቀጽ ይቀይሩ (“የጀርባ ብርሃን” ወደ “የቁልፍ ብርሃን በ45°”) እና ያወዳድሩ።
- ውድቅ የሆኑትን ከማስታወሻዎች ጋር ያስቀምጡ፡፡ መጥፎ ምስሎች ሞዴሉ የት እንደሚሄድ ያስተምሩዎታል፡፡ ጥሩ ሞዴሎች በትንሹ ይሄዳሉ፡፡ ምርጥ ጠያቂዎች መመሪያዎችን መጣስ የማይችሉ ያደርጋሉ፡፡
ስሞችዎን ያሻሽሉ
ውጤቶችን ለማሻሻል ፈጣኑ መንገድ የተሻሉ ስሞች ናቸው፡ የምርት ስሞች (የሚፈቀድ ከሆነ)፣ የሌንስ ስሞች፣ ቁሳቁሶች፣ የካሜራ አካላት እና የፊልም ክምችቶች፡፡ የፎቶግራፍ እውነታን የሚያስተዋውቁ ግሮክ-ብራንድ ምስሎች ብዙውን ጊዜ ለካሜራ/ሌንስ ቃላት ጥሩ ምላሽ ይሰጣሉ; ይህም ሞዴሉ በስልጠናው ወቅት አይቶት ሊሆን የሚችል ገደቦች ጋር ትዕይንቱን ያገናኛል፡፡
- ካሜራ/ፊልም፡ “Leica M10, Portra 400” ቀለም እና ጥራጥሬን ያመለክታል፡፡
- የሌንስ ዝርዝሮች፡ “50ሚሜ Summilux, f/1.4 bokeh” ጥልቀት እና ድምቀቶችን ይመራል፡፡
- ቁሳቁሶች፡ “የተወለወለ አሉሚኒየም፣ ማቲ ሴራሚክ፣ ዋልኑትት ሽፋን” ሸካራነትን ያብራራል፡፡
የቅጥ አጥር (ስለዚህ በ Pinterest ላይ እንዳይሄድ)
- የቅጥ መልሕቆች፡ “በመሃል ክፍለ ዘመን የምርት ካታሎግ ዘይቤ” ከአንድ የተወሰነ ሕያው አርቲስት የበለጠ ደህንነቱ የተጠበቀ ነው እና ብዙውን ጊዜ በተሻለ ሁኔታ ይሰራል።
- የቀለም ትምህርት፡ ከ3–5 የተሰየሙ ቀለሞች ጋር ቤተ-ስዕል ይግለጹ (“ኦክስፎርድ ሰማያዊ፣ የዝሆን ጥርስ፣ ዋልኑት፣ ናስ፣ ድምጸ-ከል የተደረገ ሻይል።”)
- የቅንብር ደንቦች፡ “የሶስተኛ ደንብ፣ ርዕሰ ጉዳዩ በግራ በኩል በሶስተኛው ላይ ያተኮረ፣ በቀኝ በኩል አሉታዊ ቦታ።” አዎ፣ እንደዚያ ሊነግሩት ይችላሉ፣ እና አዎ፣ ብዙ ጊዜ ይረዳል።
ፎቶግራፍ የሚመስሉ ፊቶች በሚፈልጉበት ጊዜ
ፊቶች ጽሑፍን ወደ ምስል ሞዴሎች የሚያመጡበት ቦታ ናቸው። በተከታታይ ፎቶዎች ላይ ወጥነት ከፈለጉ
- አቀማመጥ እና መብራትን ይቆልፉ፡፡ “የሶስት አራተኛ መገለጫ፣ የቀኝ-ጎን የቁልፍ ብርሃን፣ የብርሃን ነጸብራቆች በ10 ሰዓት።”
- የእድሜ ምልክቶችን በተጨባጭ ይግለጹ፡፡ “ቀስ በቀስ የቁራ እግሮች፣ ደካማ የአፍንጫ እጥፋት” ለመጻፍ እንግዳ ነገር ግን ፊቱን ያረጋጋል።
- ባህሪያትን ይለያዩ፡፡ የፀጉር አሠራርን፣ የቆዳ ቀለምን እና የዓይንን ቀለም በአረፍተ ነገር መካከል አይቀብሩ; ይዘርዝሯቸው፡፡
የምጥጥን ጥምርታ እና ጥራት
የሚፈልጉትን አስቀድመው ይጠይቁ፡፡ መሣሪያው ግልጽ የሆኑ ልኬቶችን የሚደግፍ ከሆነ (ብዙ “Grok Imagine 0.9” UIs እንደሚያደርጉት)፣ ይጠቀሙባቸው፡፡ ካልሆነ፣ የምጥጥን ጥምርታዎችን ይጠቀሙ፡ “16፡9 እጅግ በጣም ሰፊ መሠረታዊ ፎቶ፣ 4096×2304 ተመራጭ” ሞተሩ ቪዲዮን ወይም ምስልን ወደ ቪዲዮ የሚደግፍ ከሆነ፣ በመላው ክሊፖች ላይ መንቀጥቀጥን ወይም ለስላሳ ክፈፎችን ለማስወገድ በመሠረታዊ ጥራት ላይ ደረጃውን የጠበቀ ማድረግ ይፈልጋሉ።
ሊጠቀሙባቸው የሚችሉ የጥያቄ አብነቶች
- የምርት ጀግና ፎቶ
ርዕሰ ጉዳይ፡ “ገመድ አልባ ከጆሮ በላይ የሆኑ የጆሮ ማዳመጫዎች፣ ማት ጥቁር፣ የተወለወለ የአልሙኒየም የጭንቅላት ማሰሪያ።”
ማዋቀር፡ “እብነበረድ ላይ፣ የጠዋት የመስኮት ብርሃን፣ ለስላሳ ነጸብራቆች።”
ሌንስ፡ “85ሚሜ፣ f/2.8፣ ስውር የኋላ ብርሃን ጠርዝ።”
ቅጥ፡ “Apple-esque የምርት ፎቶግራፍ፣ አነስተኛ፣ በቀኝ በኩል አሉታዊ ቦታ።”
ውጤት፡ “3፡2, 3000×2000”
- የቁምፊ ምስል (በከፊል-ተጨባጭ)
ርዕሰ ጉዳይ፡ “መካከለኛ እድሜ ያላት ሴት፣ የተጠማዘዘ የጨው እና በርበሬ ፀጉር፣ የወይራ ቆዳ፣ አረንጓዴ አይኖች።”
አቀማመጥ፡ “የሶስት አራተኛ መገለጫ፣ ቀጥተኛ እይታ።”
መብራት፡ “Rembrandt መብራት፣ ሞቅ ያለ ቁልፍ ከግራ፣ ቀዝቃዛ መሙላት ከቀኝ።”
ቅጥ፡ “ሲኒማዊ የራስ ፎቶ፣ Portra 400 ቀለም።”
ውጤት፡ “4፡5, 2048×2560”
- የአካባቢ ጽንሰ-ሐሳብ
ርዕሰ ጉዳይ፡ “በኪዮቶ የምሽት የዝናብ-የረጠበ የጎዳና ገበያ።”
አባሎች፡ “የኒዮን ምልክት፣ የሚያዳልጥ የጠጠር ድንጋይ፣ ከጎዳና ምግብ የሚወጣ እንፋሎት።”
ሌንስ፡ “24ሚሜ ስፋት፣ f/4፣ ነጸብራቆች ጎልተው የሚታዩ።”
ቅጥ፡ “የሳይበርፐንክ ቤተ-ስዕል፣ ሻይ/ብርቱካን የተገደበ፣ የፊልም ጥራጥሬ።”
ውጤት፡ “21፡9, 4096×1760”
አጉል እምነት ሳይኖር አሉታዊ ጥያቄዎችን መጠቀም
አሉታዊ ጥያቄዎች አስማታዊ ድግምት አይደሉም፡፡ ሞዴሉ የማይፈልጉትን ነገር ላይ አጥብቆ ሲጠይቅ የመጨረሻ ማበረታቻ ናቸው፡፡
- “ምንም ጽሑፍ፣ የውሃ ምልክት የለም፣ ድንበር የለም።”
- “ተጨማሪ ጣቶች የሉም፣ በእጆች ላይ ምንም መዛባት የለም።”
- “ምንም የሌንስ ነጸብራቅ የለም፣ ምንም የቀለም ልዩነት የለም።”
በጥቂቱ ተጠቀም፡፡ ሃያ ነገሮችን የምታስተባብል ከሆነ፣ የመሠረት ጥያቄህ ችግሩ ነው፡፡
በስብስብ ላይ ወጥነትን መቆጣጠር
የGrok Image 0.9 የስራ ፍሰትዎ ወይም የፊት ገጽታዎ ዘሮችን ወይም የማጣቀሻ መቆጣጠሪያን እንደሚደግፉ በመገመት፣ ዘመቻን ማረጋጋት ይችላሉ።
- ለአንድ ስብስብ ዘር ያስተካክሉ፡፡ UI ከገለጸው በጣም ጥሩ ነው፡፡ ካልሆነ፣ ጥያቄውን ያባዙ እና በአንድ ሩጫ ውስጥ በቡድን ይፍጠሩ፡፡
- ቤተ-ስዕልን እና የመብራት ቋንቋን ይቆልፉ፡፡ ተመሳሳይ ሶስት ቅጽሎች፣ ተመሳሳይ ቤተ-ስዕል፣ ተመሳሳይ ሌንስ፡፡
- ለተከታታይ (የትዕይንት ንድፎች)፣ እያንዳንዱን ጥያቄ በተረጋጋ ብሎክ ይጀምሩ፡ “ተከታታይ፡ noir የፈትሻ አጭር፣ 50ሚሜ በእጅ የሚያዝ፣ የተንግስተን ልምምዶች፣ የጭስ ጭጋግ፣ 1/50 መዝጊያ መፋቂያ” ከዚያ የትዕይንት-ተኮር መስመሮችን ያክሉ።
ቪዲዮውስ? የእውነታ ፍተሻ
በ Grok Imagine 0.9 ዙሪያ ያሉ የይገባኛል ጥያቄዎች ጽሑፍን ወደ ቪዲዮ፣ ምስልን ወደ ቪዲዮ እና ቪዲዮን ወደ ቪዲዮ ማሻሻያዎችን ያካትታሉ። በመላው ኢንዱስትሪ ውስጥ ያለው እውነታ እነዚህ ባህሪያት መኖራቸው ነው፣ ነገር ግን ጥራቱ በእንቅስቃሴ ወጥነት፣ በእጆች እና በጊዜያዊ ትስስር በጣም ይለያያል። የኅብረተሰብ ውይይት አንዳንድ “የቪዲዮ ሁነታዎች” ሙሉ በሙሉ የታነመ ትዕይንት መረዳት ሳይሆን ከተዘጋጀ እንቅስቃሴ ጋር እንደ ምስል-ወደ-ቪዲዮ ሊሆኑ እንደሚችሉ ይጠቁማል፡፡ ትርጉም፡- የስሜት ክፍሎች እና ቢ-ሮል (b-roll) በጣም ጥሩ; ለሲኒማቶግራፈር ምትክ አይደለም፡፡
መሣሪያዎ የቪዲዮ መለኪያዎችን የሚያሳይ ከሆነ፣ እዚህ ይጀምሩ፦
- ቆይታ፡ 3–5 ሰከንድ፡፡ አጭር ያድርጉት; ጊዜያዊ ቅርሶችን ይቀንሱ፡፡
- የእንቅስቃሴ ዓላማ፡ “ቀርፋፋ ግፊት-ውስጥ”፣ “የፓራላክስ ፓን ግራ”፣ “ስውር በእጅ የሚንቀጠቀጥ” ካልገለጹት፣ አጠቃላይ መንሸራተትን ይጠብቁ፡፡
- ጊዜያዊ መልሕቆች፡ “መብራቶች በ2ሰ አንድ ጊዜ ይርገበገባሉ።” ለምስል-ወደ-ቪዲዮ፣ የአንድን ነገር እንቅስቃሴ ይግለጹ; የአለም-መጠን ለውጦችን ያስወግዱ፡፡
በመልቲሞዳሊቲ እና በ Grok ላይ ፈጣን ማስታወሻ
የxAI ይፋዊ ቁሳቁሶች የመልቲሞዳል ግንዛቤን ያሳያሉ–ለምሳሌ፣ የነገር መለየት እና በቋንቋ የሚመራ የእይታ ትንተና–እንደ ግሮክ ቁልል አካል። ያ በራስ-ሰር ምርጥ-በክፍል ጽሑፍ-ወደ-ምስል ዋስትና አይሰጥም፣ ነገር ግን የሞዴል ቤተሰብ እይታን እያጭበረበረ እንዳልሆነ ይጠቁማል። በድር ዙሪያ የሚንሳፈፈው “Grok Imagine” የምርት ስም በላዩ ላይ የተለያዩ የባህሪ የይገባኛል ጥያቄዎችን ይሰቅላል–አንዳንድ አስተናጋጅ የፊት ገጽታዎች “Aurora engine” እና ተጨባጭ ውጤቶችን ያስተዋውቃሉ። እነዚህን እንደ ትግበራ ዝርዝሮች አድርገው ይያዟቸው ይህም በመድረክ ሊለያይ ይችላል። አንድ የተወሰነ ማሰማሪያ ዘሮችን፣ የመቆጣጠሪያ ኔትወርኮችን ወይም ብጁ አሻሽሎችን እንደሚደግፍ ከተናገረ ይጠቀሙባቸው፡፡ ካልሆነ፣ በአስማት መቀየሪያ ጀርባ ተደብቀዋል ብለው አያስቡ።
ባለብዙ-ወኪል ጥያቄ እርዳታ መቼ እንደሚጨምሩ
ረጅም ጥያቄዎች ይበሰብሳሉ። የአንቀጽ ርዝመት መመሪያዎችን እየጻፉ እና አሁንም ጭቃ እያገኙ ከሆነ፣ መዋቅር እንደሚያስፈልግ ፍንጭ ነው። ባለብዙ-ወኪል ጥያቄ የስራ ፍሰቶች–ጥያቄዎን ወደ ገደቦች የሚከፋፍሉ ስርዓቶች፣ ከዚያም እነዚያን የሚያስፈጽሙ–የምስል ሞዴል የመዋጋት እድል እንዲያገኝ ግብዓቱን ለማጽዳት ሊረዱ ይችላሉ። የ Sider የራሱ የጥያቄ-ቅርጽ ሽፋን በዚህ ሐሳብ ላይ ያተኩራል፡ የተሻሉ ገደቦች፣ አነስተኛ ጣልቃገብነቶች፣ ይበልጥ ወጥ የሆኑ ውጤቶች። ነጥቡ ቢሮክራሲን መጨመር አይደለም–ጥያቄዎን ለማንበብ የሚቻል ማድረግ ነው፡፡
ከተዘበራረቀ ሀሳብ እስከሚጠቅም ምስል ድረስ ተግባራዊ የምግብ አዘገጃጀት
- ርዕሰ ጉዳይ፣ ዐውደ-ጽሑፍ፣ ሌንስ፣ መብራት፣ ቤተ-ስዕል፣ የውጤት መጠን፡፡
- በጣም ጥሩውን አይምረጡ; ሞዴሉ ምን እንደተረዳ ይገምግሙ, የትኛው ምስል ኢጎዎን እንደሚያሞግስ አይደለም.
- ፊቶች ትክክል ካልሆኑ፣ ባህሪያትን ይከፋፍሉ፡፡ መብራቱ ጭቃማ ከሆነ፣ ወደ አንድ ምንጭ ያቅልሉት፡፡ ቅንብሩ ከተንሸራተተ፣ የሶስተኛውን ደንብ ወይም የመሃል ክፈፍን በግልጽ ይደውሉ፡፡
- ስሞችን አጥብቁ፣ አላስፈላጊ ነገሮችን ያስወግዱ
- “ቆንጆ”ን “contrasty, ከፍተኛ-DR, ጠንካራ-ጠርዝ ጥላዎች” ይተኩ፡፡ “አሪፍ ስልት”ን በተመሳሳዩ ዘመን ወይም መካከለኛ ይተኩ፡፡
- አስፈላጊ ከሆነ አንድ አሉታዊ ጥያቄ ያክሉ
- ድምጹን እና ድምጽን ወጥነት ለመጠበቅ በአንድ ክፍለ ጊዜ በቡድን ይፍጠሩ።
- በስውር አጥራ፡፡ እጆችን አስተካክሉ፡፡ የተጋላጭነትን መጠን ያስተካክሉ፡፡ 30 ንብርብሮችን በ Photoshop እያደረጉ ከሆነ, ጥያቄው ስህተት ነበር.
ከሚያስቡት በላይ በቶሎ የሚያገኟቸው የጠርዝ ጉዳዮች
- በምስሎች ውስጥ ጽሑፍ፡ አሁንም አደገኛ ነው፡፡ መሣሪያው ከትውልድ በኋላ “ጽሑፍ አክል” አቀናባሪ የሚያቀርብ ከሆነ፣ ሞዴሉ ለተጣራ የፊደል አጻጻፍ ከመለመን ይልቅ ያንን ይጠቀሙበት፡፡
- አርማዎች እና የንግድ ምልክቶች፡ አብዛኛዎቹ ስርዓቶች ያስወግዳሉ፣ ያዛባሉ ወይም ይፈጥራሉ። ያ ባህሪ ነው፣ ስህተት አይደለም።
- እጆች እና ጥሩ ቅጦች፡ እያደገ ነው፣ ነገር ግን እንግዳው ሸለቆ እውን ነው። ክፈፉን ሰፊ ያድርጉት ወይም እጆቹን ስራ ይፍቱ፡፡
የሥነ ምግባር ቢት (አጭር፣ ምክንያቱም እዚህ ሥዕሎችን ለመሥራት ነው)
ህያው-አርቲስት መምሰልን ያስወግዱ፡፡ በተጨማሪም የከፋ ጥያቄ ብቻ ነው፡፡ አንድን የተወሰነ ሰው ጥገኛ በሆነ መልኩ ከማመልከት ይልቅ የሚፈልጓቸውን ባሕርያት–መካከለኛ፣ ዘመን፣ ቤተ-ስዕል፣ ቅንብር ይሰይሙ። የተሻለ ውጤት እና ንጹህ ህሊና ያገኛሉ።
Sider.AI “Generate” ከመምታትዎ በፊት ጥያቄዎችን በመጻፍ፣ በማጣራት እና በመመርመር ረገድ ጠቃሚ ነው። የዘመቻ አጭር መግለጫ፣ የአጻጻፍ ስልት መመሪያ እና ተለዋዋጭ የስነ ጥበብ ዳይሬክተር (የተዛባ) እየተጠቀሙ ከሆነ፣ Sider በሚደግሙበት ጊዜ ገደቦችን ሊይዝ ይችላል። ቅጽሎችን መደርደር ሲጀምሩ የመኪናዎን ቁልፎች የሚወስድ ጓደኛዎ ነው። በስብስብ ውስጥ ቋንቋን ለማረጋጋት፣ የቀለም ቃላትን ወጥነት ለመጠበቅ እና የትኛው ክለሳ የትኛውን ችግር እንደፈታ ለማብራራት ይጠቀሙበት፡፡ እሱ አስረካቢ አይደለም; እሱ የጥያቄ ታጋይ ነው፡፡ አጉል እምነት ሳይኖር Grok Image 0.9ን መላ መፈለግ
- ያልጠየቁትን ነገር መጨመር ይቀጥላል
በደንብ አልገለጹትም፡፡ ባዶ ቦታውን ይሰይሙ፡ “የጀርባ ቁሶች የሉም”፣ “ባዶ ግድግዳ የጀርባ ምስል”፣ “ገለልተኛ ርዕሰ ጉዳይ።”
- በጣም የሚያብረቀርቅ/የተሰራ ነው
“የተፈጥሮ ብርሃን” ያክሉ፣ ከመጠን በላይ ገላጭ የሆኑ የድህረ-ሂደት ክሊቼዎችን ያስወግዱ (“HDR ++”)፣ እና የፊልም ክምችት መልሕቅ ይምረጡ።
- የምጥጥን ጥምርታዎን ችላ ይላል
አንዳንድ ማስረከቦች የምጥጥን ጥምርታ እንደ ሐሳብ አድርገው ይመለከቱታል። ሁለት ጊዜ ይድገሙት፣ አንድ ጊዜ ከላይ፣ አንድ ጊዜ መጨረሻ ላይ። ወይም ከመጠን በላይ ይፍጠሩ እና ይከርክሙ።
- ፊቶች በመላው ስብስብ ይለወጣሉ
ዘር እና ጥብቅ አቀማመጥ ያስፈልግዎታል፡፡ ያ ካልተሳካ፣ ወደ መካከለኛ-ፎቶ ይቀይሩ እና አልባሳት ቀጣይነትን እንዲሸከሙ ያድርጉ።
- የቪዲዮ መንቀጥቀጥ
ቆይታውን ይቀንሱ፣ እንቅስቃሴን ያቃልሉ፣ ካሜራውን ይቆልፉ፡፡ መድረኩ “የእንቅስቃሴ ጥንካሬን” የሚያጋልጥ ከሆነ፣ ይቀንሱት።
ገደቦቹ–ዛሬ፣ ለማንኛውም
ከGrok 0.9 የምርት ስም እና በምስል-ወደ-ቪዲዮ ባህሪያት ዙሪያ ያለው ጫጫታ ቢኖርም, መሰረታዊ ነገሮች ይቀራሉ፡ እነዚህ ሞዴሎች አለምን እንደ እኛ አይረዱትም. እነሱ የአብነት-ማጠናቀቂያ ጭራቆች ናቸው። በባቡር ላይ ሲያስቀምጧቸው–ጥብቅ ስሞች፣ ግልጽ ብርሃን፣ የተወሰነ ሌንስ–ይዘምራሉ፡፡ “ስሜት” እንዲሰማዎት ሲጠይቋቸው ግድግዳው ላይ ብልጭ ድርግም ይላሉ እና እርስዎ እንደሚያጨበጭቡ ተስፋ ያደርጋሉ። አስደሳችው ክፍል ባቡሮቹ እንደ እውነተኛ ፈጠራ እንዲሰማዎት በቂ ስፋት ሊኖራቸው ይችላል፡፡
አጭር፣ ሹል ማረጋገጫ ዝርዝር
- አንድ መስመር፡ ርዕሰ ጉዳይ፣ ዐውደ-ጽሑፍ፣ ሌንስ፣ ብርሃን፣ ቤተ-ስዕል፣ ውጤት።
- የተሻሉ ስሞችን ይጠቀሙ–ካሜራ፣ ቁሳቁሶች፣ ዘመን።
- ቪዲዮ አጭር እና እንቅስቃሴው የተወሰነ ያድርጉት።
ጸጥ ያለ ሽክርክሪት
ሁሉም ሰው አስማታዊ ጥያቄ ይፈልጋል፡፡ አንድም የለም፡፡ የማሰብ መንገድ አለ፡ የመጨረሻውን ምስል እየገለጹ አይደለም; ሞዴሉ እንዲያሟላቸው መገደድ ያለባቸውን ገደቦች እየገለጹ ነው፡፡ ይህን በደንብ ያድርጉት፣ እና Grok Image 0.9 በአግባቡ ይሠራል። በደንብ ካልሰሩት, ሞዴሉ በክበብ ውስጥ እየተሽከረከረ, ማድረግ የሚችለውን እያደረገ ሳለ “ተጨማሪ” የሚለውን ምልክት ማዞርዎን ይቀጥላሉ፡ በራስ መተማመን የተሞላ ከንቱነት ቆንጆ እንዲመስል ማድረግ። የእርስዎ ስራ ከብልጭልጭ የበለጠ ግትር መሆን ነው።
ማጣቀሻዎች እና ማስታወሻዎች
- የxAI Grok እውነተኛ የመልቲሞዳል መሠረቶች አሉት–የነገር መለየት እና በቋንቋ የሚመራ እይታ በሰነድ ተመዝግበው እና የግለሰብ “Grok Imagine” ማሰማራቶች በጥራት ቢለያዩም እንኳ ሊታመን የሚችል መሠረት ይጠቁማሉ።
- ይፋዊ የሆኑ “Grok Imagine” ጣቢያዎች በስሪት 0.9 እና “Aurora engine” ስር ጽሑፍን ወደ ምስል እና ጽሑፍን ወደ ቪዲዮ ባህሪያት ያስተዋውቃሉ፣ በተጨባጭነት እና በሲኒማ ክሊፖች ቃል ኪዳን፡፡ እንደ ችሎታ አድርገዋቸው ይያዟቸው, እንደ ወንጌል አይደለም.
- የማህበረሰብ ሪፖርቶች አንዳንድ “የቪዲዮ ሁነታዎች” ከተሟላ የሲኒማቶግራፊ ምትክ ይልቅ ለአንዳንድ ውበቶች ጠቃሚ የሆኑ ቋሚ ምስሎችን በተቀናጀ እንቅስቃሴ እንደሚሰሩ ይገልጻሉ።
በተደጋጋሚ የሚጠየቁ ጥያቄዎች
Q1: በGrok Image 0.9 ጥሩ ውጤቶችን ለማግኘት ፈጣኑ መንገድ ምንድን ነው?
በአምስት መስመር ጥያቄ ይጀምሩ፡ ርዕሰ ጉዳይ፣ አውድ፣ ሌንስ፣ መብራት እና የውጤት መጠን፡፡ ሞዴሉ መሠረታዊ ነገሮችን እስኪመታ ድረስ ቅጽሎችን ይዝለሉ; ከዚያ በትንሽ፣ ሊሞከሩ በሚችሉ ጭማሪዎች ውስጥ ዘይቤን ያክሉ።
Q2: በተለያዩ የ Grok ምስሎች ላይ ወጥ የሆነ ዘይቤን እንዴት መጠበቅ እችላለሁ?
መድረኩ ካሳየ ዘሩን ይቆልፉ እና ተመሳሳይ ሌንስ፣ መብራት እና የቀለም ቤተ-ስዕል ቋንቋን እንደገና ይጠቀሙ፡፡ እያንዳንዱን ጥያቄ በየጊዜው አዲስ ሀሳብ ሳይሆን በተመሳሳይ የፊልም ማዋቀር ውስጥ እንደ ትዕይንት አድርገው ይያዙ።
Q3: Grok Image 0.9 ከጽሑፍ ጥያቄዎች ተጨባጭ ቪዲዮ መፍጠር ይችላል?
አዎ፣ በአንዳንድ አሰማሮች–ነገር ግን አጫጭር ክሊፖችን እና የተገደበ የእንቅስቃሴ ትስስር ይጠብቁ፡፡ የሚቆይበትን ጊዜ ከ3–5 ሰከንድ ይጠብቁ፣ አንድ ካሜራ እንቅስቃሴን ይግለጹ እና DP ን እንደሚተካው አይጠብቁት።
Q4: Grok ለምን ያልተፈለጉ ነገሮችን ወይም ጽሑፍን በምስሎቼ ላይ መጨመር ይቀጥላል?
ቫክዩም ትተሃል፡፡ ባዶ የጀርባ ምስሎችን፣ ተጨማሪ ነገሮች የሉም፣ ጽሑፍ የለም፣ ድንበሮች የሉም በማለት ባዶነትን አውጁ፡፡ ሞዴሎች ክፍተቶችን በመሙላት ረገድ በጣም ጥሩ ናቸው–ስለዚህ ማንኛውንም አይተዉ።
Q5: ምስሎችን ከማመንጨት በፊት ጥያቄዎችን ለመዋቀር የሚረዳ መሳሪያ አለ?
ጥያቄዎችን ለማጣራት እና ደረጃውን የጠበቀ ለማድረግ Sider.AI ይጠቀሙ–ገደቦችን በማሰባሰብ እና የቅጥ ቋንቋን በተለያዩ ስብስቦች ውስጥ ወጥነት ባለው መልኩ በማቆየት ረገድ ጥሩ ነው፡፡ የጸዱ ጥያቄዎች ጥቂት ድጋሚዎችን እና የተሻሉ የ Grok ውጤቶችን ማለት ነው።