مشکل «مهندسی Prompt» در Promptها نیست
نکته در مورد مهندسی Prompt برای <b translate="no">Sora 2</b> این است که همه وانمود میکنند آن را میفهمند—تا زمانی که ویدیوی آنها شبیه یک تبلرزه فیلمبرداریشده با سیبزمینی به نظر برسد. واکنش این است که کلمات بیشتری اضافه کنید، کمی اصطلاحات تخصصی بپاشید و امیدوار باشید که مدل ذهنها را بخواند. این اتفاق نخواهد افتاد. <b translate="no">Sora 2</b> هوشمند است، همانطور که یک تکمیل خودکار عالی هوشمند است: شگفتانگیز، اما بسیار تحتاللفظی. منظور خود را بیان کنید. اصل مطلب را در یک فرهنگ لغت دفن نکنید.
دستگاه تبلیغاتی صنعت میخواهد مهندسی <b translate="no">Prompt</b> به کیمیاگری تبدیل شود. اینطور نیست. این ویرایش است. این کارگردانی است. این شما هستید که مسئولیت گفتن آنچه را که میخواهید به یک ماشین، به زبانی که به هیچ وجه نمیتواند اشتباه متوجه شود، بر عهده میگیرید. بقیه—«وردهای مخفی»، جادوی کپی-پیست—تا زمانی که کار نکند، کار میکند. <b translate="no">Sora 2</b> بهتر از این است. با آن مانند یک همکار رفتار کنید که هر آنچه را که میگویید به معنای ظاهری میپذیرد و هرگز فیلمهای روزانه را تماشا نمیکند.
درباره چه چیزی واقعاً صحبت میکنیم
بیایید مشخص باشیم: مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> هنر نوشتن متن <b translate="no">Prompt</b> (و در صورت وجود، ورودیها و کنترلهای مرجع) است که ویدیوی منسجم و قابل کنترلی را به دست میدهد. نه «الهام». نه «حس و حال». شما در حال نوشتن محدودیتها هستید—موضوع، عمل، دوربین، نورپردازی، سبک، مدت، سرعت و تداوم—بنابراین مدل یک اسب بنفش را در نیمه راه منظره شهری شما اختراع نمیکند.
بهترین راه برای فکر کردن به آن: شما در حال استوریبورد کردن با کلمات هستید. هرچه <b translate="no">Prompt</b> شما شبیه یک لیست شات محکم با یک نقطه نظر باشد، <b translate="no">Sora 2</b> بیشتر رفتار میکند. هرچه شلتر باشد—صفتهای دستوپاگیر، پنج سبک هنری رقیب، اسکیزوفرنی زمان روز—بیشتر خروجی شبیه یک کلاژ از چیزهایی است که مدل نیمهبهیاد میآورد.
چارچوب ساده برای <b translate="no">Prompt</b>های <b translate="no">Sora 2</b>
من هم چارچوبها را دوست ندارم، اما این یکی ارزش خود را دارد. <b translate="no">Prompt</b>های <b translate="no">Sora 2</b> را به عنوان پنج لایه روی هم در نظر بگیرید. میتوانید هر لایهای را که نیاز ندارید نادیده بگیرید، اما اگر لایهای از دست رفته باشد، مدل آن را با کلیشهها پر میکند.
- موضوع و هدف («چه» و «چرا»)
- یک موضوع اصلی. شاید یک موضوع پشتیبان. همین.
- هدف: بیننده چه احساسی باید داشته باشد یا چه چیزی را درک کند.
- مثال: «یک دوچرخهسوار تنها در سپیدهدم از روی یک پل مهآلود عبور میکند تا عزم و اراده و شجاعت خاموش را نشان دهد.»
- حقایق صحنه («کجا» و «چه زمانی»)
- زمان روز، آب و هوا، مشخصات مکان. اسمهای عینی صفتهای شاعرانه را شکست میدهند.
- «ساعت طلایی» «نورپردازی زیبا» را شکست میدهد. «آسفالت خیس که نور نئون را منعکس میکند» «سایبرپانکی» را شکست میدهد.
- نوع شات، حس لنز، حرکت دوربین، سرعت.
- «دالی-این آهسته روی یک معادل ۵۰ میلیمتری؛ ریزلرزش دستی به حداقل رسیده است» بهتر از «سینمایی» است.
- سبک بصری و محدودیتها («ظاهر»)
- یک مسیر زیباییشناختی را انتخاب کنید: فوتورئال، فیلم ۱۶ میلیمتری، انیمیشن سل، آبرنگ. ترکیب سه ظاهر درخواست آشفتگی زمانی است.
- پالت، بافت و مراجع دوران را محدود کنید.
- تداوم و موارد ممنوعه («آن را ثابت نگه دارید»)
- ویژگیهای شخصیت، وسایل و جزئیات متعارف را قفل کنید.
- منفیهای صریح: «بدون تغییر لباس؛ بدون پوشش متن؛ بدون تغییر شکل اشیاء.»
مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> در مورد پر کردن کلمات بیشتر نیست؛ بلکه در مورد حذف روزنهها است. شما در حال نوشتن قراردادی با یک همکار سرسخت و تحتاللفظی هستید. روزنهها را ببندید.
لیست کوتاه کلماتی که شما را به دردسر میاندازند
- «سینمایی». به معنای همه چیز و هیچ چیز است. آن را با دوربین، لنز و حرکتی که واقعاً میخواهید جایگزین کنید.
- «حماسی». مترادف «تصمیم نگرفتم» است.
- «فوقواقعگرایانه». بیش از حد روی منافذ تمرکز میکند، ترکیب را فراموش میکند.
- «حس و حال». اگر نمیتوانید حس و حال را با اسم نام ببرید، حس و حالی ندارید.
- «سبک <b translate="no">AI</b> [نام هنرمند]». علاوه بر مسائل آشکار، مدل را با سبک سطحی بر روی ساختار اشتباه میگیرد. مواد مرجع، نه اعمال ادای احترام.
<b translate="no">Sora 2</b> به قصد احترام نمیگذارد؛ به دستورالعمل احترام میگذارد. اگر <b translate="no">Prompt</b> شما شبیه صدای تریلر است، انتظار برشهای تریلر را داشته باشید: سریع، نامنسجم، همه لعاب.
یک دیالکتیک: اختصار در مقابل ویژگی
- اردوگاه «<b translate="no">Prompt</b> کوتاه» استدلال میکند که <b translate="no">Sora 2</b> زمانی بهترین است که تنها گذاشته شود—فقط به مدل اعتماد کنید. گاهی اوقات درست است. کوتاه زمانی خوب است که مفهوم شما نمادین و از نظر بصری بیش از حد تعیین شده باشد: «یک طوفان رعد و برق که در هنگام غروب خورشید بر فراز <b translate="no">Monument Valley</b> در حال غلتیدن است، شات عریض.» <b translate="no">Sora 2</b> آن را هزاران بار دیده است؛ پیشینهها بقیه کار را انجام میدهند.
- اردوگاه «<b translate="no">Prompt</b> رمان» دستورالعملها را انباشته میکند. گاهی اوقات ضروری است. اگر به تداوم در طول ۸ ثانیه نیاز دارید—همان ژاکت، همان سگ، همان فنجان قهوه—اختصار شما را میکشد. مشخص کنید یا رنج ببرید.
ترکیب: در جایی که پیشینهها قوی هستند کوتاه باشید (صحنههای رایج، فیزیک آشنا)، در جایی که پیشینهها ضعیف هستند (وسایل جدید، رقصنگاری پیچیده، نورپردازی مختلط، جزئیات مارک تجاری) بهطور کامل مشخص باشید. اگر نمیدانید در کدام دسته قرار دارید، در دسته دوم هستید.
الگوهای عملی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> که واقعاً کار میکنند
از اینها مانند دستور العمل استفاده کنید، نه کتاب مقدس. براکتها را پر کنید؛ پرزها را از بین ببرید.
- عمل تک موضوعی، دوربین کنترل شده
<b translate="no">Prompt</b>: «ویدیوی فوتورئال، ۸ ثانیه. [موضوع] [یک عمل واحد را انجام میدهد] در [مکان] در [زمان روز]. سهپایه قفل شده، شات متوسط، سرعت طبیعی. نور ابری نرم؛ عمق میدان کم. کمد لباس ثابت: [توضیحات]. بدون برش، بدون متن، بدون گذر زمان.»
چرا کار میکند: حرکت را محدود میکند، تداوم را قفل میکند، از تمایل مدل به مونتاژ جلوگیری میکند.
- ایجاد به جزئیات بدون برش ناگهانی
<b translate="no">Prompt</b>: «۱۰ ثانیه. با شات ایجاد عریض از [مکان] شروع کنید؛ دالی-این آهسته ۵ ثانیهای. در ثانیه ۶، به شات متوسط از [موضوع] آسان کنید، در حالی که قاب سمت چپ صفحه را حفظ میکنید. نور پسزمینه ساعت طلایی؛ شعلههای لنز ظریف. پالت رنگ را نارنجیهای گرم و آبیهای خنثی نگه دارید. بدون تغییر فوکوس قفسهای؛ بدون تغییر زاویه ناگهانی.»
چرا کار میکند: توالی را به <b translate="no">Sora 2</b> آموزش میدهد بدون اینکه هرج و مرج را دعوت کند.
- انیمیشن سبکدار با عقل زمانی
<b translate="no">Prompt</b>: «انیمیشن دستی، به سبک سل، ۱۲ <b translate="no">fps</b>. رنگهای تخت، طرحهای ضخیم، پالت محدود [لیست ۴ رنگ]. [شخصیت] از چپ به راست از طریق [تنظیمات] راه میرود. دوربین پیمایشی جانبی؛ اختلاف منظر فقط روی پسزمینه. بدون چرخش دوربین، بدون تغییرات پرسپکتیو. پایان حلقهپذیر: شخصیت از قاب سمت راست خارج میشود.»
چرا کار میکند: سبکهای انیمیشن غنی از پیشینه هستند اما به تغییرات دوربین حساس هستند. صفحه را قفل کنید.
- آب و هوا و بافت به عنوان سرنخ
<b translate="no">Prompt</b>: «نمای نزدیک ماکرو از [سطح]، ۶ ثانیه، سهپایه. قطرات باران در حال تشکیل و ادغام شدن، در زمان واقعی. نور بالایی نرم، پسزمینه تاریک. صدا ضمنی است اما هیچکدام قابل مشاهده نیست. بدون برش، بدون افراد انسانی، بدون بازتاب دوربین.»
چرا کار میکند: پیشینههای بافت قوی هستند؛ محدودیتها از نفوذهای وهمآور جلوگیری میکنند.
- میکرو-درام بدون گفتگو
<b translate="no">Prompt</b>: «فوتورئال، ۹ ثانیه. [شخصیت الف]، [سن/جنسیت]، در [کمد لباس خاص]، در [مکان] منتظر است. او یک پیامک را بررسی میکند، به آرامی لبخند میزند، گوشی را در جیبش میگذارد. نمای متوسط بالای شانه؛ <b translate="no">DOF</b> کم؛ <b translate="no">bokeh</b> شهری. حرکت طبیعی دست، بدون حرکت لب. طول مو را [دقیق] نگه دارید، انگشتر در طول فیلم روی انگشت اشاره دست چپ قرار دارد. بدون تغییر مدل شخصیت پسزمینه.»
چرا کار میکند: ضربهای کوچک در مقیاس انسانی؛ لنگرهای تداوم <b translate="no">Sora 2</b> را از تعویض وسایل یا چهرهها در اواسط کلیپ باز میدارند.
مشکل تداوم (و نحوه متوقف کردن باختن به آن)
بزرگترین ترفند مهمانی <b translate="no">Sora 2</b> همچنین پاشنه آشیل آن است: آن اختراع میکند. این عالی است تا زمانی که فنجان قهوه بین فریمها در سراسر میز مهاجرت کند. شکستگیهای تداوم در مدلهای مولد پخته میشوند؛ آنها هر لحظه را با تعصب برای مطابقت با آخرین حدس میزنند. وقتی <b translate="no">Prompt</b> شما مبهم است، حدسها منحرف میشوند.
رفعهایی که جادویی نیستند:
- اسمهای مفرد را قفل کنید. «یک فنجان سرامیکی قرمز با لبه شکسته در سمت شرق میز.» نه «یک فنجان».
- کمد لباس را فریز کنید. «ژاکت جین آبی با دو جیب سینه، دکمههای مسی، بدون وصله. تغییر نکند.»
- فضای منفی را فرماندهی کنید. «میز خالی؛ هیچ چیز جز فنجان.» اگر آن را ممنوع نکنید، مدل آن را پر میکند.
- حرکات دوربین را محدود کنید. هر محور حرکتی اضافی فرصتی برای شکستن تداوم است.
- از ضربهای لنگر استفاده کنید. «در ثانیه ۳، سوژه به پایین نگاه میکند؛ در ثانیه ۶، سوژه به طور قابل مشاهده بازدم میکند.» وقتی زمان صریح است، انحراف فضای کمتری برای خزیدن دارد.
مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> تا حد زیادی مهندسی تداوم است. این را بپذیرید و خروجیهای شما یک درجه جهش میکنند.
سبک یک لباس نیست، بلکه یک محدودیت است
مردم «وس اندرسون» را همانطور میخواهند که «اسپرسو» را میخواهند—که معمولاً به این معنی است که شکر میخواهند. سبک یک لباس نیست که بتوانید روی هر موضوعی بپوشانید. در <b translate="no">Sora 2</b>، سبک قوانینی را انتخاب میکند که مدل از آنها استفاده میکند: رنگ، ترکیب، حرکت، حتی رفتار لنز.
یکی را انتخاب کنید:
- فوتورئال: منافذ پوست، انحرافات لنز، فیزیک واقعگرایانه. برای محصولات و احساسات انسانی عالی است. برای <b translate="no">Prompt</b>های بیدقت بیرحم است.
- شبیهسازی فیلم (<b translate="no">16mm</b>، <b translate="no">35mm</b>): دانه درشت، هالاسیون، <b translate="no">rolloff</b> نرمتر، اشباع کمتر. در صورت لزوم استفاده کنید، دوره سهام را مشخص کنید و نورپردازی را ساده نگه دارید.
- انیمیشن (سل، استاپ موشن، آبرنگ): به شبحهای واضح، طرحهای ثابت و صفحات دوربین قفل شده علاقه دارد. جزئیات بیش از حد تداوم زمانی را خراب میکند.
- گرافیکی/تصویری: تنهای تخت، کنتراست بالا، هندسه جسورانه. زمانی کار میکند که حرکت حداقل و سنجیده باشد.
اشتباه این است که نورپردازی فوتورئال را با هنر خط تصویری درخواست کنید. این میتواند اتفاق بیفتد، اما انتظار سر و صدای زمانی را داشته باشید زیرا مدل با خودش بحث میکند.
افسانه «صفتهای بیشتر = ویدیوی بهتر»
اگر خروجیهای خاصی میخواهید، از اسمها و فعلهای خاص استفاده کنید. صفتها تزیین هستند:
- بد: «یک شات سینمایی، حماسی و فوقواقعگرایانه از یک ماشین زیبا که به سرعت در یک شهر سایبرپانک آیندهنگر مسابقه میدهد.»
- خوب: «شات فوتورئال، ۶ ثانیه. یک <b translate="no">Datsun 240Z</b> مدل ۱۹۷۱ به رنگ نارنجی از طریق <b translate="no">Shibuya</b> در شب در باران سبک خطکشی میکند. دوربین نصب شده روی کاپوت، معادل ۲۴ میلیمتری، تاری حرکت جزئی، آسفالت خیس که علائم نئون را منعکس میکند. تراکم ترافیک را متوسط نگه دارید؛ بدون ماشین پلیس؛ بدون نمای نزدیک آرم.»
<b translate="no">Prompt</b> خوب فریاد نمیزند. دقیقاً به شما میگوید چه اتفاقی میافتد، کجا، چگونه و چه کاری نباید انجام دهید.
چه زمانی واقعاً باید از <b translate="no">Prompt</b>های طولانی استفاده کنید
- اقدام چند ضربهای در یک برداشت. اگر دوربین یا سوژه باید در زمانهای دقیق رفتار خود را تغییر دهند، آن را مشخص کنید.
- محتوای مارک تجاری یا تنظیم شده. شما نمیتوانید آرمهای خیالی یا رفتارهای ناایمن را بپردازید. <b translate="no">Prompt</b>های منفی غیرقابل مذاکره میشوند.
- اشیاء یا جهانهای اختراع شده. اگر در حال ساختن «چتر شیشهای هستید که نور خیابان را منکسر میکند»، ساخت و رفتار را تعریف کنید.
- همکاری با پس از تولید. اگر میدانید که کامپوزیت خواهید کرد، نورپردازی، تاری حرکت و تمیزی صفحه را محدود کنید.
در غیر این صورت، با پرحرفی مانند نمک رفتار کنید. میتوانید آن را اضافه کنید؛ نمیتوانید آن را پس بگیرید.
تکرار: راز کسلکننده
افراد خلاق دوست دارند فکر کنند که اولین تلاش باید هیجانانگیز باشد. <b translate="no">Sora 2</b> به اندازه کافی سریع است که میتوانید کسلکننده و روشمند باشید:
- خنثی شروع کنید. یک موضوع، یک عمل، یک دوربین. تداوم ناخن.
- هر بار یک چیز را تغییر دهید. اگر نورپردازی و دوربین را در یک پاس تغییر دهید، نمیدانید چه چیزی خراب شده است.
- یک <b translate="no">changelog</b> از <b translate="no">Prompt</b>ها و خروجیها نگه دارید. حتی یک سند <b translate="no">Google</b>. شما از آینده از شما تشکر خواهید کرد.
- در صورت وجود، از استفاده مجدد از دانه حمایت کنید. کنترل باعث ایجاد قابلیت پیشبینی میشود.
هیجان در پیشنویس سوم است، زمانی که ویدیو در نهایت رفتار میکند و شما قسم میخورید که هیچ کاری نکردهاید. شما این کار را کردید: شما از دادن بهانهها به مدل دست برداشتید.
حفاظهایی که ساعتها را ذخیره میکنند
- زبان زمانی مهم است. «در ثانیه ۴» «بعداً» را شکست میدهد.
- لنگرهای فضایی مهم هستند. «سمت چپ صفحه» «به سمت چپ» را شکست میدهد.
- فیزیک مهم است. پنج چیزی را که فیزیک اساسی را نقض میکنند درخواست نکنید. مدل با تماشای جهان فیزیک را آموخته است؛ آن را <b translate="no">gaslight</b> نکنید.
- چهرهها سخت هستند. زاویه سر، نورپردازی و فاصله را قفل کنید اگر ثبات میخواهید. از فشار سریع روی صورتها خودداری کنید مگر اینکه ذوب شدن را دوست داشته باشید.
- جمعیتها هرج و مرج هستند. اگر مجبور هستید، آنها را با عمق میدان یا نور کم تار کنید. عوامل اضافی را ستاره نکنید.
یک الگوی کارآمد برای مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b>
کپی کنید، سپس سفارشی کنید. هر خطی را که نیاز ندارید از بین ببرید.
عنوان/برچسب: مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b> — [نام پروژه]
هدف: [آنچه میخواهید بیننده در یک جمله احساس کند یا فکر کند.]
مدت: [X] ثانیه، شات پیوسته تکی. بدون برش مگر اینکه ذکر شده باشد.
موضوع: یک [موضوع واضح]، [سن/توضیحات]، [مشخصات کمد لباس].
صحنه: [مکان]، [زمان روز]، [آب و هوا]. وسایل کلیدی: [اسمها]. فضای منفی: [آنچه باید خالی بماند].
دوربین: [نوع شات]، [حس لنز]، [حرکت]، [سرعت]. افق را [تراز/کج] نگه دارید. قاببندی: موضوع [موقعیت صفحه] باقی میماند.
نورپردازی: [منبع]، [کیفیت]، [جهت]. از [مصنوعات نورپردازی نامطلوب] خودداری کنید.
سبک: [فوتورئال / فیلم / انیمیشن سل / دیگر]، پالت [لیست چند رنگ]. بافت/دانه [در صورت وجود].
جدول زمانی عمل:
قفلهای تداوم: [جزئیات کمد لباس]، [حالت وسیله]، [رنگ مو/چشم]، [بدون پوشش متن]، [بدون تعویض آرم].
منفیها: بدون تغییر شکل، بدون برش پرشی، بدون گذر زمان، بدون علامتگذاری خیالی، بدون بازتاب دوربین.
بررسی واقعیت: ابزارها جایگزین سلیقه نمیشوند
میتوانید تمیزترین <b translate="no">Prompt</b> <b translate="no">Sora 2</b> را روی زمین بنویسید و اگر سلیقه شما خاموش باشد، همچنان یک کلیپ غیرقابل تماشا دریافت کنید. ترکیب، ریتم، نور. اینها مد نیستند؛ آنها قوانین هستند و <b translate="no">Sora 2</b> شما را از یادگیری آنها معاف نمیکند. بسیاری از «مهندسی <b translate="no">Prompt</b>» طراحی با حذف است: اجازه ندهید مدل کار مبتذلی را که میخواهد انجام دهد. اجازه ندهید وقتی احساس نیاز به سکون دارد، دوربین را بچرخاند.
اگر یک ابرقدرت پنهان برای مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b> وجود داشته باشد، آن خویشتنداری است. کمتر بخواهید، بیشتر بگیرید. همه چیز را بخواهید، سوپ بگیرید.
<b translate="no">Sider.AI</b> واقعاً کار میکند—حداقل زمانی که از آن برای چیزی استفاده میکنید که در آن خوب است، که به اندازه کافی عجیب، چیزی نیست که همه در مورد آن لاف میزنند. این دکمه «هنر بساز» نیست. این دستیار «محدودیتهای واضح را فراموش نکن» است. <b translate="no">Prompt</b> <b translate="no">Sora 2</b> خود را پیشنویس کنید، سپس اجازه دهید <b translate="no">Sider.AI</b> آن را مانند یک ویرایشگر کد برای معنا <b translate="no">lint</b> کند: صفتهای نامحدود، حرکات دوربین متناقض، قفلهای تداوم از دست رفته را علامتگذاری میکند. این یک تلنگر است که میگوید: «شما در همان زمان درخواست دستی و سهپایه کردید.» جایی که کمک نخواهد کرد: اختراع سلیقه، یا حل تردید. اگر نمیدانید که کلیپ شما دالی میخواهد یا قفل، هیچ ابزاری نمیتواند به این سوال پاسخ دهد. اما هنگامی که تصمیم گرفتید، <b translate="no">Sider.AI</b> در ایجاد <b translate="no">Prompt</b> واضح، قابل تکرار و مهربانانه کوتاه خوب است. مثالهای کار شده: قبل و بعد
مثال ۱: شات قهرمان محصول
- قبل: «شات سینمایی، حماسی از ساعت هوشمند جدید ما روی یک میز مرمر، نورپردازی چشمگیر، قطرات آب، فوقالعاده دقیق.»
- بعد: «ماکرو فوتورئال، ۶ ثانیه. ساعت هوشمند ما (۴۱ میلیمتری، آلومینیوم نقرهای، بند فلوروالاستومر سیاه) روی مرمر سفید مات. سهپایه ثابت؛ دالی-این آهسته ۲% شبیهسازی شده، نه دستی. یک <b translate="no">softbox</b> بالایی تکی؛ مه سبک روی کریستال قطرات کوچک تشکیل میدهد. صفحه خاموش، تاج در ساعت ۳. بدون آرم به جز مال ما؛ بدون پوشش متن.»
چه چیزی تغییر کرد: هر متغیری بسته شد؛ بدون «حماسی». نتیجه مانند یک لیست شات خوانده میشود، نه یک تابلوی <b translate="no">mood</b>.
مثال ۲: صحنه خیابان با یک ضربه انسانی
- قبل: «یک صحنه شهری سایبرپانک جالب که در آن یک نفر با حس و حال نئون راه میرود، سینمایی.»
- بعد: «۸ ثانیه، فوتورئال. خیابان فرعی <b translate="no">Shinjuku</b> در شب در باران سبک؛ آسفالت خیس که علائم نئون را منعکس میکند. یک نفر: زن، ۳۰ ساله، ترانچ آبی سرمهای، کفش ورزشی سفید، مدل موی <b translate="no">bob</b> مشکی کوتاه. متوسط-عریض، همسطح چشم، <b translate="no">steady-cam</b> با تثبیت ملایم؛ سوژه سمت راست صفحه باقی میماند و به سمت دوربین حرکت میکند. پالت آبیهای سرد با سرخابی گاهبهگاه. بدون علامتگذاری به زبان انگلیسی؛ بدون چتر؛ بدون تعویض لنز.»
چه چیزی تغییر کرد: یک موضوع، یک حرکت، زبانی که معنایی دارد. کلیپ منسجم میشود.
مثال ۳: حلقه سبکدار
- قبل: «یک حلقه متحرک عجیب و غریب از یک گربه در یک جنگل جادویی، حس و حال استودیو <b translate="no">Ghibli</b>.»
- بعد: «انیمیشن به سبک سل، ۱۲ <b translate="no">fps</b>. گربه <b translate="no">Calico</b> روی یک کنده خزهای در یک پاکسازی کوچک مینشیند؛ کرمهای شبتاب شناور هستند. دوربین قفل شده، از کنار. پالت محدود: سبز جنگلی، زرد کم رنگ، قهوهای گرم، کرم. نسیم ملایم برگها را به حرکت در میآورد. دم گربه هر ۲ ثانیه یکبار تکان میخورد. پایان حلقهپذیر: نسیم و کرمهای شبتاب به موقعیتهای اولیه باز میگردند؛ بدون لرزش دوربین.»
چه چیزی تغییر کرد: بدون نام بردن؛ سبک با قوانین تعریف میشود، نه مراجع.
مهندسی <b translate="no">Prompt</b> برای تیمهای <b translate="no">Sora 2</b>
اگر با سهامداران کار میکنید، بزرگترین دشمن شما اجماع با صفت است. همه «انرژی بیشتر» و «سینماییتر» میخواهند انگار یک دکمه است. صفتها را با انتخابها جایگزین کنید.
- یک مشخصات <b translate="no">Prompt</b> ایجاد کنید که حداکثر یک صفحه باشد. این یک لیست شات در جملات است.
- یک چک لیست تأیید اضافه کنید: مدت، تعداد موضوع، دوربین، نورپردازی، سبک، قفلهای تداوم، منفیها. اگر یک جعبه علامت نخورده باشد، کارتان تمام نشده است.
- <b translate="no">Prompt</b>ها را در کنار خروجیها و یادداشتها ذخیره کنید. آنها را نسخه کنید. «<b translate="no">Prompt</b>های طلایی» شما به دارایی تبدیل میشوند.
تیمهایی که با <b translate="no">Prompt</b>های <b translate="no">Sora 2</b> مانند اسناد تولید رفتار میکنند، نتایجی میگیرند که به نظر میرسد تولید شدهاند، نه کشف شدهاند.
عیبیابی بدون کارتهای تاروت
- به طور غیرمنتظره قطع میشود. احتمالاً یک برش را القا کردهاید («در همین حال»، «ناگهان»، کنشهای متعدد) یا از زبان مونتاژ استفاده کردهاید. «تکشات پیوسته» را اجباری کنید و ضرباهنگهای رقیب را حذف کنید.
- چهرهها مدام تغییر شکل میدهند. جهتگیری سر، فاصله و نورپردازی را قفل کنید. حرکت را کاهش دهید و از زومهای سریع خودداری کنید. صفتهای کمتری در مورد احساسات، و صفتهای بیشتری در مورد کنش فیزیکی استفاده کنید.
- وسایل صحنه تلهپورت میشوند. نام وسیله را ببرید، موقعیت آن را نسبت به قاب یا صحنه تعیین کنید و از حرکت آن مگر در صورت مشخص شدن، خودداری کنید. از عبارت «در تمام مدت در [موقعیت] باقی میماند» استفاده کنید.
- نما شلوغ به نظر میرسد. شما اجازه دادهاید مدل فضا را پر کند. فضای منفی را تعریف کنید و حرکت پسزمینه را کاهش دهید.
- استایل سوسو میزند. شما دو ظاهر درخواست کردهاید. یکی را انتخاب کنید، یا انتقالها را در بازههای زمانی مشخص اجازه دهید.
سخنی در باب اخلاق و منشاء
مهندسی پرامپت شما را از فکر کردن در مورد منابع مبرا نمیکند. اگر هدف شما رسیدن به ظاهر یک هنرمند زنده است، از خود بپرسید چرا. اگر پاسخ این است «چون محبوب است»، شما از قبل داستان را باختهاید. بینشهای ساختاری - بلاکبندی رنگ، عدم تقارن، عمق میدان کم - را بگیرید و آنها را توصیف کنید. چیزی تمیزتر، سازگارتر و متعلق به خودتان به دست خواهید آورد.
نتیجهگیری آرام
مهندسی پرامپت Sora 2، در بهترین حالت خود، روی کاغذ کسلکننده و به طرز شگفتآوری روی صفحه نمایش تکاندهنده است. نه به این دلیل که کلمات جادویی را پیدا کردهاید، بلکه به این دلیل که به ماشین اجازه ندادهاید در بخشهای مهم، بداههپردازی کند. نکته خندهدار در مورد کارگردانی یک مدل این است که همان انضباطی را پاداش میدهد که مجموعههای واقعی انجام میدهند: موضوع خود را بشناسید، نمای خود را قفل کنید، با قصد نورپردازی کنید، از دزدیدن صحنه توسط پسزمینه جلوگیری کنید.
اگر یک مانترا میخواهید، این یکی را در نظر بگیرید: صفتهای کمتر، اسمهای بیشتر؛ حسهای کمتر، فعلهای بیشتر. منظور خود را بیان کنید. مدل دقیقاً همان کار را انجام خواهد داد - نه بیشتر، نه کمتر. که نکته اصلی است.
یادداشتهای کلیدواژه (برای کسانی که اهمیت میدهند)
این قطعه به مهندسی پرامپت Sora 2 میپردازد، از جمله نحوه نوشتن پرامپتهای واضح برای Sora 2، مثالهایی از پرامپتهای ویدیویی Sora 2، قفلهای تداوم، دستورالعملهای دوربین و محدودیتهای سبک. اگر تا اینجا خواندهاید، تبریک میگویم: اکنون میدانید چرا «سینمایی» کمترین کلمه سینمایی در این تجارت است.
سوالات متداول
سوال 1: مهندسی پرامپت Sora 2 واقعاً چیست؟
این نوشتن دستورالعملهای دقیق برای نما (shot-accurate) برای Sora 2 است - موضوع، دوربین، نورپردازی، سبک و تداوم - به طوری که مدل نتواند شما را اشتباه بخواند. هرچه روزنههای کمتری در پرامپت Sora 2 شما وجود داشته باشد، ویدیو بهتر خواهد بود.
سوال 2: چگونه پرامپتهای بهتری برای Sora 2 بنویسم بدون اینکه شبیه یک شاعر به نظر برسم؟
از اسمها و فعلها استفاده کنید: چه کسی چه کاری را کجا و چگونه انجام میدهد. برای مهندسی پرامپت Sora 2، «سینمایی» را با لنز، حرکت و زمانبندی جایگزین کنید؛ «حس (vibe)» را با حقایق صحنه و فضای منفی جایگزین کنید.
سوال 3: چرا ویدیوی Sora 2 من مدام در وسط نما لباسها و وسایل صحنه را تغییر میدهد؟
رانش تداوم. کمد لباس، موقعیت وسایل صحنه و ویژگیهای شخصیت را به طور صریح در پرامپت Sora 2 قفل کنید و از تعویض خودداری کنید. اگر از آن جلوگیری نکنید، مدل آن را بازی جوانمردانه تلقی میکند.
سوال 4: آیا پرامپتهای Sora 2 باید کوتاه باشند یا طولانی؟
زمانی که به پیشفرضهای قوی تکیه میکنید (صحنههای ساده و نمادین) کوتاه، و زمانی که به جزئیات جدید یا ضرباهنگهای زمانبندی شده نیاز دارید، طولانی. در مهندسی پرامپت Sora 2، اطناب یک ابزار است، نه یک فضیلت.
سوال 5: سریعترین راه برای بهبود نتایج Sora 2 امروز چیست؟
صفتها را حذف کنید، دوربین را قفل کنید و یک موضوع و عمل واحد را مشخص کنید. قفلهای تداوم و منفیها را اضافه کنید - مهندسی پرامپت Sora 2 بیشتر در مورد بستن روزنهها است.