آیا تا به حال سعی کردهاید یک ویدیوی خانوادگی بگیرید و در میانه تمرین فوتبال متوجه شوید که نیمی از شاتهای شما عمودی هستند، رنگ توپ بین کاتها تغییر میکند و برادرزادهتان ظاهراً تلهپورت میکند؟ این، به طور خلاصه، چالش ویدیوی هوش مصنوعی است. میتواند تصاویر خیرهکنندهای بسازد، اما واقعگرایی و پیوستگی؟ اینجاست که مشکل خود را نشان میدهد. خبر خوب این است که با Sora 2، درخواست شما لیست شاتها، ناظر پیوستگی، استاد فیزیک و تدوینگر بدخلق، همه در یکجا است. اگر به آن بگویید که به چه چیزهایی اهمیت دهد، گوش میدهد.
من یک هفته را صرف این کردم که با Sora 2 مانند یک کارگردان رفتار کنم که فقط به دستورات بیسیم پاسخ میدهد - واضح، مشخص و بیامان در مورد پیوستگی. نتایج؟ فیزیک تمیزتر، هویتهای شخصیتی ثابتتر و لحظات کمتر «آن فنجان قهوه کجا رفت؟». در اینجا 10 درخواست و الگو وجود دارد که به طور مداوم واقعگرایی و پیوستگی را تقویت میکنند.
Sora 2 از نظر انسانی چیست؟
اگر تازه وارد هستید: Sora 2 یک مدل تبدیل متن به ویدیو از OpenAI است که میتواند کلیپهای سینمایی را از درخواستها سنتز کند. نسخه 2 بر فیزیک بهتر، انسجام زمانی (حفظ سازگاری در طول زمان) و کنترل چند شاتی تمرکز دارد. حرف اصلی: هرچه بیشتر مانند یک کارگردان بنویسید، فیلم شما بهتر به نظر میرسد و منسجمتر میماند - به خصوص در چندین شات و حرکت دوربین. راهنماهای شخص ثالث نیز همین توصیه را تکرار میکنند: از لیست شاتها استفاده کنید، فیزیک را مشخص کنید و قوانین پیوستگی را زمانی که برایتان مهم است، بیان کنید.
قبل از شروع فیلمبرداری: سه قانون سریع صحنه Sora
- با موارد مشخص شروع کنید: هویت، لباس، وسایل و نورپردازی را زود قفل کنید. اگر مهم است، آن را بلند (یا در متن) بیان کنید. حقایق مهم را در شاتهای مختلف تکرار کنید.
- از دستور زبان فیلم استفاده کنید: داخلی/خارجی، زمان روز، اندازه لنز، مقیاس شات، حرکت دوربین. Sora 2 به لیست شاتها و دستورالعملهای دوربین به خوبی پاسخ میدهد.
- قوانین پیوستگی را اعلام کنید: اگر سگ باید دستمال گردن قرمز را نگه دارد، آن را به عنوان یک قانون در هر شاتی که سگ در آن وجود دارد، بنویسید. اگر لیوان نباید حرکت کند، آن را بیان کنید.
10 درخواست برتر Sora 2 برای واقعگرایی و پیوستگی
از اینها به عنوان الگو استفاده کنید - شخصیتها، مکانها و وسایل خود را جایگزین کنید. قسمتهای برجسته، موتورهای واقعگرایی و پیوستگی هستند.
- قفل هویت: شخصیتها را ثابت نگه دارید
الگوی درخواست:
«مشخصات شخصیت: یک شخصیت اصلی، 'مایا'، 28 ساله، آسیای جنوبی، موهای مجعد تا شانه، ژاکت جین با یک سنجاق نقرهای، کفشهای کتانی سفید. او در تمام طول روز همان لباس را میپوشد. فضای داخلی کافیشاپ، نور صبح، گرم، سایههای ملایم. شات 1 (واید، 24 میلیمتر): مایا وارد میشود، در را هل میدهد، زنگ به صدا در میآید، سنجاق نقرهای او نور را جذب میکند. شات 2 (متوسط، 50 میلیمتر): مایا یک کاپوچینو سفارش میدهد. ژاکت جین و سنجاق نقرهای بدون تغییر باقی میمانند. شات 3 (کلوزآپ، 85 میلیمتر): قلب فوم آرت، مایا لبخند میزند. موها و ژاکت در تمام شاتها یکسان میمانند.»
چرا کار میکند: آن «مشخصات شخصیت» لنگر شماست. شما فقط توصیف نمیکنید؛ بلکه متغیرهایی را اعلام میکنید که Sora در تمام شاتها حفظ میکند.
- پیمان پیوستگی وسایل
الگوی درخواست:
«قوانین پیوستگی: لیوان سرامیکی قرمز یک تراشه کوچک روی لبه و یک اثر رژ لب دارد. همیشه در دست چپ مایا میماند، مگر اینکه آن را در سمت راست میز بگذارد. صحنه: میز کنار پنجره، آفتاب صبح، انعکاسهای ملایم. شات 1 (متوسط): مایا لیوان قرمز تراشهدار را با دست چپ خود بلند میکند. شات 2 (روی شانه): همان لیوان، تراشه قابل مشاهده، در سمت راست میز، بدون حرکت باقی میماند. شات 3 (درج): اثر رژ لب با شات 1 مطابقت دارد.»
چرا کار میکند: بیان موقعیتهای فضایی («سمت راست میز») و علائم فیزیکی («تراشه»، «رژ لب») به مدل نقاط بازرسی ثابتی میدهد تا حفظ کند.
- بند فیزیک: گرانش غیرقابل مذاکره است
الگوی درخواست:
«تاکید بر واقعگرایی فیزیکی: گرانش، لختی، اصطکاک، رفتار سیال باید از فیزیک دنیای واقعی پیروی کند. یک تیله شیشهای روی یک میز چوبی میغلتد، به دلیل اصطکاک سرعتش کم میشود و در نزدیکی یک گره در چوب متوقف میشود. دوربین (ماکرو، 100 میلیمتر): عمق میدان کم، لرزشهای طبیعی دستی. تیله هرگز به سمت بالا نمیلغزد. حرکت به طور طبیعی قبل از توقف آسان میشود.»
چرا کار میکند: Sora 2 وقتی از آن بخواهید در فیزیک بهتر عمل میکند. بیان قوانینی که برایتان مهم است، واقعگرایی حرکت را تشدید میکند.
- دفترچه دستور زبان دوربین
الگوی درخواست:
«سکانس چند شاتی با دستور زبان دوربین صریح. شات 1 (نمای باز، 24 میلیمتر): خیابان شهر در ساعت طلایی، سایههای بلند، عابران پیاده. حرکت آهسته به سمت مایا در حالی که از کافه خارج میشود. شات 2 (ردیابی، 35 میلیمتر): دوربین در ارتفاع شانه، اختلاف منظر از ویترین مغازهها را دنبال میکند. شات 3 (برش، 85 میلیمتر): نمای نزدیک ثابت از صورت او؛ بوکه پسزمینه با نورپردازی قبلی مطابقت دارد. لباس و سنجاق نقرهای ثابت را حفظ کنید. روشنایی و دمای رنگ در تمام شاتها ثابت میمانند.»
چرا کار میکند: شما به زبان فیلم صحبت میکنید. Sora 2 انتخاب لنز، مقیاس شات و حرکات را به پیوستگی بصری تبدیل میکند.
- قرارداد زمان روز
الگوی درخواست:
«پیوستگی زمان: در تمام طول مدت 'اواخر بعد از ظهر' است. سایهها بلند و گرم هستند؛ خورشید در ربع یکسان آسمان پایین میماند. شات 1 (واید): زوایای سایه بلند روی پیادهرو. شات 2 (متوسط): نور حاشیهای گرم در اطراف مو. شات 3 (درج): صفحه ساعت 5:22 بعد از ظهر را نشان میدهد. دمای نور، نرمی و جهت سایه در تمام شاتها ثابت میمانند.»
چرا کار میکند: زمان، نورپردازی است. اگر زمان را قفل کنید، رنگ، کنتراست و جهت سایه را قفل میکنید - بردهای بزرگ پیوستگی.
- نقشه فضایی: همه چیز کجاست؟
الگوی درخواست:
«نقشه فضایی از بالا به پایین برای پیوستگی: یک کافیشاپ کوچک، در در دیوار شمالی، پنجره در دیوار شرقی، پیشخوان در دیوار جنوبی، میز دو نفره نزدیک پنجره شرقی. مایا رو به غرب نشسته است. لیوان قرمز در سمت راست او قرار دارد. دوربین به صورت ساعتگرد میچرخد، اما پنجره را در سمت راست قاب نگه میدارد. در تمام شاتها، این منطق فضایی را دقیقاً حفظ کنید.»
چرا کار میکند: ارائه یک نقشه طبقات از تلهپورت و چرخشهای آینهای جلوگیری میکند. Sora 2 وقتی آن را بیان کنید، به هندسه اتاق احترام میگذارد.
- دفترچه لباس و ساییدگی
الگوی درخواست:
«پیوستگی لباس: ژاکت جین با یک لکه قهوه کم رنگ روی سرآستین چپ؛ کفشهای کتانی سفید کمی ساییده شده در انگشتان پا. این جزئیات خاص باید در هر شات باقی بمانند. اگر آستین ژاکت در یک شات بالا زده شود، بالا زده باقی میماند، مگر اینکه خلاف آن مشخص شود.»
چرا کار میکند: جزئیات کوچک مانند ساییدگیها و لکهها واقعگرایی ناخودآگاه ایجاد میکنند. شما به Sora لنگرهای متمایزی میدهید تا به جلو ببرد.
- وعده مسیر حرکت
الگوی درخواست:
«تاکید بر پیوستگی حرکت. مایا از در (دیوار شمالی) به میز (پنجره شرقی) در یک مسیر مستقیم راه میرود، بدون هیچ گامی که از قلم بیفتد. اگر به یک درج برش بزنیم، از همان موقعیت و حالت قبل از برش از سر بگیریم. دالی دوربین با سرعت ثابت و آهسته حرکت میکند. هیچ جامپ کاتی وجود ندارد، مگر اینکه مشخص شده باشد.»
چرا کار میکند: چرخههای راه رفتن و پیوستگی وضعیت بدن نقاط شکست مکرر هستند؛ اعلام آنها از قبل، حس «تلهپورت» را کاهش میدهد.
- اسکریپت چند شاتی
الگوی درخواست:
«مجموعه دستورالعمل سه شاتی با شناسهها.»
- بررسی عقل: چه چیزی نباید تغییر کند
الگوی درخواست:
«قفل پیوستگی: هویت شخصیت، لباس، مو، رنگ لیوان، موقعیت تراشه یا مکان میز را تغییر ندهید. اگر یک شیء حرکت میکند، حرکت را روی دوربین نشان دهید؛ به یک حالت جدید نپرید. انسجام زمانی را حفظ کنید؛ هیچ ظاهر/ناپدید شدن خود به خودی اشیاء وجود نداشته باشد.»
چرا کار میکند: درخواستهای منفی ممکن است رئیسمآبانه به نظر برسند، اما بهترین دفاع شما در برابر تغییر لباسهای غافلگیرکننده و وسایل تلهپورتکننده هستند.
دموی عملی: نوشتن یک درخواست از ابتدا
بیایید از ایده به درخواست برویم، به روش Pogue.
هدف: یک صحنه خرد سه شاتی باورپذیر از یک دونده که بند کفش خود را میبندد، سپس در هنگام طلوع آفتاب از کنار یک دیوارنگاره شهری میدود.
پیشنویس درخواست:
«مشخصات شخصیت: 'آوا'، 32 ساله، زن سیاه پوست، دم اسبی بافته شده، بادگیر مرجانی نئون، ساقهای مشکی، کفشهای دویدن خاکستری با بندهای آبی. لباس در سراسر مدت یکسان باقی میماند. زمان/نورپردازی: طلوع آفتاب؛ نور ملایم و خنک از شرق، سایههای بلند با رنگ آبی. هندسه مکان: پیادهرو شهر از شمال به جنوب امتداد دارد. دیوارنگاره در دیوار شرقی پرندههای رنگارنگ را به تصویر میکشد.
.
- خلاصههای نکات واقعگرایی Sora 2 بر قابلیت کنترل چند شاتی و دستورالعملهای پیوستگی تاکید میکنند.
سوالات متداول
سوال 1: چگونه ظاهر شخصیت را در Sora 2 ثابت نگه دارم؟
درخواست خود را با یک مشخصات شخصیت شروع کنید - نام، سن، مو، لباس و یک وسیله جانبی متمایز - و جزئیات کلیدی را در هر شات تکرار کنید. به طور صریح بگویید: «لباس و مو در تمام شاتها بدون تغییر باقی میمانند» تا پیوستگی را قفل کنید.
سوال 2: سادهترین راه برای رفع وسایلی که بین شاتها جابجا میشوند چیست؟
آن وسیله را به یک دست یا موقعیت میز سنجاق کنید و یک علامت متمایز مانند یک تراشه یا برچسب به آن بدهید. یک قانون پیوستگی اضافه کنید: «اگر حرکت میکند، حرکت را روی دوربین نشان دهید. در غیر این صورت سر جای خود میماند.»
سوال 3: چگونه میتوانم واقعگرایی فیزیک را در ویدیوهای Sora 2 بهبود بخشم؟
درخواست کنید: از گرانش، لختی، اصطکاک و رفتار سیال نام ببرید و کاهش و افزایش طبیعی حرکت را توصیف کنید. موارد خاص مانند «هیچ لغزشی به سمت بالا» و «بخار به آرامی بلند میشود» مدل را به سمت دنیای واقعی سوق میدهند.
سوال 4: آیا فاصلههای کانونی و حرکات دوربین واقعاً در درخواستها مهم هستند؟
قطعاً. Sora 2 به دستور زبان فیلم پاسخ میدهد - واید 24 میلیمتر، متوسط 50 میلیمتر، نزدیک 85 میلیمتر، سهپایه در مقابل دستی - بنابراین فیلم شما منسجم به نظر میرسد. حرکت و سرعت دوربین را تعریف کنید تا از شاتهای پرشدار یا ناهماهنگ جلوگیری شود.
سوال 5: آیا میتوانم پیوستگی چند شاتی را بدون بازنویسی کل درخواست در هر بار مدیریت کنم؟
بله - از شناسههای شات مانند [S1]، [S2]، [S3] و یک بخش «قفل پیوستگی» قابل استفاده مجدد که در هر سکانس جایگذاری میکنید، استفاده کنید. ابزارهایی مانند Sider.AI میتوانند به شما کمک کنند تا این بلوکها را در حین تکرار ذخیره و دوباره استفاده کنید.