Представяли ли сте си да снимате семейно видео и да осъзнаете – по време на тренировка по футбол – че половината ви кадри са вертикални, топката променя цвета си между кадрите, а племенникът ви очевидно се телепортира? Това, накратко, е предизвикателството на AI видеото. То може да създава изумителни изображения, но реализъм и последователност? Това е трудното. Добрата новина: със Sora 2, вашият промпт е вашият снимачен списък, супервайзор по последователността, професор по физика и сприхав редактор, събрани в едно. Ако му кажете за какво да се грижи, то слуша.
Прекарах една седмица, третирайки Sora 2 като режисьор, който отговаря само на команди по уоки-токи – ясни, специфични, безмилостни по отношение на последователността. Резултатите? По-чиста физика, по-стабилни идентичности на персонажите и по-малко моменти от типа „къде отиде тази чаша кафе?“. Ето 10-те промпта и шаблона, които постоянно повишаваха реализма и последователността.
Какво е Sora 2, казано на човешки език?
Ако сте нов тук: Sora 2 е модел за преобразуване на текст във видео от OpenAI, който може да синтезира кинематографични клипове от промпти. Версия 2 се фокусира върху по-добра физика, темпорална кохерентност (поддържане на нещата последователни във времето) и контрол на множество кадри. Същността: колкото повече пишете като режисьор, толкова по-добре изглеждат и се държат заедно вашите кадри – особено в множество кадри и движения на камерата. Ръководства от трети страни повтарят същия съвет: използвайте снимачни списъци, посочвайте физиката и изписвайте правилата за последователност, когато ви е грижа за тях.
Преди да започнем: три бързи правила на снимачната площадка на Sora
- Започнете конкретно: заключете идентичността, гардероба, реквизита и осветлението рано. Ако има значение, кажете го на глас (или, в текст). Повтаряйте ключови факти в различните кадри.
- Използвайте филмова граматика: интериор/екстериор, време на деня, размер на обектива, мащаб на кадъра, движение на камерата. Sora 2 отговаря чудесно на снимачни списъци и указания за камерата.
- Обявете закони за последователност: ако кучето трябва да запази червената бандана, напишете го като правило във всеки кадър, който включва кучето. Ако чашата не трябва да се движи, посочете го.
Топ 10 промпта на Sora 2 за реализъм и последователност
Използвайте ги като шаблони – заменете вашите персонажи, локации и реквизит. Удебелените части са двигателите на реализма и последователността.
- Заключване на идентичността: Поддържайте последователност на героите
Шаблон на подкана:
„Библия на героя: един главен герой, „Мая“, на 28 години, южноазиатка, коса с дължина до раменете, дънково яке със сребърен пин, бели маратонки. Тя запазва същия тоалет през целия ден. Интериор на кафене, сутрешна светлина, топло, меки сенки. Кадър 1 (широк, 24 мм): Мая влиза, бута вратата, звънец звъни, сребърният й пин улавя светлина. Кадър 2 (среден, 50 мм): Мая поръчва капучино; дънковото яке и сребърният пин остават непроменени. Кадър 3 (близък план, 85 мм): сърце от пяна, Мая се усмихва; косата и якето остават идентични във всички кадри.“
Защо работи: Тази „библия на героя“ е вашата котва. Вие не просто описвате; вие декларирате инварианти, които Sora поддържа в различните кадри.
- Клетвата за последователност на реквизита
Шаблон на подкана:
„Правила за последователност: червената керамична чаша има малък чип на ръба и отпечатък от червило; тя винаги остава в лявата ръка на Мая, освен ако не я постави от дясната страна на масата. Сцена: маса до прозореца, сутрешно слънце, меки отражения. Кадър 1 (среден): Мая вдига червената чаша с чип с лявата си ръка. Кадър 2 (над рамото): същата чаша, чипът е видим, остава от дясната страна на масата, неподвижна. Кадър 3 (вложка): отпечатъкът от червило съвпада с кадър 1.“
Защо работи: Посочването на пространствени позиции („дясната страна на масата“) и физически белези („чип“, „червило“) дава на модела фиксирани контролни точки за поддържане.
- Физическата клауза: Гравитацията не подлежи на договаряне
Шаблон на подкана:
„Подчертан физически реализъм: гравитация, инерция, триене, поведение на течности трябва да следват физиката на реалния свят. Стъклено топче се търкаля по дървена маса, забавя се поради триене и спира близо до възел в дървото. Камера (макро, 100 мм): малка дълбочина на рязкост, естествено ръчно микро-трептене. Топчето никога не се плъзга нагоре; движението се облекчава естествено, преди да спре.“
Защо работи: Sora 2 се справя по-добре с физиката, когато го поискате. Посочването на законите, за които ви е грижа, изостря реализма на движението.
- Наръчникът за граматика на камерата
Шаблон на подкана:
„Последователност от няколко кадъра с ясна граматика на камерата. Кадър 1 (установяващ широк, 24 мм): екстериор на градска улица в златен час, дълги сенки, пешеходци. Бавно приближаване към Мая, докато излиза от кафенето. Кадър 2 (проследяващ, 35 мм): камерата следва на височината на раменете, паралакс от витрините на магазините. Кадър 3 (вмъкване, 85 мм): стабилен близък план на лицето й; бокето на фона съвпада с предишното осветление. Поддържайте последователен гардероб и сребърен пин; яркостта и цветовата температура остават стабилни във всички кадри.“
Защо работи: Говорите на филмов език. Sora 2 превежда избора на обектив, мащаба на кадъра и движенията във визуална последователност.
- Договорът за време на деня
Шаблон на подкана:
„Последователност във времето: през цялото време е „късен следобед“. Сенките са дълги и топли; слънцето остава ниско в същия квадрант на небето. Кадър 1 (широк): дълги ъгли на сянка върху тротоара. Кадър 2 (среден): топла светлина около косата. Кадър 3 (вмъкване): лицето на часовника показва 17:22 ч. Температурата на осветлението, мекотата и посоката на сянката остават последователни във всички кадри.“
Защо работи: Времето е осветление. Ако заключите времето, заключвате цвета, контраста и посоката на сянката – големи победи за последователността.
- Пространствената карта: Къде е всичко?
Шаблон на подкана:
„Пространствена карта отгоре надолу за последователност: малко кафене, врата на северната стена, прозорец на източната стена, плот на южната стена, маса за двама близо до източния прозорец. Мая седи с лице на запад; червената чаша е отдясно. Камерата обикаля по посока на часовниковата стрелка, но поддържа прозореца в дясната част на кадъра. Във всички кадри поддържайте тази пространствена логика точно.“
Защо работи: Предоставянето на етажен план предотвратява телепортацията и обръщането на огледалото. Sora 2 уважава забележително добре посочената геометрия на стаята, когато я изписвате.
- Регистърът на гардероба и износването
Шаблон на подкана:
„Последователност на гардероба: дънково яке с леко петно от кафе на левия маншет; бели маратонки, леко изтъркани на пръстите. Тези специфични детайли трябва да присъстват във всеки кадър. Ако ръкавът на якето е навит в един кадър, той остава навит, освен ако не е посочено друго.“
Защо работи: Микро-детайлите като ожулвания и петна създават подсъзнателен реализъм. Давате на Sora отличителни котви, които да пренесе напред.
- Обещанието за пътя на движение
Шаблон на подкана:
„Подчертана последователност на движението. Мая върви от вратата (северната стена) до масата (източния прозорец) по права линия, без пропуснати стъпки. Ако преминем към вложка, възобновете от същата позиция и поза, както преди прекъсването. Камерата се движи с постоянна, бавна скорост; без резки преходи, освен ако не е посочено друго.“
Защо работи: Циклите на ходене и последователността на позата са чести точки на отказ; декларирането им отпред намалява вибрациите на „телепорт“.
- Сценарият с множество кадри
Шаблон на подкана:
„Инструкция от три кадъра с идентификатори.
- Проверката за здрав разум: Какво да не се променя
Шаблон на подкана:
„Заключване на последователността: Не променяйте идентичността на героя, гардероба, косата, цвета на чашата, позицията на чипа или местоположението на масата. Ако обект се движи, покажете движението на камерата; не преминавайте към ново състояние. Поддържайте темпорална кохерентност; без спонтанна поява/изчезване на обекти.“
Защо работи: Отрицателните подкани може да се чувстват заповеднически, но те са най-добрата ви защита срещу изненадващи промени в костюмите и телепортиращи реквизити.
Практическа демонстрация: Писане на подкана от нулата
Нека преминем от идея към подкана, по начина на Pogue.
Цел: Правдоподобна микросцена от три кадъра на бегачка, която си връзва обувката, а след това бяга покрай градски стенопис при изгрев слънце.
<a0>Чернова на подканата:
„Библия на героя: „Ава“, 32, чернокожа жена, плетена конска опашка, неоново коралово ветроупорно яке, черен клин, сиви маратонки със сини връзки. Гардеробът остава идентичен през цялото време. Време/осветление: изгрев слънце; мека, хладна светлина от изток, дълги сенки в син оттенък. Геометрия на местоположението: градски тротоар върви север-юг; стенописът на източната стена изобразява цветни птици..
- Обобщенията на съветите за реализъм на Sora 2 подчертават възможността за управление на множество кадри и инструкции за последователност.
ЧЗВ
В1: Как да поддържам външния вид на героя последователен в Sora 2?
Започнете вашата подкана с библия на героя – име, възраст, коса, дрехи и един отличителен аксесоар – и повторете ключовите детайли във всеки кадър. Изрично кажете: „Гардеробът и косата остават непроменени във всички кадри“, за да заключите последователността.
В2: Какъв е най-лесният начин да поправите реквизити, които скачат наоколо между кадрите?
Закачете реквизита за ръка или позиция на масата и му дайте отличителен белег като чип или стикер. Добавете правило за последователност: „Ако се движи, покажете движението на камерата; в противен случай остава на място.“
В3: Как мога да подобря физическия реализъм във видеоклиповете на Sora 2?
Поискайте го: споменете гравитация, инерция, триене и поведение на течности и опишете естествено облекчаване при влизане и излизане от движение. Специфики като „никакво плъзгане нагоре“ и „парата се издига нежно“ насочват модела към реалния свят.
В4: Фокусното разстояние и движенията на камерата наистина ли имат значение в подканите?
Абсолютно. Sora 2 отговаря на филмовата граматика – широк 24 мм, среден 50 мм, близък 85 мм, статив срещу ръчен – така че вашите кадри да се усещат последователни. Определете движението и скоростта на камерата, за да избегнете резки или несъвпадащи кадри.
В5: Мога ли да управлявам последователността на множество кадри, без да пренаписвам цялата подкана всеки път?
Да – използвайте идентификатори на кадрите като [S1], [S2], [S3] и секция за многократно използване „Заключване на последователността“, която поставяте във всяка последователност. Инструменти като Sider.AI могат да ви помогнат да запазвате и използвате повторно тези блокове, докато итерирате.