Įvadas: Demo įrašų problema
Kalbant apie AI vaizdo įrašus – ir ypač apie Runway Gen-3 – visi apsimeta, kad supranta, kol iš tikrųjų neprireikia jo panaudoti kažkam, kas bus išleista. Demo įrašai pasirodo kaip Marvel anonsai: blizgūs, dinamiški, triumfuojantys. Tada paliečiate produktą ir atrandate, kad paslėptas pagrindinis priešas yra ne modelis, o netvarka tarp jūsų idėjos ir baigto, žiūrimo klipo. Praktinis darbas su Runway Gen-3 būtent taip ir jaučiasi: išties įspūdingas teksto pavertimo vaizdo įrašu variklis, kuris nustebina iš pirmo karto ir nusižemina trečiuoju, ypač kai siekiate tęstinumo, laiko ir intencijos.
Praleidau savaitę generuodamas, kartodamas ir komponuodamas mažus kadrus – pavadinimų korteles, produkto papildomus kadrus, veido stambiu planu ir įprastą „padaryk tai kinematografiškai“ rinkinį. Gen-3 daugelį dalykų daro stebėtinai gerai. Taip pat klysta ten, kur demo įrašai slysta: scenos nuoseklumas laikui bėgant, fizinis tikėtinumas ir kasdienis taisymo vargas.
H2: Ką Runway Gen-3 Puikiai Darbo Dabar
Pradėkime nuo pagyrų, nes Gen-3 jų nusipelno.
- Tekstūros ir paviršiaus realistiškumas: Paprašykite šlifuoto aliuminio po švelnia studijos šviesa ir gausite šlifuotą aliuminį po švelnia studijos šviesa. Odos atspalviai dažniausiai būna natūralūs, o audiniai – džinsas, satinas – iš pirmo žvilgsnio atrodo teisingai. Tas „tikėtinumas iš pirmo žvilgsnio“ yra didžiausias šuolis nuo ankstesnių modelių.
- Judėjimo stilius: Gen-3 gerai atlieka vaizdinius veiksmažodžius. Sakote „lėtas sekimo kadras pro garuojantį puodelį“, jis rimtai žiūri į „lėtas“, „sekimas“ ir „garuojantis“. Kameros gramatika yra viena iš jo tyliųjų stiprybių.
- Apšvietimo intencija: Tai yra nuvertinta. „Niūrus apšvietimas iš užnugario“ ir „plokščia dienos šviesa“ yra reikšmingas skirtumas Gen-3. Galite jį pakreipti link auksinės valandos arba kibernetinio punko neonų, nekovodami dėl kiekvieno kadro.
- Greita ideacija: Siužetams ir nuotaikų perdavimui Gen-3 iš esmės yra apgaulės kodas. Galite užblokuoti toną per kelias minutes, o anksčiau tam reikėdavo pusės dienos rinkinio ir draugo, turinčio stabilizatorių.
H2: Kur Ratai Klimpsta: Tęstinumas, Priežastis ir Pasekmė bei Laikas
Pagrindinis Gen-3 trūkumas yra laikas. Ne laikrodžio laikas – pasakojimo laikas. Paprašykite rankos paimti puodelį, gurkšnoti ir padėti, ir gausite vieną ar du iš šių veiksmų įtikinamai, tačiau priežasties ir pasekmės grandinė vis dar stringa. Pirštai susikerta, puodeliai teleportuojasi puse colio, o gurkšnis įvyksta netinkamu kampu, tarsi žiūrėtumėte į gerai finansuotą sapną.
Tęstinumas tarp kadrų yra dar sudėtingesnis. Jei bandote suderinti plaukus, drabužių spintą ar rekvizitus per atskirų raginimų seką, Gen-3 kiekvieną klipą traktuoja kaip naują haliucinaciją. Jis jums duos fantastišką šaliką, tik kiekvieną kartą skirtingą fantastišką šaliką. Tai yra geriau nei ankstesnės kartos – mažiau chaoso, daugiau nuoseklumo – bet vis tiek ne įrankis, kurį naudojate, kai svarbu suderinti įterptus kadrus su pagrindiniu stambiu planu.
H2: Tekstas į vaizdą prieš vaizdą į vaizdą: kuris iš tikrųjų veikia?
- Tekstas į vaizdą: Smagus. Puikiai tinka nuotaikai nustatyti, prastas chirurginiam tikslumui. Jei jums reikia „riedlentininko, atliekančio kickflip nuo bortelio su raudona kepure“, dažnai gausite riedlentininką, bortelį ir kažką šalia galvos, kas kartais būna raudona. O kickflip? Kartais jis spardo, kartais apverčia.
- Vaizdas į vaizdą: Tai yra patikimumo režimas. Pradėkite nuo etaloninio kadro – jūsų produkto kadro, jūsų logotipo – ir animuokite nuo ten. Modelis elgiasi geriau su inkaru, ypač spalvos ir kompozicijos atžvilgiu. Judėjimas vis dar dreifuoja, bet jūsų prekės ženklo oranžinė spalva išlieka jūsų prekės ženklo oranžine spalva.
- Vaizdas į vaizdą: Galinga funkcija su mokomaisiais ratukais. Pateikite švarų judesį ir gausite stilingą interpretaciją, išlaikančią laiką. Pateikite netvarkingą judesį ir modelis sugalvoja savo istoriją. Gen-3 labiau paklūsta įvesties choreografijai nei ankstesni leidimai, bet ne iki tokio lygio, kad galėtumėte juo pasitikėti kritiniu tęstinumo redagavimu.
H2: Raginu, kuris nešvaisto jūsų laiko
Jei elgiatės su Gen-3 kaip su džinu, jis išpildo tris norus ir sugadina pabaigą. Elkitės su juo kaip su jaunesniuoju operatoriumi ir jis pasidarys geresnis.
- Pradėkite nuo kameros ir šviesos, o ne nuo būdvardžių. „50 mm rankinis, nedidelis gylis, volframo praktiniai“ nugalės „nuostabus kinematografinis šedevras“. Pastarasis skamba kaip maldavimas.
- Apribokite veiksmą iki dviejų veiksmažodžių. „Atidaro bloknotą, pakelia akis“ yra įmanoma. „Bėga per gatvę, iškviečia taksi, moja dronui, nostalgiškai šypsosi“ virsta sriuba.
- Įvardykite pagrindinį objektą. „Matinis juodas nešiojamasis kompiuteris su šviečiančia žalia šviesos juosta“ prilimpa geriau nei „nešiojamasis kompiuteris“. Modelis gerbia daiktavardžius.
- Remkitės tikra optika. „Anamorfinis lęšio blyksnis“ čia iš tikrųjų kažką daro. „Epinė nuotaika“ nedaro.
H2: Fizikos problema vis dar
Štai kur pramonė meluoja. Teiginys, kad „fizika atsiranda“, visada skamba kaip „namų ruošimas sekasi gerai po dviejų nelaimingų atsitikimų“. Skysčiai taškosi neteisingai. Šešėliai atsijungia, kai rankos kerta veidus. Audinys nusėda taip, lyg vieną ar du kadrus būtų veikiamas skirtingas gravitacijos vektorius. Visa tai nesugriauna vienkartinio koncepcinio klipo. Visa tai sugriauna vietą, kur jums reikia, kad stiklas nusileistų ant stalo ir neįlydėtų į jį.
Gen-3 akivaizdžiai apmokytas gerbti šviesą ir medžiagą – tikrovės išvaizdą – tačiau priežastinė judėjimo logika vis dar mokomasi per nuotaikas. Kai kurie kadrai išeina baisiai teisingi, todėl praleidimai atrodo labiau keisti. Jei esate išrankūs dėl akių linijų, perdavimų ar objekto pastovumo, galiausiai kompozituosite.
H2: Ilgis ir Sanglauda: kada 5 sekundžių pakanka
Apie 3–6 sekundes yra optimalus teksto pavertimo vaizdo įrašu taškas. Stumkite 10+ sekundžių ir gausite entropiją – modelis klaidžioja. Jei jums reikia 20 sekundžių sekos, kuri iš tikrųjų turi prasmę, grįžtate prie siužeto schemos kaip atskirų ritmų ir susiuvimo po to. Kas, tiesą sakant, yra tai, kaip veikia tiesioginis veiksmas. Skirtumas tas, kad negalite „tiesiog padaryti dar vieno kadro“ – galite tik vėl mesti kauliukus.
H2: Stiliaus perkėlimas ir „Padarykite, kad atrodytų kaip...“ pagunda
Stiliaus raginimai išlieka minų laukas, ir ne tik dėl teisinių priežasčių. Galite įtikinti impresionistinį įvertinimą, grūdų profilį, net lęšio lygio bokeh raštus. Tai, ko negalite nuosekliai padaryti, yra sujungti stilių su tiksliu veiksmu ir išlaikyti abu nepažeistus. Suteikite Gen-3 tris prioritetus ir jis pasirenka du.
Jei jūsų darbas yra prekės ženklo kūryba, protingas sprendimas yra standartizuoti savo išvaizdą – LUT, grūdų perdangas, vinjetes – ir leisti Gen-3 tiekti žaliavą. Įkepkite prekės ženklą po to, o ne raginime.
H2: Praktinis darbo eigos pavyzdys: kas iš tikrųjų buvo išsiųsta
Atlikau nedidelį bandomąjį projektą: fiktyvų produkto anonsą su penkiais ritmais – šaltas makro atidarymas, platus pagrindinis veikėjas, rankų sąveika, vartotojo sąsajos stambus planas, logotipo sprendimas. Tik vienas iš penkių klipų pateko tiesiai iš Gen-3 į laiko juostą. Kitiems reikėjo arba:
- Komponavimo: atskirti objektą, pakeisti foną arba stabilizuoti mikroskystį, kurį modelis įslaptino;
- Laiko pakartojimas: glotnus judesys, netinkamas kadencijos. Laiko tempimas paslėpė svyravimą;
- Pakeitimas: vienas ritmas, kuris Gen-3 niekada neatrodė gerai, tapo statiniu + paralakso darbu.
Bendras laikas: greičiau nei tikras kadras, lėčiau nei rodo kaitinimo ritės. Greičiausias kelias yra elgtis su Gen-3 kaip su kadrų generatoriumi, o ne scenos generatoriumi.
H2: Lauko lyginimas negeriant Kool-Aid
Nėra prieštaringa teigti, kad Runway Gen-3 stovi šalia teksto pavertimo vaizdo įrašu paketo priekio. Jis pateikia gražius kadrus su minimaliu raginimo masažavimu. Tačiau „geriausias“ šioje kategorijoje keičiasi kas kelias savaites, o kompromisai labiau primena namų stilius nei absoliučius reitingus. Kai kurie konkurentai geriau užrakina judesį, bet suplokština tekstūras. Kiti linkę į personažo ištikimybę, bet ištepa fonus. Gen-3 pasirenka „gražaus pirmo kadro“ kalną, kurį gins, ir tai yra pagrįstas pasirinkimas rinkodarai ir ideacijai.
H2: Valdymas yra trūkstama funkcija (ir visi tai žino)
Profesionalams reikia ne tiek magijos, kiek valdymo. Pagrindiniai kadrai, kaukės, judėjimo keliai, apribojimų sprendėjai – nuobodūs dalykai. AI vaizdo įrašų ironija yra ta, kad kuo įspūdingesnis modelis, tuo labiau trokštate nuobodžių rankenėlių. Runway Gen-3 pasistūmėjo link to su geresniu kondicionavimu ir įvesties nuorodomis, tačiau vis dar yra atotrūkis tarp „pasiūlyti“ ir „nurodyti“. Kol negalėsime užrakinti rankos ant puodelio ir puodelio ant stalo su tikromis garantijomis, įrankio riba išliks koncepcinis darbas ir trumpos formos klestėjimai.
H2: Išlaidos, kurių nematote demonstracijose
- Laikas, praleistas generuojant variantus, nes vienas tobulas kadras įvyksta 2,3 sekundę ir tada išsikreipia.
- Laikas, praleistas rašant raginimus, kurie iš tikrųjų yra paslėpti kadrų sąrašai.
- Laikas, praleistas taisant kitaip puikius klipus, nes detalė įsimirksi arba išsimirksi – auskarai, tekstas etiketėje, atspindžiai, kurie pamiršta, kad egzistuoja kamera.
Gen-3 sumažina sąrankos ir aparatinės įrangos išlaidas. Jis padidina skonio išlaidas – pasirinkimo, taisymo ir sprendimo valandas. Tai nėra smūgis; tai tiesiog sąskaita.
H2: Praktiniai patarimai realiems projektams
- Galvokite ritmais, o ne scenomis. Generuokite trumpus kadrus; surinkite seką patys.
- Įtvirtinkite nuorodomis. Pateikite švarius statinius kadrus arba plokšteles, kad stabilizuotumėte spalvą, kompoziciją ir geometriją.
- Atskirkite stilių nuo esmės. Pirmiausia gaukite judesį ir kadravimą; įvertinkite ir prekės ženklą vėliau.
- Būkite tiesmukiški. Veiksmažodžiai ir daiktavardžiai, o ne nuotaikos ir aukščiausiojo laipsnio būdvardžiai.
- Biudžetas pataisymui. Tikėkitės sudėti rankas, veidus ir teksto elementus.
H2: Gen-3 rezultatas: kas turėtų tai naudoti šiandien?
- Kūrybininkai, kuriantys pristatymo dokumentus, nuotaikų filmus ir išankstinį vizualizavimą. Gen-3 yra tinkamas įrankis „parodyk, o ne pasakyk“.
- Socialinės komandos, siunčiančios 3–6 sekundžių akimirkas, kur sanglauda mažiau svarbi nei nuotaika. Čia jis spindi.
- Mažos komandos be kamerų, kurioms vis dar reikia judesio. Jei sutinkate su Frankenstein darbo eiga, laimėsite laiką iki pirmojo pjūvio.
Jei kuriate pasakojimą, kuriame daug tęstinumo, arba prekės ženklui kritinius produkto kadrus su griežta geometrija, Gen-3 gali padėti – bet kaip sluoksnių šaltinis, o ne baigti klipai. Tai yra tekstūros ir apšvietimo genijus su nedideliu fizikos laipsniu.
H2: Keista tiesa: AI vaizdo įrašai yra artimesni „Photoshop“ nei „Premiere“
Visi nuolat lygina šiuos modelius su kameromis. Jie nėra. Jie labiau primena stochastinį „Photoshop“ su paleidimo mygtuku. Jūs piešiate link rezultato, o ne jį įrašote. Tai paaiškina jausmą stumdant tikimybę tol, kol ji užsifiksuoja. Tai taip pat paaiškina egzistencinę baimę artėjant terminui: tikimybė ne visada užsifiksuoja, kai jums to reikia.
H2: Apie atsakingą naudojimą be pamokslavimo
Dvi pastabos, nes gyvename internete:
- Neklastokite tikrovės, kad pakenktumėte žmonėms. Tai nėra apribojimas, tai elementarus padorumas.
- Jei galite, uždėkite vandens ženklą, nurodykite šaltinį, kai jis yra išvestinis, ir neapsimeskite, kad modelis padarė viską. Redagavimas vis dar yra redagavimas.
Kad ir kiek Runway Gen-3 tvarkytų judesį ir šviesą, skausmas dažnai būna aukščiau: raginimas, siužeto schema, etaloniniai ištekliai. Jei naudojate AI asistentą raginimams kartoti, stiliaus vadovams generuoti arba kadrų sąrašams ištraukti iš scenarijų, išvengsite „Aš tiesiog improvizuosiu“ spąstų, kurie švaisto daugiausiai kreditų. Sider.AI iš tikrųjų padeda čia – ne kaip stebuklinga vaizdo įrašų dėžutė, bet kaip nuobodus, naudingas planuotojas: paverskite grubią koncepciją aiškiu ritmų sąrašu, perfaktoruokite raginimus į pirmiausia į kamerą orientuotas kryptis ir tvarkykite etaloninių kadrų biblioteką. Mažiau mistikos, mažiau pakartotinių paleidimų. Tai nėra seksualu, bet tai yra esmė. Darbas, dėl kurio Gen-3 dainuoja, yra pasirengimas gamybai, užmaskuotas kaip raginimas. Bet kas, kas sumažina šio žingsnio trintį, sutaupo laiko, kurį kitaip paaukotumėte entropijos dievams.
H2: Viltinga dalis (ir įspėjimas)
Gen-3 yra smagiausias dalykas, kurį iki šiol esu patyręs su AI vaizdo įrašais. Tai taip pat aiškiausias įrodymas, kad modeliai tobulėja ties kraštais, kuriuos pirmiausia pastebime – išvaizda – tuo pat metu mokydamiesi kraštus, kurių mums labiausiai reikia – logika. Šis kompromisas tinka ritėms ir ideacijai. Tai skausminga viskam, kas ilgesnė nei sakinys.
Įspėjimas yra nuolatinis: ši erdvė keičiasi kas savaitę. Jei jūsų projektas išleidžiamas šiandien, naudokite tai, kas veikia šiandien: trumpus ritmus, įtvirtintas nuorodas ir norą sudėti. Jei tiesiog tyrinėjate, mėgaukitės reginiu ir saugokite kvitus apie tai, kas nepavyksta. Šiandienos nesėkmė įtartinai artima kitam mėnesio bruožui.
Išvada: Sąžiningas požiūris
Runway Gen-3 yra gražus melagis geriausiu įmanomu būdu: jis greitai įtikina jus, kad esate arčiau baigto kadro nei esate. Tai nėra tiek trūkumas, kiek priminimas, kad neprarastumėte galvos. Kai tai veikia, tai yra stebuklinga. Kai tai neveikia, tai yra mandagus postūmis atgal į praktinį meistriškumą – kadrų sąrašus, inkarus ir tvirtą ranką po to.
Jei ateisite tikėdamiesi kameros, nusivilsite. Jei ateisite tikėdamiesi nepaprastai pajėgios, kartais erzinančios idėjų mašinos, kuri gali išspjauti tinkamus naudoti kadrus su tinkamais atitvarais, išeisite sužavėti. Tiesiog neleiskite demo ritiniui įkalbėti jūsų praleisti nuobodžias dalis. Nuobodiose dalyse Gen-3 tampa įrankiu, o ne žaislu.
H2: Praktinis Runway Gen-3 galimybių apžvalgos pavyzdys: Pagrindiniai duomenys
- Stiprybės: apšvietimas, medžiagos realistiškumas, kameros gramatika, patrauklumas pirmuoju kadru, greita ideacija.
- Silpnybės: daugiapakopis priežastingumas, ilgaamžis nuoseklumas, tiksli rankos ir objekto sąveika, teksto įskaitomumas.
- Geriausi naudojimo atvejai: 3–6 sekundžių kadrai, stiliaus / nuotaikos perdavimai, produkto makro su minimalia sąveika, socialiniai ciklai.
- Darbo eigos patarimai: generavimas pagal ritmą, vaizdo / vaizdo įrašo įtvirtinimas, prekės ženklo kūrimas po to, tiesmuki raginimai.
- Pagrindinė mintis: puikus kadrų generatorius; dar nėra patikimas scenų generatorius.
DUK
1 klausimas: Ar Runway Gen-3 pakankamai geras profesionalioms reklamoms?
Trumpais ritmais – taip. Runway Gen-3 nagrinėja apšvietimą ir tekstūrą, tačiau tęstinumas ir fizika vis dar svyruoja, todėl traktuokite tai kaip kadrų generatorių, kurį sudėsite – o ne kaip tiesioginį viso produkto pakeitimą.
2 klausimas: Kaip raginti Runway Gen-3, kad gautumėte nuoseklius rezultatus?
Pradėkite nuo kameros ir šviesos, apribokite veiksmus iki dviejų veiksmažodžių ir įtvirtinkite etaloniniu vaizdu. Modelis gerbia daiktavardžius ir optiką labiau nei būdvardžius, todėl „50 mm rankinis, volframo praktiniai“ nugalės „kinematografinį šedevrą“.
3 klausimas: Tekstas į vaizdą ar vaizdas į vaizdą: kuris veikia geriau Gen-3?
Tekstas į vaizdą puikiai tinka nuotaikai ir pirmiesiems kadrams; vaizdas į vaizdą išlaiko laiką ir choreografiją. Jei jums reikia prekės ženklo nuoseklumo, pradėkite nuo vaizdo į vaizdą arba plokštelių ir leiskite Gen-3 stilizuoti aplink jūsų inkarus.
4 klausimas: Ar Runway Gen-3 gali tvarkyti ekrane rodomą tekstą ir vartotojo sąsajos kadrus?
Kartais, bet tai nenuoseklu. Naudokite perdangas po to arba sudėkite švarias vartotojo sąsajos plokšteles – Gen-3 stiprybės yra judesys ir nuotaika, o ne įskaitoma tipografija per kelias sekundes.
5 klausimas: Koks yra geriausias Runway Gen-3 klipų ilgis?
Nuo trijų iki šešių sekundžių. Praėjus dešimčiai sekundžių, įsismelkia entropija ir priežastingumas išyra. Galvokite ritmais, o ne scenomis, ir susiūkite seką patys.