Esminis dalykas su AI vaizdų generatoriais yra tas, kad visi apsimeta norintys „fotorealistinio tobulumo“, kol modelis nepataiko į tai, ko jie iš tikrųjų norėjo: skonio. O skonis – ne greitis, ne megapikseliai, ne raginimai su runų sintakse – yra tai, kur vyksta kova.
Užduokime akivaizdų klausimą pirmiausia. Jei AI vaizdų generatoriai dabar tokie geri, kodėl tiek daug vaizdų vis dar... ? Ne klaidingi. Tiesiog šiek tiek , kaip vaškinių figūrų muziejus, kuriame apšvietimas puikus, bet akys seka tave sekunde per vėlai. Tas atotrūkis – tarp to, ką sakome norintys, ir to, ką priimame – yra tai, ant ko laikosi visa ši scena.
Štai kas aišku: AI vaizdų generatoriai yra greiti, lankstūs ir, atvirai kalbant, stulbinantys. Ir jie vis geriau įsisavina vieną dalyką, kuriame kompiuteriai turėtų būti siaubingi: daryti tai, ką turėjome omenyje, o ne tai, ką pasakėme. Ta antroji dalis vis dar yra slidi. Jei kada nors buvote įkritę į „kodėl jis neuždės teksto ant iškabos nesutirpdydamas raidžių“ triušio urvą, tai pajutote.
Esame kažkur tarp ankstyvosios skaitmeninių fotoaparatų eros ir to momento, kai išmanieji telefonai pavertė fotografiją kasdiene supergalia. Modeliai gali atkurti odos poras, kurios priverstų jūsų dermatologą parausti, ir jie gali išspjauti šešias variacijas, kol spėsite ištarti „estetika“. Tačiau tikroji istorija nėra paviršutiniškas realizmas. Tai – kontrolė. Nuoseklumas. Ir skonis.
Ko žmonės iš tikrųjų nori iš AI vaizdų generatorių
- Akivaizdūs valdymo mygtukai: įterpimas, išplėtimas, stiliaus užraktai, sėklų nuoseklumas, kraštinių santykiai, kurie nesielgia kaip pasiūlymai.
- Prognozuojamumas: tas pats raginimas, ta pati išvesties kryptis, o ne kauliukų metimas su gražia entropija.
- Pagarba apribojimams: įskaitoma tipografija, rankos, priklausančios žmonėms, apšvietimas, kuris neišduoda fizikos.
- Teisinis ir licencijavimo aiškumas: jokios autorių teisių ruletės.
- Darbo eiga, kuriai nereikia {Discord} archeologijos laipsnio.
Popieriuje erdvė atrodo perpildyta. Praktiškai kiekvienas pagrindinis įrankis atskleidžia skirtingą nuomonę apie tai, kaip turėtų jaustis vaizdo kūrimas.
- {Midjourney}: autoriaus nuotaikos lenta. Nejauki gera stiliaus ir kompozicijos prasme, vis dar šiek tiek mistiška valdymo prasme. Jūs dirbate su {Midjourney}, o ne jo.
- {DALL·E 3}: nepriekaištingai paklusnus natūraliai kalbai ir antraštėms. Tai – puikus mokinys: puikiai seka nurodymus, kartais tiesmukiškas iki klaidos.
- {Stable Diffusion} ir {SDXL/SD3.x}: meistro dirbtuvės. Atviras, modifikuojamas, be galo pajėgus tinkamose rankose. Pavojingas, jei nežinote, kurias svirtis traukti. Atsiperkantis, jei žinote.
- {Adobe Firefly}: įmonės suaugėlis. Apsauginiai turėklai. Komercinės licencijos. Papildoma porcija „taip, teisininkai pasirašė“.
Bendras bruožas: AI vaizdų generatoriai iš esmės yra skonio stiprintuvai. Jie leidžia ne menininkams išreikšti viziją, bet vis tiek apdovanoja tas pačias senas, nuobodžias dorybes: iteraciją, redagavimą ir akį.
Raginimas nėra kerai. Tai – trumpas aprašymas.
Blogiausias pramonės įprotis yra apsimesti, kad raginimai yra paslaptys. Tiesa yra arčiau gero kūrybinio aprašymo rašymo. Jums nereikia barokinių prieveiksmių ir trijų dešimčių kableliais atskirtų menininkų. Jums reikia:
- Subjekto aiškumas: kas yra kadre, kas ne, ką žiūrovas turėtų pastebėti pirmiausia.
- Kontekstas ir apribojimai: paros metas, apšvietimo stilius, objektyvo pojūtis (platus vs tele), era, terpė, nuotaika.
- Kompozicijos užuominos: priekinis planas vs fonas, simetrija, neigiama erdvė, kur turėtų būti tekstas.
- Nenagrinėjami dalykai: „penki pirštai“, įskaitomos iškabos, prekės ženklo spalvos tikslumas.
Elkitės su modeliu kaip su jaunesniuoju dizaineriu: pakankamai konkrečiu, kad būtų atsakingas, pakankamai atviru galimybėms. Tada kartokite. Pirmasis vaizdas retai būna tinkamas. Antrasis dažnai toks yra. Trečiasis kartais apverčia koncepciją.
Realizmas vs. Skonis (rinkitės skonį)
Fotorealizmas yra salono triukas. Jis mus sužavėjo; dabar mes to tikimės. Tai, kas pajudina rodyklę, yra skonis. Štai kodėl {Midjourney} vaizdai gali atrodyti kinematografiški, net kai jie daro detalių klaidų – modelis yra šališkas estetikos atžvilgiu. Fotografai ir iliustratoriai intuityviai primeta skonį; AI primeta jį pagal išankstinius tikimybes. Tai nėra klaida. Tai – funkcija. Klausimas yra, ar modelio skonis sutampa su jūsų.
Galite kovoti su išankstiniais. Arba galite jais plaukti. Žmonės, gaunantys gerų rezultatų, neprimeta modeliui ortodoksijos jėga; jie pakreipia savo raginimus į srovę. Paprašykite {Saul Bass} plakato ir kovokite už grūdėtą minimalizmą, ten pateksite greičiau, nei pradėdami nuo „padaryk man minimalų plakatą“ ir ištraukdami modelį iš „šiuolaikinio blizgaus gradiento košės“.
Tipografija vis dar yra kanarėlė
Paklauskite bet kurio dizainerio: jei šriftas atrodo neteisingai, visas vaizdas atrodo neteisingai. AI teksto apdorojimo problemos pagerėjo nuo „abėcėlės sriubos su papildomomis rankomis“ iki „beveik teisingai, jei nežiūrite per atidžiai“. Tai geriau – netgi tinkama naudoti – maketuose, kuriuose modelis gerbia tuščias sritis. Tačiau mes nesame „paruoštas įdėti antraštę“ visose srityse. Kai jums reikia griežtos tipografijos, senamadiškas būdas (jūs, tikras šriftas ir maketavimo įrankis) vis dar laimi.
Ir tai yra gerai. Kadangi pagrindinis AI vaizdų generatorių naudojimo atvejis nėra galutinis spausdinimas. Tai – konceptavimas. Tai – kompozicijos, dėl kurių jums nėra gėda. Tai – peržengimas tuščio puslapio. Geriausias darbas, kurį mačiau, sujungia AI su žmogumi redaktoriumi, kuris alergiškas tingiai detalei.
Įterpimas, išplėtimas ir kontrolės iliuzija
Įrankiai mėgsta parduoti kontrolę. Realybė: įterpimas ir išplėtimas yra mažiau panašūs į chirurginius instrumentus ir labiau panašūs į improvizacinį džiazą su skalpeliais. Jie puikiai veikia, kai jūs stumiate: pašalinkite lempą, pridėkite dangų, pratęskite rinkinį. Jie susinervina dėl struktūrinių redagavimų, kurie prieštarauja scenos logikai. Triukas yra mąstyti kaip kinematografininkas. Išlaikykite tęstinumą: kampą, šviesos kryptį, mastelį. Jei saulė pasislenka 30 laipsnių tarp įterpimo praėjimų, žiūrovas tai jaučia, net jei negali paaiškinti, kodėl.
Neigiami raginimai išlieka naudingi, bet, kaip ir visa neigiama erdvė, jie skaitosi geriau, kai naudojami saikingai. „Jokių papildomų pirštų“ yra gerai. Skalbinių sąrašas „ne to, ne ano“ paverčia generatorių kaltės kamuojamu improvizacijos partneriu. Pasakykite jam, ką daryti, o ne tik tai, ko vengti.
Teisinė realybė: licencijos ir vandens ženklai
Štai ta dalis, kuria visi apsimeta nuobodžia, kol klientas nepaprašo šaltinio. Jei kuriate komercinį darbą, jums reikia aiškumo: kokie duomenys, kokia licencija, kas atsitinka, jei kas nors skundžiasi? Modeliai, susieti su aiškiomis akcijų arba įmonių licencijomis, ir toliau laimės sandorius. Ne todėl, kad jie yra geresni menininkai, bet todėl, kad jie siunčiami su dokumentais. Kita dalis yra kilmė – kriptografiniai turinio kredencialai, vandens ženklai, visa ta abėcėlės sriuba. Jie nesustabdys blogų veikėjų. Jie padės sąžiningoms komandoms įrodyti, kas yra kas.
Individualiems kūrėjams pragmatiškas kelias yra paprastesnis: laikykite savo sluoksnius, laikykite savo sėklas, laikykite savo raginimus. Dokumentuokite savo procesą. Tai nėra žavinga, bet tai – jūsų alibi.
Darbo eiga: kur AI vaizdų generatoriai iš tikrųjų tinka
- Idėjų generavimas: per 15 minučių peržiūrėkite 20 krypčių ir sunaikinkite 18 iš jų be jokio gailesčio.
- Nuotaikos lentos: suvienodinkite išvaizdą, kol kas nors nepradės ginčytis dėl fotoaparatų, kurių neturite.
- Kompozicijos: parodykite maketą su tikėtinu apšvietimu ir įtikinama perspektyva.
- Variacijos: a/b testuokite paletes, pozas, aplinkas be pakartotinių filmavimų.
- Pogradiminiai triukai: įterpkite elementus, kuriuos pamiršote rinkinyje, išplėskite kadrą, pataisykite nukrypusį atspindį.
Atkreipkite dėmesį į tai, ko trūksta: „galutinis pagrindinis meno kūrinys“ ir „gamybai paruošta tipografija“. Kai kurios komandos gali ten patekti su pakankamai iteracijų ir žmogaus poliravimo. Daugelis neturėtų bandyti praleisti žingsnių vien todėl, kad pirmasis praėjimas atrodė blizgus.
Kaip iš tikrųjų gerai įvaldyti AI vaizdų generavimą
- Pradėkite nuo paprasto. Daiktavardis, veiksmažodis, kontekstas. Gaukite tinkamą pagrindą.
- Užrakinkite sėklas, kai jums patinka kryptis. Tada kartokite: fotoaparatas, objektyvas, šviesa, paros metas.
- Laikykite mažą asmeninę stiliaus knygą: 10 nuorodų, kuriomis žavitės. Raginkite jų link, neminėdami vardų.
- Naudokite vaizdą vaizdui kaip profesionalas: grubus eskizas, užblokuokite kompoziciją, tada leiskite modeliui pridėti gražumo.
- Išmokite apkarpyti. Kompozicija yra pusė mūšio, o apkirpimo įrankis vis dar nenugalimas.
- Apdirbkite. Kreivės, grūdeliai, subtilus žydėjimas, tikras šriftas. Paskutiniai penki procentai yra svarbūs.
Atviras klausimas: ar tai „menas“?
Žinoma, tai gali būti. Žinoma, tai dažnai ir nebūna. Naudingas požiūris yra autorystė. Jei galite apibūdinti, atkurti ir tobulinti savo procesą – jei yra gija, jungianti jūsų pasirinkimus – jūs užsiimate autoryste. Jei lošiate lošimo automatu, kol gausite ką nors šaunaus ir nepakartojamo, tai tinka plakatams ir nuotaikoms, bet neapsimeskite, kad tai tas pats dalykas.
Pramonės pretenzija, kurios negaliu ignoruoti
Yra AI entuziazmo atmaina, kuri iš esmės sako, kad modelis yra menininkas, o jūs tiesiog pasisekė, kad esate ten. Tai yra atvirkščiai. Modelis yra fotoaparatas su 10 000 objektyvų ir milijonu nuotaikų. Fotoaparatai nefotografuoja. Žmonės tai daro. Geresnė metafora yra muzikos instrumentas. Padėkite {Steinway} mano svetainėje; jis nesukurs sonatos. Tačiau jis privers kompetentingą pianistą skambėti nuostabiai, o puikų – transcendentaliai. Blogi raginimai skamba kaip bloga praktika.
Kita vertus, puristinė linija, kad AI yra „apgaulė“, praleidžia ilgesnę istoriją. Fotografija buvo apgaulė. Skaitmeninis dažymas buvo apgaulė. Atšaukimas buvo apgaulė. Tikras apgaulės kodas yra iteracija minties greičiu. Jei esate pasirengęs mąstyti.
Apie įrankius, be ažiotažo
- {Midjourney} nuotaikai ir stiliui. Įspūdingas kinematografinis apšvietimas. Vis dar keistai neaiškus mygtukais ir ratukais. Priimkite jo temperamentą ir jis jums atsilygins.
- {DALL·E 3} tiesioginiam nurodymų vykdymui ir kompoziciniam proto blaivumui. Puikus, kai klientai rašo raginimus kaip susitikimo užrašus.
- {Stable Diffusion} skoniai ({SDXL}, {SD3.x}) kontrolės maniakams ir meistrams. Jei jums patinka modelių versijos, {LoRA} ir vietinės platformos, tai yra jūsų žaidimų aikštelė.
- {Firefly} komandoms, kurioms kompensavimas rūpi tiek pat, kiek .
Jei jūsų darbas yra kurti vaizdus, už kuriuos žmonės mokės, teisingas atsakymas paprastai yra „naudokite daugiau nei vieną“. Stilius iš vieno, tipografija ir maketas kitur, valymas ten, kur esate greičiausias. Įrankių monogamija yra nuotaika, o ne darbo eiga.
Įrankiai, kurie padeda jums mąstyti, o ne tik generuoti, yra nepakankamai įvertinti. Jei žongliruojate tyrimais, nuorodomis, vaizdine iteracija ir raginimais, turėti asistentą, kuris organizuoja jūsų smegenis, yra naudingiau nei dar viena „žiūrėkite, superraiška vėl“ funkcija. Generatoriai yra garsūs. Darbo eiga yra tyli. Tyla laimi dažniau nei triukšmas.
Geriausia praktika, kuri sutaupo valandas
- Sukurkite raginimų biblioteką. Ne 500 raginimų; 15 gerų su pastabomis, kada jie veikia.
- Laikykite sėklų banką. Elkitės su sėklomis kaip su koordinatėmis; pažymėkite savo žemėlapius.
- Aiškiai pavadinkite savo išvestis. Ateities jūs yra bendradarbis. Nebūkite nemandagus.
- Visada eksportuokite švarų pagrindą prieš pradėdami sunkų redagavimą. Norėsite grįžti atgal.
- Kartokite šakose. Kai idėja suskaido, nukopijuokite failą ir eikite abiem kryptimis.
Ateitis: mažiau mygtukų, daugiau sprendimų
Tobulėjant modeliams, geriausi jausis paprastesni – ne todėl, kad jie prarado galimybes, bet todėl, kad jie geriau gerbia ketinimus. Sąsaja, kuri laimi, nėra kabina, pilna jungiklių. Tai – rami drobė su sauja prasmingų pasirinkimų ir stiprių numatytųjų nustatymų. Visa kita yra skonis. O skonis nesiplečia. Tai – esmė.
Atsisveikinimo priekaištas (ar du)
Jei džiaugiatės AI vaizdais, nes manote, kad jie pašalins žmones iš proceso, pasiruoškite nusivilti ir tada palengvėti. Technologija vis gerėja. Rezultatai vis labiau priklauso nuo žmonių, kurie žino, ką daro. Tai nėra prieštaravimas. Tai – modelis.
Jei, atvirkščiai, manote, kad AI vaizdų generatoriai yra tik išgalvotas iliustracijų rinkinys, stebėkite toliau. Atotrūkis tarp „žaislo“ ir „įrankio“ tyliai užsidarė, kol visi ginčijosi internete. Modeliai nereikalauja, kad juos garbintumėte. Jiems tiesiog reikia, kad juos naudotumėte su ketinimu. Visa kita yra praktika.
Ir tas nejaukus slėnis? Jis mažėja. Lėtai, erzinančiai, neišvengiamai. Bet net kai jo nebeliks, tikrasis darbas bus toks pat, koks visada buvo: nuspręskite, ką norite pasakyti, tada priverskite kiekvieną pikselį tai pasakyti.
DUK
K1: Kuo AI vaizdų generatoriai iš tikrųjų geriausi šiuo metu?
Konceptavimas ir iteracija. AI vaizdų generatoriai sutriuškina tuščią puslapį, tyrinėja stilius ir greitai sukuria tinkamas naudoti kompozicijas – ypač kai tipografiją ir galutinį poliravimą paliekate žmonių rankose.
K2: Ar AI vaizdų generatoriai pakankamai geri komerciniam darbui?
Taip, jei jums rūpi procesas ir licencijavimas. Naudokite AI vaizdų generatorius tyrinėjimui ir pagrindiniams atvaizdavimams, tada užbaikite tinkamu šriftu, retušavimu ir įrankių grandine, kuri neprivers teisininkų trūkčioti.
K3: Kurį AI vaizdų generatorių turėčiau pasirinkti norėdamas gauti realistiškų rezultatų?
Pasirinkite įrankį, kuris atitinka jūsų skonį: {Midjourney} kinematografinei nuotaikai, {DALL·E 3} ištikimam nurodymų vykdymui ir {Stable Diffusion} variantus, jei norite detalios kontrolės. AI vaizdų generatoriai nėra keičiami; jie turi skirtingus išankstinius nustatymus.
K4: Kodėl tekstas vis dar atrodo keistai AI generuotuose vaizduose?
Kadangi tipografija neatleidžia, o modeliai vis dar traktuoja raides kaip tekstūruotas formas. AI vaizdų generatoriai tobulėja, bet antraštėms ir prekės ženklo šriftui vis dar laimi tikri šriftai tikruose maketavimo įrankiuose.
K5: Kaip parašyti geresnius raginimus AI vaizdų generatoriams?
Parašykite aprašymą, o ne kerus. Būkite konkretūs dėl subjekto, apšvietimo, kompozicijos ir apribojimų; užrakinkite sėklas, kai kryptis veikia; ir kartokite su mažais, apgalvotais pakeitimais, užuot kaupdami būdvardžius.