Esmė su AI muzika yra ta, kad visi apsimeta girdintys simfoniją.
Kol nepaprašai jų pavaizduoti melodiją.
Pasiekėme tą populiarumo ciklo dalį, kai „AI muzika“ yra demonstruojama kaip autonominiai automobiliai 2017 m.: visada įspūdinga demonstracijose, visada per kelias minutes nuo geriausio laiko ir visada tik vienas mokymo etapas nuo grupės pakeitimo. „OpenAI“ įsitraukė į kovą su „Music AI“, prisijungdama prie startuolių „Suno“ ir „Udio“ tame pačiame chore. Antraštė rašosi pati: mašininis mokymasis demokratizuos muzikos kūrimą. Paantraštė, kurios niekas nenori pripažinti: didžioji dalis vis dar skamba kaip puiki demonstracija – kol nenorite dainos, kurios norėtumėte klausytis du kartus.
Pakalbėkime apie tikrąjį klausimą: kaip „OpenAI Music AI“ lyginamas su „Suno“ ir „Udio“ – ne popieriuje, ne pranešimuose spaudai, o tuo, ką iš tikrųjų galite sukurti neprarasdami proto ar skonio.
Kas tai per straipsnis?
Tai palyginimas, o ne himnas. Norite žinoti, kuri sistema sukuria geresnes dainas, kuri teisingai supranta jūsų užklausą iš pirmo karto, su kuria jaučiatės taip, lyg ginčytumėtės su nebendradarbiaujančiu gitaristu. Tikslas čia yra praktinis: pasirinkite įrankį, kurkite muziką, negaiškite laiko.
Muzikos generavimas pirmiausia pagal užklausą: pažadas ir pagauti
AI muzikos idėja – nuo „OpenAI Music AI“ iki „Suno“ ir „Udio“ – yra gąsdinančiai paprasta: apibūdinkite dainą, gaukite dainą. „Linksmas indie pop su moterišku vokalu, plojimais ir įsimintinu priedainiu apie vasaros naktis.“ Jei niekada gyvenime nerašėte muzikos, tai skamba stebuklingai. Jei rašėte, tai skamba maždaug taip, lyg pasakytumėte virėjui „Itališka, aštri, daug pomidorų“ ir tikėtumėtės tobulo penne arrabbiata.
Tiesa yra kažkur tarp patogumo ir nejaukaus slėnio. Šios sistemos gali parašyti posmus, priedainius, tiltelius, harmonijas ir kabliukus. Jie gali atkurti „studijos kokybės“ garsą su visiškai sumaišytomis garso dalimis – arba bent jau garso dalių iliuziją. Ir jie tai daro greitai. Tačiau neišvengiama nejauki dalis: tekstai, kurie skamba gerai, kol neįsiklausote, melodijos, kurios niekur neveda, aranžuotės, kurios įtartinai glotnios ir įtartinai tuščios. Tai muzikinė akcijų fotografijos versija – graži, įtikinama ir artistiškai inertiška, nebent iš jos išspaudžiate kažką žmogiško.
„OpenAI Music AI“: raumenys, atmintis ir generinio blizgesio rizika
„OpenAI Music AI“ turi du privalumus: mastelį ir integraciją. Mastelis, nes „OpenAI“ linkęs kurti modelius su nepadoriu kiekiu duomenų ir skaičiavimų. Integracija, nes jie gali integruoti „Music AI“ į darbo eigą su ChatGPT, balso modeliais ir net vaizdo įrašais – viena užklausa eskizuoti tekstus, kita – formuoti vokalą, trečia – siužetinei linijai vizualizatorių. Tai svarbu.
Rezultatas dažnai turi tą „OpenAI“ blizgesį: poliruotas, nuoseklus, saugus. Būgnų rinkiniai smūgiuoja nuspėjamais būdais, vokaliniai modeliai švariai įsilieja į miksą, o masteringas turi tą vienodą garsumą. Kai norite „paruošto radijui“, tai atitinka reikalavimus.
Tačiau yra vienas kabliukas. Generatyvūs pasirinkimai jaučiasi labai reguliarūs – tarsi modelis teiktų pirmenybę varpo kreivės viduriui. Tai puiku, jei norite pop, EDM, lo-fi ritmų ar kinematografinės atmosferos. Mažiau puiku, jei norite keisto. Arba grūdėtumo. Arba dainų, kurios skamba taip, lyg būtų kilusios iš bet kur kitur, išskyrus grojaraštį, kurį visi jau naudoja.
„OpenAI Music AI“ taip pat, nestebina, labai gerai laikosi taisyklių. Dainų tekstai nenukryps į rizikingą teritoriją, modelis vengia nejaukių vokalinių frazių, kurios galėtų reikšti imitaciją, o stilistiniai raginimai interpretuojami kaip bendri įtakos veiksniai, o ne konkretūs atlikėjai. Etiškai teisinga. Meniškai, kartais nedrąsu.
„Suno“: vibracijos svarbiau nei veiksmažodžiai ir noras perimti vairą
„Suno“, vienas pirmųjų AI muzikos kūrėjų, geriau nei bet kas kitas pataiko į tą momentą „Negaliu patikėti, kad tai veikia“. Jūs įvedate „2000-ųjų pradžios pop-punk himną apie išvykimą iš miesto“, o „Suno“ atsako daina, kuri jaučiasi taip, lyg priklausytų tam paauglių filmo garso takeliui, kurio ne visiškai prisimenate, bet kažkaip pasiilgstate. Jis laisvas, linksmas ir nepretenzingas. Jų sistema turi talentą įsimintiniems priedainiams ir žanro cosplay – žaismingas tikslumas, gera prasme.
„Suno“ puikiai leidžia modeliui priimti sprendimus, kuriuos patys būtumėte per daug vertinę. Jis per anksti stumia priedainį, prieš tiltelį nusileidžia iki pusės tempo, įmeta gaujos vokalą, tarsi drąsindamas jus juoktis. Tai AI, kuris sako: „Leisk man gaminti“, ir kartais tikrai taip daro.
Kompromisas yra kontrolė. „Suno“ gali būti užsispyręs, kai prašote tikslių lyrinių frazių ar struktūrinio perrašymo. Variacijos ne visada atsižvelgia į ketinimus; modelis grįžta į savo komforto zonas. O miksas, nors ir energingas, gali būti šiek tiek karikatūriškas – daug putojimo, ne visada kepsnys.
„Udio“: struktūra, subtilumas ir inžinieriaus ausis
„Udio“ yra arčiau muzikanto mąstysenos. Pagalvokite apie tai kaip apie DAW tipo mąstymą be DAW. Ragina jaučiasi labiau kaip prodiuserių pastabos: „chillwave su analogiškai skambančiais padėklais, minimalūs mušamieji, vėlyvas pagrindinis vokalas, harmonijos, prisotintos uždelsimu.“ Rezultatai linkę į kantrybę ir struktūrą. Mažiau tikėtina, kad jis numes triuką, ir labiau tikėtina, kad sukurs takelį iš apgalvotos aranžuotės.
„Udio“ dažnai sukuria švariausius miksus ir nuosekliausią dainų tekstų ir melodijų atitikimą. Jei norite kažko, kas galėtų būti albumo įžanginis takelis – tas, kuris signalizuoja skonį ir santūrumą – „Udio“ yra jūsų draugas. Jis taip pat stebėtinai gerai modeliuoja instrumentus, kurie neskamba kaip įskiepių nustatymai. Gitaros skleidžia stygų triukšmą. Sintezatoriai kvėpuoja. Bosas jaučiasi taip, lyg grotuvas sėdėtų kišenėje.
Trūkumas? „Udio“ gali būti pernelyg skoningas. Jis nepakankamai svyruoja už tvorų. Jei bandote sukurti stadiono himną, turėsite vesti jį už rankos pro apsauginius turėklus.
Greitos problemos: šiukšlės į vidų, įtikinama išorė
Raginti AI muziką yra atskiras menas – pusiau scenarijus, pusiau studijos užrašas. Toliau eisite su aiškiu ketinimu nei su daugiažodžiais norų sąrašais. Klaida, kurią daro dauguma žmonių, yra apsimetinėjimas, kad tikslumas yra lygus kontrolei. Taip nėra. Tai prilygsta apribojimui. O apribojimas gali atsisukti prieš jus, kai modelis nusprendžia, kad jūsų „tikslus“ prašymas prieštarauja jo pirmenybėms.
- Geras raginimas: „Niūrus synthwave baladė, lėtas kūrimas, dūminis moteriškas vokalas, priedainis nusileidžia ties 1:20, dainų tekstai apie traukinio praleidimą.“
- Blogas raginimas: „Ambient-synthwave-triphop hibridas su evoliucingais daugiaskiemeniais vidiniais rimais ir aistringu, bet tvirtu femme fatale pasakotoju, perteikiančiu kinematografinius vaizdus apie ilgesį, tokiu stiliumi...“ (Supratote.)
„OpenAI Music AI“ geriausiai susidoroja su raginimų aiškumu – nuspėjama struktūra, protingi perėjimai. „Suno“ valdo žanro pasitikėjimą – paprašykite pop-punk ir pajusite tai savo batuose. „Udio“ valdo aranžavimo intelektą – evoliucija laikui bėgant, o ne garso plytos, sukrautos skubotai.
Dainų tekstai: nejaukus slėnis su priedainiu
Dainų tekstai yra ten, kur visos trys sistemos parodo savo siūles. Jie gali rimuotis. Jie gali nuskaityti. Jie gali pasakyti beveik nieko ir skambėti taip, lyg turėtų omenyje.
„OpenAI Music AI“ linkęs į švarias, saugias, idiomatines eilutes. Jokių keistų metaforų, jokių keistų posūkių. „Suno“ mielai įmes stebinantį vaizdą, o kitame posme jį sumenkins kliše. „Udio“ siekia nuoseklumo – mažiau svyruojantis, nuoseklesnis pasakojimas.
Jei norite tikrai gerų dainų tekstų, vis tiek juos rašysite arba redaguosite patys. Esmė yra vertinti modelį kaip bendradarbį, kuris gerai skaičiuoja skiemenis ir pakenčiamai rimo, bet blogai konkrečiai. Pateikite jam pagrindines frazes – dvi eilutes, kurios jums rūpi – ir leiskite jam užpildyti spragas. Tada apkarpykite.
Vokalas: sielos iliuzija ir frazavimo realybė
Vokalas AI muzikoje yra techninis ir etinis minų laukas. Trumpa versija:
- „OpenAI Music AI“ siūlo labiausiai „studijoje poliruotus“ vokalinius tembrus. Jie natūraliai sėdi, išlieka ant tono ir retai užkliūva už ritmo. Jie jaučiasi saugūs ir kartais blankūs.
- „Suno“ vokalas yra išraiškingas, kartais per daug išraiškingas – kaip dainininkas, kuris nenustos emocinguoti. Linksma, bet kartais keista.
- „Udio“ siekia realizmo kvėpavime ir priebalsiuose. Mažiausiai tikėtina, kad skambės kaip virtualus choro įskiepis.
Nė vienas iš jų nuosekliai neįveikia mikrofrazavimo – žmogiško triuko, kai dainininkas remiasi priebalsiu posme ir sušvelnina jį priedainyje. Bet jie artėja.
Teisinis, etinis ir „stiliaus“ dramblys
Raginti „stiliaus“ yra neišsakoma paslaptis po kiekviena AI muzikos demonstracija. Visi žino, ką jie turi omenyje sakydami „vintažinė Beatles atmosfera“ arba „Taylor Swift stiliaus pop“. Sistemos vaidina droviai. „OpenAI“, nestebina, vaidina droviausiai – nukreipdama link bendrų įtakos veiksnių ir tolyn nuo bet ko pernelyg konkretaus. „Suno“ ir „Udio“ yra laisvesni, nors abu turi apsaugos priemones.
Etiškai, vengti mėgdžiojimo yra teisinga. Praktiškai tai sunku. Vartotojai nenori „pop baladės minore“. Jie nori „tos vienos dainos, kurios negali pavadinti, bet žino iš atminties“. Pramonės sprendimas greičiausiai bus licencijavimo modeliai, apmokyti naudojant pasirinktus katalogus. Iki tol visi apsimetame, kad neaiškių žanrų etikečių pakanka.
Greitis, patikimumas ir nuobodūs dalykai, kurie jums rūpi iki termino
- „OpenAI Music AI“: greitas, nuoseklus, retai sugenda. Puikiai tinka komandoms ir nuspėjamoms darbo eigoms. Jei norite trijų variantų per penkias minutes, juos gausite.
- „Suno“: pakankamai greitas, šiek tiek daugiau skirtumų latentiniame periode. Kai veikia, tai tikrai veikia. Kai praleidžia, atnaujinate.
- „Udio“: stabilesnis nei „Suno“, praktiškai šiek tiek lėtesnis nei „OpenAI“. Verta, kai rūpi aranžuotė.
Eksporto parinktys artėja – didelio bitų spartos garsas, kartais garso dalys, kartais MIDI. Nesitikėkite tobulų garso dalių; tai nėra DAW. Tikėkitės „pakankamai gerų redaguoti“ failų.
Kontrolė prieš staigmeną: pasirinkite savo nuodą
Apibrėžiantis skirtumas:
- „OpenAI Music AI“ suteikia jums kontrolę. Tai prodiuserio įrankis.
- „Suno“ suteikia jums staigmeną. Tai dainų autoriaus žaislų dėžė.
- „Udio“ suteikia jums struktūrą. Tai skirta klausytojams, turintiems skonį, ir muzikantams, turintiems kantrybės.
Jei norite pristatyti dainelę, eikite į „OpenAI“. Jei norite parašyti kažką, kas priverčia jus šypsotis, išbandykite „Suno“. Jei norite takelio, kuris skamba taip, lyg kažkas jį iš tikrųjų suderino, eikite į „Udio“.
Darbo eigos realybė: raginimai, redagavimai, iteracijos
Laimėjęs modelis yra nuobodus, bet efektyvus:
- Juodraštis su pasirinktu modeliu, atsižvelgiant į tikslą: „OpenAI“ skirtas poliravimui, „Suno“ skirtas kabliukui, „Udio“ skirtas aranžuotei.
- Redaguokite dainų tekstus rankomis. Visada. Jei tai skamba kaip darbas, tai todėl, kad taip ir yra.
- Atnaujinkite vokalą su griežtesnėmis frazavimo pastabomis: lėtesnis ataka, mažiau vibrato, aiškesni priebalsiai priedainyje.
- Eksportuokite, tada sumaišykite tikroje DAW – EQ, magistralės suspaudimas, šiek tiek prisotinimo. Nepasikliaukite AI „masteringu“ anapus greitos demonstracijos.
- Jei ketinate išleisti, paleiskite jį žmonių ausimis, kuriomis pasitikite. AI negirdi skonio.
Kur Sider.AI iš tikrųjų tinka (ir kur netinka)
Sider.AI yra ten, kur jūs mąstote. Jei kartojate raginimus, kuriate dainų tekstų juodraščius arba sujungiate nuorodas, Sider.AI yra daug naudingesnis nei „užrašų programa plius kopijavimas-įklijavimas“ nelaimė, į kurią visi nusiritome. Galite sukrauti raginimų variantus, užfiksuoti, kas veikė, ir atlikti redagavimus neprarandant gijos – kaip versijų valdymas idėjoms, o ne kodui. Jei bandote tiksliai sureguliuoti daugiapakopį kūrybinį procesą – dainų tekstus, struktūrą, vokalo kryptį – Sider.AI padeda jums išlaikyti jį tvarkingą ir iš tikrųjų atkuriamą. Tai nėra sintezatorius ir nėra DAW, bet tai tvirtas smegenys netvarkingam viduriui, kuriame miršta dauguma projektų. Nejauki tiesa apie „originalumą“
Ar šios dainos yra „originalios“? Teisiškai, tikriausiai pakankamai. Meniškai, kartais. Geriausi rezultatai jaučiasi kaip gerai sukurti žanro kūriniai. Blogiausi jaučiasi kaip nuorodos demonstracijos, kurios pamiršo nurodyti ką nors įdomaus.
Tai, kas čia laikoma originalumu, nėra naujumas, tai konkretumas. Ne „indie rock“. „Indie rock su vėlyvojo 90-ojo dešimtmečio Čikagos atmosfera, subraižytu kambario mikrofonu ant būgnų, boso skaidrės į priedainį, viena eilutė, kuri tyčia nerimuoja.“ Modeliai gerbia konkretumą, kai jis yra konkretus, ir baudžia jį, kai jis yra literatūrinis.
Transliacijos testas: ar pridėtumėte jį į grojaraštį?
Tai yra testas. Neklauskite, ar modelis padarė tai, ko prašėte. Klauskite, ar takelis priklauso jūsų grojaraštyje tarp muzikos, kuri jums iš tikrųjų patinka. Jei atsakymas yra ne, atnaujinkite. Jei atsakymas yra galbūt, eksportuokite ir pataisykite miksą. Jei atsakymas yra taip, sveikiname – įveikėte nejaukų slėnį trims minutėms.
„OpenAI Music AI“ nuosekliausiai jus nuves į „galbūt“. „Suno“ kartais jus nuves į „taip“ – ir jūs tai iškart žinosite. „Udio“ atveda jus į „taip“ takeliams, su kuriais norite gyventi, o ne tiems, kuriais norite pasipuikuoti.
Žanro pastabos: kas kur laimi
- Pop ir EDM: „OpenAI Music AI“. Švarūs kritimai, suprantami pagrindiniai dalykai, radijo blizgesys.
- Pop-punk, synth-pop, karaoke paruošti priedainiai: „Suno“. Kabliukų fabrikas.
- Ambient, downtempo, kinematografinis, indie: „Udio“. Kantrybė, tekstūra, aranžuotė.
- Hip-hop: dvikova; nė vienas iš jų nuosekliai nepataiko į srauto autentiškumą, nenukrypdamas į pastišą. „OpenAI“ yra saugiausias; „Suno“ kartais nustebina.
- Džiazas: dar ne. Galite suklastoti, bet išgirsite klastojimą.
Praktinės ribos: garso dalys, tempo žemėlapiai ir „visiško valdymo“ mitas
Žmonės prašo garso dalių, kaip prašo išeities kodo. Protinga, bet negausite visko, ko norite. Ten, kur yra garso dalys, jos dažnai yra pohoc atskyrimai. Pakankamai geros pagrindiniams mikso judesiams, nepakankamai geros dainai atkurti nuo nulio. Tempo žemėlapiai yra apytiksliai. Rakto ženklai yra teisingi, kol nėra. Neplanuokite produkcijos, pagrįstos AI sukurto takelio pavertimu atgal į žmogaus sesiją, nebent jūsų tolerancija skausmui yra didelė.
Palyginimas vienu įkvėpimu
- „OpenAI Music AI“: poliruotas, saugus, integruotas. Puikiai tinka nuspėjamam pristatymui.
- „Suno“: drąsus, įsimintinas, kartais chaotiškas. Puikiai tinka kabliukams ir linksmybėms.
- „Udio“: skoningas, struktūrizuotas, realistiškas. Puikiai tinka pakartotiniam klausymui.
Pasirinkite pagal ketinimą, o ne pagal hype.
Dažnos klaidos ir kaip jų nepadaryti
- Per daug raginimų: daugiau žodžių nereiškia geresnių rezultatų. Naudokite penkis gerus būdvardžius, o ne penkiolika.
- Formos ignoravimas: būkite aiškūs dėl struktūros – įžanga, posmas, prieš priedainį, priedainis. Modeliai mėgsta planus.
- Paliekant dainų tekstus visiškai modeliui: nedarykite to. Pateikite jam dvi pagrindines eilutes viename skyriuje.
- Sutinkant su pirmaisiais dubliais: atnaujinkite. Dar vienas bandymas dažnai apverčia jungiklį.
- Tikėtis, kad garso dalys viską pataisys: jie to nepadarys. Sumaišykite eksportą kaip stereo takelį.
Kur tai keliauja toliau
Licencijavimas bus svarbus. Atlikėjų pasirinkimai sukurs modelio „bibliotekas“. Kai kurios dainos bus pristatomos su „AI sukurtais“ kreditais, kaip albumuose anksčiau buvo nurodoma „būgnų programavimas“ įdėklų pastabose. Mes ginčysimės, ar tai sąžininga, ar neskoninga. Įrankiai taps geresni. Skonis išliks žmogiškas.
Ir čia yra paslaptis, kurios pramonė vengia: žmonės nenori begalinės muzikos. Jie nori muzikos, kuri ką nors reiškia. Jei AI gali padėti daugiau žmonių sukurti dainas, kurios jiems svarbios – net jei jos svarbios tik penkiems draugams – tai yra pergalė. Jei jis užtvindo zoną blizgiais, pamirštamais takeliais, tam yra praleidimo mygtukas.
Punktas
„OpenAI Music AI“, „Suno“ ir „Udio“ visi kuria muziką pagal poreikį. Tik vienas iš jų sukurs jūsų dainą. Esmė yra žinoti, kuris iš jų atitinka jūsų ketinimus ir jūsų skonį – ir tada atlikti nuobodų darbą, kad pastumtumėte jį per liniją.
Jei siekiate poliruoto, naudokite „OpenAI Music AI“. Jei ieškote kabliuko, naudokite „Suno“. Jei jums rūpi aranžuotė ir pakartotinis klausymas, naudokite „Udio“. Tada atlikite žmogiškas dalis: redaguokite dainų tekstus, pakoreguokite frazes, pataisykite miksą ir nuspręskite, ar iš tikrųjų pridėtumėte jį į grojaraštį.
Dauguma demonstracijų skamba kaip magija. Tikroji magija yra noras išgirsti tai dar kartą.
Kaip „OpenAI Music AI“ praktiškai lyginamas su „Suno“ ir „Udio“
- Dėl „radijui paruošto“ poliravimo ir nuoseklaus pristatymo: „OpenAI Music AI“.
- Dėl greito įkvėpimo ir įsimintinų priedainių: „Suno“.
- Dėl apgalvotos struktūros ir realistiško instrumento jausmo: „Udio“.
- Dėl raginimų, iteracijų ir lyrinių juodraščių tvarkymo neprarandant proto: Sider.AI.
Nė vienas iš šių įrankių nėra grupė. Visi jie gali būti jūsų proceso dalis.
Galutinė pastaba (nes kažkas paklaus)
Ne, AI nenužudė muzikos. Jis tiesiog suteikė jums daugiau pasiteisinimų ją kurti.
DUK
K1: Ar „OpenAI Music AI“ geresnis už „Suno“ ir „Udio“ kuriant pop dainas?
Jei norite švarios, transliacijoms tinkamos pop muzikos, „OpenAI Music AI“ paprastai laimi: nuosekli struktūra, puikūs vokalai ir saugūs miksai. „Suno“ gali jį nugalėti vienu kabliuku, o „Udio“ gali skambėti skoningiau, bet „OpenAI“ dažniau užtikrina pop patikimumą.
K2: Kuri AI muzikos priemonė geriausiai tinka įsimintinoms priedainių eilutėms ir greitam idėjų generavimui?
„Suno“ yra kabliukų mašina – puikiai tinka žanro kosplejui ir įsimintiniems priedainiams su minimaliais raginimais. Jei norite priedainio, kurį galėtumėte niūniuoti per penkias minutes, pradėkite nuo jo, o tada, jei reikia, patikslinkite naudodami „OpenAI“ arba „Udio“.
K3: Ar „Udio“ sukuria realistiškesnius, „į grupę panašius“ kūrinius?
„Udio“ orientuojasi į aranžuotę ir instrumentų pojūtį, todėl taip, jis dažnai skamba labiau kaip grupė nei kaip demo versija. Jis nėra toks įspūdingas kaip „Suno“ ir ne toks blizgus kaip „OpenAI Music AI“, bet labiau tikėtina, kad išlaikys pakartotinius perklausymus.
K4: Ar šios AI muzikos priemonės gali sukurti paruoštas išleidimui dainas be DAW (skaitmeninės garso darbo stoties)?
Galite gauti pakenčiamus masterius, bet vertinkite juos kaip demo versijas. Eksportuokite kūrinį, tada sumiksuokite ir nupoliruokite tinkamoje DAW – EQ, kompresija ir vokalo patobulinimai padarys daugiau galutiniam rezultatui nei dar vienas raginimas.
K5: Kokią vietą Sider.AI užima AI muzikos darbo eigoje?
Sider.AI yra organizatorius: raginimai, dainų tekstų juodraščiai, iteravimo pastabos ir palyginimai – visa tai neprarandant temos. Jis nesumiksuos jūsų kūrinio, bet išlaikys jūsų kūrybinį procesą sveiką, kol stumsite „OpenAI“, „Suno“ ar „Udio“ link kažko, ką iš tikrųjų norite išgirsti.