Pri glasbi, ustvarjeni z umetno inteligenco, se vsi pretvarjajo, da slišijo simfonijo.
Dokler jih ne prosite, da si zaznavajo melodijo.
Prišli smo do tiste faze cikla navdušenja, ko »AI glasbo« ponujajo kot avtonomne avtomobile leta 2017: vedno impresivna v predstavitvah, vedno le nekaj minut oddaljena od udarnega termina in vedno le še eno usposabljanje stran od nadomestitve banda. OpenAI je vrgel rokavico v ring z Music AI in se pridružil startup podjetjema Suno in Udio v istem zboru. Naslov se napiše sam: strojno učenje bo demokratiziralo ustvarjanje glasbe. Podnaslov, ki ga nihče ne želi priznati: večina tega še vedno zveni kot odlična predstavitev – dokler ne želite pesmi, ki bi jo izbrali, da bi jo poslušali dvakrat.
Pogovorimo se o resničnem vprašanju: kako se OpenAI Music AI primerja s Suno in Udiom – ne na papirju, ne v sporočilih za javnost, ampak glede na to, kaj dejansko lahko ustvarite, ne da bi izgubili razum ali okus.
Kakšen članek je to?
To je primerjava, ne hvalnica. Želite vedeti, kateri sistem ustvari boljše pesmi, kateri pravilno razume vaš poziv že prvič, s katerim se vam zdi manj, kot da bi se prepirali z nesodelujočim kitaristom. Namen tukaj je praktičen: izberite orodje, ustvarite glasbo, ne zapravljajte časa.
Glasbeno ustvarjanje najprej s pozivom: obljuba in ulov
Ponudba za AI glasbo – od OpenAI Music AI do Suno in Udio – je osupljivo preprosta: opišite pesem, dobite pesem. »Živahen indie pop z ženskimi vokali, ploskanjem in privlačnim refrenom o poletnih nočeh.« Če v življenju še niste pisali glasbe, se to sliši čudežno. Če ste jo, se to sliši kot približno enakovredno temu, da bi kuharju rekli »italijansko, pikantno, veliko paradižnika« in pričakovali popolno penne arrabbiato.
Resnica pristane nekje med priročnostjo in srhljivo dolino. Ti sistemi lahko napišejo kitice, refrene, mostove, harmonije in napeve. Lahko upodobijo zvok »studijske kakovosti« s popolnoma zmešanimi elementi – ali vsaj iluzijo elementov. In to naredijo hitro. Toda srhljivi del se bliža: besedila, ki zvenijo pravilno, dokler ne poslušate, melodije, ki ne vodijo nikamor, aranžmaji, ki so sumljivo uglajeni in sumljivo prazni. To je glasbena različica fotografij iz fotobanke – lepa, verjetna in umetniško inertna, razen če iz nje iztisnete nekaj človeškega.
OpenAI Music AI: mišice, spomin in tveganje generičnega sijaja
OpenAI-jev Music AI ima dve prednosti: obseg in integracijo. Obseg, ker ima OpenAI ponavadi modele z ogromno količino podatkov in računalniške moči. Integracija, ker lahko vključi Music AI v potek dela s ChatGPT, glasovnimi modeli in celo videoposnetki – en poziv za skiciranje besedil, drugi za oblikovanje vokalov, tretji za snovanje vizualizatorja. To je pomembno.
Izhod ima pogosto tisti sijaj OpenAI: poliran, dosleden, varen. Kompleti bobnov udarjajo na predvidljive načine, vokalni modeli čisto sedijo v mešanici in mastering ima tisto glasnost, ki ustreza vsem za pretakanje. Ko želite »pripravljeno za radio«, označi polje.
Obstaja pa ulov. Generativne izbire se zdijo močno regularizirane – kot da ima model raje sredino Gaussove krivulje. To je super, če želite pop, EDM, lo-fi beate ali kinematografsko vzdušje. Manj super, če želite nenavadno. Ali drznost. Ali pesmi, ki zvenijo, kot da prihajajo od koder koli razen s seznama predvajanja, ki ga že uporablja vsak.
OpenAI Music AI je tudi, ne presenetljivo, zelo dober pri skladnosti. Besedila ne bodo zašla na tvegana področja, model se izogiba nenavadnim vokalnim frazam, ki bi lahko nakazovale posnemanje, in stilski pozivi se razlagajo kot splošni vplivi in ne kot določeni izvajalci. Etično pravilno. Umetniško včasih plašno.
Suno: vzdušje nad glagoli in pripravljenost prevzeti vajeti
Suno, eden prvih gibalcev v AI glasbi, doseže trenutek »ne morem verjeti, da to deluje« bolje kot kdorkoli drug. Vtipkate »pop-punk himna zgodnjih 2000-ih o odhodu iz mesta« in Suno odgovori s pesmijo, za katero se zdi, da spada na tisto glasbeno podlago za najstniški film, ki se je ne spomnite povsem, a jo nekako pogrešate. Je sproščena, zabavna in neprizadeta. Njihov sistem ima smisel za privlačne refrene in žanrsko preobleko – igriva natančnost, v dobrem smislu.
Suno blesti pri tem, da modelu prepusti odločitve, ki bi jih bili sami preveč dragoceni, da bi jih sprejeli. Refren potisne za eno dobo prezgodaj, pade na polovični tempo pred mostom, vrže v tolpo vokale, kot da vas izziva, da se zasmejete. To je AI, ki reče: »Pusti me kuhati,« in včasih res kuha.
Kompromis je nadzor. Suno je lahko trmast, ko prosite za natančno besedno zvezo ali strukturno preoblikovanje. Različice ne spoštujejo vedno namena; model se pomakne nazaj proti svojim conam udobja. Mešanica pa je lahko, čeprav energična, nekoliko risankasta – veliko cvrčanja, ne vedno zrezka.
Udio: struktura, subtilnost in inženirsko uho
Udio se nahaja bližje miselnosti glasbenika. Predstavljajte si ga kot razmišljanje, podobno DAW, brez DAW. Pozivi se zdijo bolj kot producentske opombe: »chillwave s ploščicami, ki zvenijo analogno, minimalno tolkali, pozni vstopni glavni vokal, harmonije, prepojene z zamudo.« Rezultati se nagibajo k potrpežljivosti in strukturi. Manj verjetno bo spustil trik in bolj verjetno bo zgradil skladbo iz premišljene ureditve.
Udio pogosto ustvari najčistejše mešanice in najbolj skladno preslikavo besedila v melodijo. Če želite nekaj, kar bi lahko veljalo za uvodno skladbo na albumu – tisto, ki signalizira okus in zadržanost – je Udio vaš prijatelj. Prav tako je presenetljivo dober pri modeliranju instrumentov, ki ne zvenijo kot vtičniki. Kitare imajo šum strun. Sintetizatorji dihajo. Bas se zdi, kot da bi igralec sedel v žepu.
Slabost? Udio je lahko pretirano okusen. Ne zamahuje dovolj močno. Če poskušate narediti stadion anthem, ga boste držali za roko mimo varnostnih ograj.
Težava s pozivom: smeti noter, verjetno ven
Pozivanje za AI glasbo je svoja umetnost – pol scenarij, pol studijska opomba. Z jasnim namenom boste prišli dlje kot z obsežnimi seznami želja. Napaka, ki jo naredi večina ljudi, je, da se pretvarjajo, da je natančnost enaka nadzoru. Ni. Enaka je omejitvi. Omejitev pa se lahko obrne, ko se model odloči, da vaše »natančne« zahteve nasprotujejo njegovim prioritetam.
- Dober poziv: »Mračen synthwave balada, počasna gradnja, dimljen ženski vokal, refren pristane pri 1:20, besedilo o zamudi vlaka.«
- Slab poziv: »Hibrid ambient-synthwave-triphopa z evokativnimi večzložnimi notranjimi rimami in čutnim, a odločnim pripovedovalcem femme fatale, ki podaja kinematografske podobe o hrepenenju, v stilu …« (Razumete.)
OpenAI-jev Music AI najbolje obravnava jasnost pozivov – predvidljiva struktura, smiselni prehodi. Suno obravnava žanrsko bahatost – prosite za pop-punk in ga boste čutili v svojih čevljih. Udio obravnava inteligenco aranžmaja – evolucijo sčasoma, ne pa kocke zvoka, zložene na hitro.
Besedilo: srhljiva dolina z refrenom
Besedila so tista, kjer vsi trije sistemi kažejo svoje šive. Lahko se rimajo. Lahko skenirajo. Lahko rečejo skoraj nič in zvenijo, kot da to mislijo.
OpenAI Music AI se nagiba k čistim, varnim in idiomatičnim vrsticam. Brez čudnih metafor, brez nenavadnih zasukov besednih zvez. Suno bo z veseljem vrgel presenetljivo podobo, nato pa jo spodkopal s klišejem v naslednji kitici. Udio si prizadeva za skladnost – manj zamaha, bolj dosledno pripovedovanje zgodb.
Če želite resnično dobra besedila, jih boste še vedno napisali ali uredili sami. Trik je v tem, da model obravnavate kot sodelavca, ki je dober pri štetju zlogov in sprejemljiv pri rimi, slab pa pri specifičnosti. Dajte mu sidrne fraze – dve vrstici, ki vam sta pomembni – in mu dovolite, da zapolni vrzeli. Nato obrezujte.
Vokali: iluzija duše in resničnost fraziranja
Vokali v AI glasbi so tehnično in etično minsko polje. Kratka različica:
- OpenAI Music AI ponuja najbolj »studijsko polirane« vokalne barve. Sedijo naravno, ostanejo na višini in redko spotaknejo ob ritem. Počutijo se varno in včasih blago.
- Sunovi vokali so izrazni, včasih preveč izrazni – kot pevec, ki ne neha izražati čustev. Zabavno, a občasno čudno.
- Udio si prizadeva za realizem v dihu in soglasnikih. Najmanj verjetno bo zvenel kot vtičnik za virtualni zbor.
Nobeden od njih dosledno ne doseže mikrofrazeiranja – človeškega trika, kjer se pevec nasloni na soglasnik v kitici in ga zmehča v refrenu. Vendar se približujejo.
Pravno, etično in »stil« slona
Poziv »stil« je neizrekljiva skrivnost pod vsako predstavitvijo AI glasbe. Vsi vedo, kaj mislijo, ko rečejo »vintage Beatles vibe« ali »pop à la Taylor Swift«. Sistemi se igrajo sramežljivo. OpenAI, ne presenetljivo, se igra najbolj sramežljivo – usmerja se k splošnim vplivom in stran od vsega preveč specifičnega. Suno in Udio sta bolj sproščena, čeprav imata oba zaščitne ograje.
Etično je izogibanje posnemanju pravilno. Praktično je težko. Uporabniki ne želijo »pop balade v molu«. Želijo »tisto pesem, ki ji ne morete določiti imena, a jo poznate na pamet.« Industrijska rešitev bo verjetno licenciranje modelov, usposobljenih na katalogih z možnostjo prijave. Do takrat se vsi pretvarjamo, da so nejasne oznake žanrov dovolj.
Hitrost, zanesljivost in dolgočasne stvari, ki vas zanimajo na rok
- OpenAI Music AI: hiter, dosleden, redko se sesuje. Odličen za ekipe in predvidljive poteke dela. Če želite tri različice v petih minutah, jih boste dobili.
- Suno: dovolj hiter, nekoliko večja varianca v latenci. Ko deluje, res deluje. Ko zgreši, ponovno ustvarite.
- Udio: stabilnejši od Suna, v praksi nekoliko počasnejši od OpenAI. Vreden, ko vam je mar za aranžma.
Možnosti izvoza se zbližujejo – zvok visoke bitne hitrosti, včasih elementi, včasih MIDI. Ne pričakujte popolnih elementov; to niso DAW. Pričakujte datoteke, ki so »dovolj dobre za urejanje«.
Nadzor proti presenečenju: izberite svoj strup
Odločilna razlika:
- OpenAI Music AI vam daje nadzor. To je orodje za producenta.
- Suno vam daje presenečenje. To je glasbena škatla za pisatelje pesmi.
- Udio vam daje strukturo. Namenjen je poslušalcem z okusom in glasbenikom s potrpežljivostjo.
Če želite poslati jingle, izberite OpenAI. Če želite napisati nekaj, kar vas nasmeji, poskusite Suno. Če želite skladbo, za katero se zdi, da jo je nekdo dejansko uredil, izberite Udio.
Resničnost poteka dela: pozivi, urejanja, ponovitve
Zmagovalni vzorec je dolgočasen, a učinkovit:
- Osnovni osnutek z vašim najljubšim modelom glede na cilj: OpenAI za poliranje, Suno za napev, Udio za aranžma.
- Uredite besedila ročno. Vedno. Če se to sliši kot delo, je to zato, ker je.
- Ponovno ustvarite vokale z ožjimi opombami o fraziranju: počasnejši napad, manj vibrata, jasnejši soglasniki v refrenu.
- Izvozite, nato pa mešajte v pravem DAW – EQ, kompresija vodila, dotik nasičenosti. Ne zaupajte AI-jevemu »masteringu« dlje od hitre predstavitve.
- Če nameravate izdati, jo preverite pri človeških ušesih, ki jim zaupate. AI ne more slišati okusa.
Kje se Sider.AI dejansko prilega (in kje ne)
Sider.AI se nahaja tam, kjer razmišljate. Če ponavljate pozive, ustvarjate osnutke besedil ali združujete reference, je Sider.AI veliko bolj uporaben kot katastrofa »aplikacija za zapiske plus kopiraj-prilepi«, v katero smo se vsi sprevrgli. Lahko zložite različice pozivov, zajamete, kaj je delovalo, in izvajate urejanja, ne da bi izgubili nit – kot nadzor različic za ideje namesto kode. Če poskušate natančno nastaviti ustvarjalni proces v več korakih – besedila, struktura, vokalna usmeritev – vam Sider.AI pomaga, da ga ohranite organiziranega in dejansko ponovljivega. Ni sintetizator in ni DAW, ampak je trdna glava za neurejeno sredino, kjer večina projektov umre. Neprijetna resnica o »izvirnosti«
Ali so te pesmi »izvirne«? Pravno verjetno dovolj. Umetniško včasih. Najboljši rezultati se zdijo kot dobro producirani žanrski kosi. Najslabši se zdijo kot referenčne predstavitve, ki so pozabile omeniti karkoli zanimivega.
Kar velja za izvirnost tukaj, ni novost, ampak specifičnost. Ne »indie rock«. »Indie rock z občutkom Chicaga poznih 90-ih, praskav mikrofon v sobi na bobnih, bas preide v refren, ena vrstica, ki se namenoma ne rima.« Modeli spoštujejo specifičnost, ko je konkretna, in jo kaznujejo, ko je literarna.
Preizkus pretakanja: ali bi jo dodali na seznam predvajanja?
To je preizkus. Ne sprašujte, ali je model naredil, kar ste zahtevali. Vprašajte, ali skladba spada na vaš seznam predvajanja med glasbo, ki vam je dejansko všeč. Če je odgovor ne, ponovno ustvarite. Če je odgovor morda, izvozite in popravite mešanico. Če je odgovor da, čestitke – premagali ste srhljivo dolino za tri minute.
OpenAI Music AI vas bo najbolj dosledno pripeljal do »morda«. Suno vas bo občasno pripeljal do »da« – in to boste takoj vedeli. Udio vas pripelje do »da« za skladbe, s katerimi želite živeti, ne pa tiste, s katerimi se želite razkazovati.
Opombe o žanru: kdo zmaga kje
- Pop in EDM: OpenAI Music AI. Čisti padci, razumljive zgornje linije, radijski sijaj.
- Pop-punk, synth-pop, refreni, pripravljeni za karaoke: Suno. Tovarna napevov.
- Ambient, downtempo, kinematografsko, indie: Udio. Potrpežljivost, tekstura, aranžma.
- Hip-hop: met kovanca; noben od njih dosledno ne doseže pristnosti toka, ne da bi zašel v pastištvo. OpenAI je najvarnejši; Suno občasno preseneti.
- Jazz: še ne. Lahko ga ponaredite, vendar boste slišali ponarejanje.
Praktične omejitve: elementi, zemljevidi tempa in mit o »popolnem nadzoru«
Ljudje prosijo za elemente, kot prosijo za izvorno kodo. Smiselno, vendar ne boste dobili vsega, kar želite. Kjer elementi obstajajo, so pogosto ločitve po dejstvu. Dovolj dobro za osnovne poteze mešanja, ne dovolj dobro, da bi pesem obnovili iz nič. Zemljevidi tempa so grobi. Ključne podpise so pravilne, dokler niso. Ne načrtujte produkcije okoli obratnega inženiringa skladbe, ustvarjene z umetno inteligenco, v človeško sejo, razen če je vaša toleranca za bolečino visoka.
Primerjava v enem dihu
- OpenAI Music AI: poliran, varen, integriran. Odličen za predvidljivo dostavo.
- Suno: drzen, privlačen, včasih kaotičen. Odličen za napeve in zabavo.
- Udio: okusen, strukturiran, realističen. Odličen za ponavljajoče se poslušanje.
Izberite na podlagi namena, ne navdušenja.
Pogoste napake in kako jih ne storiti
- Prekomerno pozivanje: več besed ne pomeni boljših rezultatov. Uporabite pet dobrih pridevnikov, ne petnajst.
- Ignoriranje oblike: bodite eksplicitni glede strukture – uvod, kitica, pred-refren, refren. Modeli obožujejo zemljevide poti.
- Prepustitev besedil v celoti modelu: ne. Dajte mu dve sidrni vrstici na odsek.
- Sprejemanje prvih posnetkov: ponovno ustvarite. Še en poskus pogosto preklopi stikalo.
- Pričakovanje, da bodo elementi vse popravili: ne bodo. Zmešajte izvoz kot stereo skladbo.
Kam gre to naprej
Licenciranje bo pomembno. Vključitve izvajalcev bodo ustvarile »knjižnice« modelov. Nekatere pesmi bodo poslane s kreditnimi točkami »proizvedeno z AI«, tako kot so albumi navajali »programiranje bobnov« v opombah na ovitku. Prepirali se bomo o tem, ali je to pošteno ali kičasto. Orodja se bodo izboljšala. Okus bo ostal človeški.
In tukaj je skrivnost, ki se ji industrija izogiba: ljudje ne želijo neskončne glasbe. Želijo glasbo, ki nekaj pomeni. Če lahko AI pomaga več ljudem ustvariti pesmi, ki so jim pomembne – tudi če so pomembne le petim prijateljem – je to zmaga. Če preplavi območje z bleščečimi, pozabljivimi skladbami, je za to gumb za preskok.
Punchline
OpenAI-jev Music AI, Suno in Udio vsi ustvarjajo glasbo na zahtevo. Samo eden od njih bo ustvaril vašo pesem. Trik je v tem, da veste, kateri se ujema z vašim namenom in vašim okusom – in nato opravite dolgočasno delo, da ga potisnete čez mejo.
Če ciljate na poliranost, uporabite OpenAI Music AI. Če lovite napev, uporabite Suno. Če vam je mar za aranžma in ponavljajoče se poslušanje, uporabite Udio. Nato naredite človeške dele: uredite besedila, prilagodite fraziranje, popravite mešanico in se odločite, ali bi jo dejansko dodali na seznam predvajanja.
Večina predstavitev zveni kot čarovnija. Prava čarovnija je, da jo želite slišati znova.
Kako se OpenAI Music AI praktično primerja s Suno in Udiom
- Za »radijsko pripravljeno« poliranost in dosledno dostavo: OpenAI Music AI.
- Za hitro navdih in privlačne refrene: Suno.
- Za premišljeno strukturo in realističen občutek instrumenta: Udio.
- Za organiziranje pozivov, ponovitev in osnutkov besedil, ne da bi izgubili razum: Sider.AI.
Nobeno od teh orodij ni band. Vsi so lahko del vašega procesa.
Končna opomba (ker bo nekdo vprašal)
Ne, AI ni ubil glasbe. Samo dal vam je več izgovorov, da jo ustvarite.
Pogosta vprašanja
V1: Je OpenAI Music AI boljši od Suno in Udio za pop skladbe?
Za čiste pop skladbe, primerne za pretočno predvajanje, OpenAI Music AI običajno zmaga: dosledna struktura, uglajeni vokali in varne mešanice. Suno ga lahko premaga pri posamezni kaveljcu, Udio pa se lahko sliši bolj okusno, vendar OpenAI pogosteje zagotavlja pop zanesljivost.
V2: Katero orodje za glasbo AI je najboljše za privlačne refrene in hitro ustvarjanje idej?
Suno je stroj za ustvarjanje kavljev – odličen pri posnemanju žanrov in ustvarjanju nepozabnih refrenov z minimalnimi navodili. Če želite refren, ki si ga boste prepevali v petih minutah, začnite tam, nato pa po potrebi izboljšajte z OpenAI ali Udiom.
V3: Ali Udio ustvarja bolj realistične skladbe, ki zvenijo kot 'band' (skupina)?
Udio se nagiba k aranžmaju in občutku instrumentov, zato ja, pogosto zveni bolj kot skupina kot demo. Je manj bleščeč kot Suno in manj sijoč kot OpenAI Music AI, vendar je bolj verjetno, da bo zdržal pri ponavljajočem poslušanju.
V4: Ali lahko ta orodja za glasbo AI ustvarijo skladbe, pripravljene za izdajo, brez DAW (digitalne avdio delovne postaje)?
Lahko dobite sprejemljive masterje, vendar jih obravnavajte kot demo posnetke. Izvozite skladbo, nato pa jo zmešajte in polirajte v pravi DAW – EQ, kompresija in popravki vokala bodo za končni rezultat naredili več kot še en poziv.
V5: Kje se Sider.AI prilega poteku dela z glasbo AI?
Sider.AI je organizator: pozivi, osnutki besedil, iterativne opombe in primerjave – vse to, ne da bi izgubili nit. Ne bo zmešal vaše skladbe, bo pa ohranjal vaš ustvarjalni proces zdrav, medtem ko boste OpenAI, Suno ali Udio potiskali proti nečemu, kar si dejansko želite poslušati.