Päev, mil mu sülearvuti proovis kirjutada hittlaulu
Mõned kuud tagasi tegin ma midagi, mida iga mõistlik täiskasvanu teeks, kui seisab silmitsi ähvardava tähtaja ja laitmatu köögiga: ma palusin oma arvutil kirjutada mulle meeldejääva heliriba. Mitte sellepärast, et ma olen laisk (olgu, natuke), vaid sellepärast, et muusika tehisintellekti tööriistad vannuvad, et suudavad meloodiaid välja sülitada kiiremini, kui sa jõuad öelda "autoritasuvaba".
Ja vau – milline tsirkus. Üks tööriist esitas veenva 90ndate jõuballaadi võlts-Billie Eilishilikus inglise keeles. Teine andis mulle rõõmsa džässkvarteti slaidiseansi jaoks pilvesalvestusest. Kolmas tootis midagi, mis kõlas kahtlaselt nagu mu lapse plokkflöödi etteaste pärast kolme Capri Suni.
Nii et kui sa oled kuulnud OpenAI ist ja ist – ja laienevast muusika tehisintellekti tööriistade loomaaiast – siis sa võid mõelda: millist sa tegelikult peaksid kasutama? Oma taskuhäälingusaate sissejuhatuse jaoks? Oma i tantsu jaoks? Oma filmi partituuri jaoks? Oma vaimse tervise jaoks?
Sorteerime selle välja lihtsas keeles ekskursiooniga muusika tehisintellekti maastikul, kus lubadus on suur, erinevused on olulised ja õige valik sõltub peaaegu täielikult sellest, mida sa üritad teha.
Mis on muusika tehisintellekti tööriistad tegelikult?
Mõtle muusika tehisintellektile nagu erinevatele kokkadele:
- Mõned on laulukirjutajad, kes proovivad komponeerida uusi lugusid konkreetse artisti või ajastu stiilis. Nad valmistavad laulu, sõnad ja instrumentatsiooni – nagu "cover band", mis kunagi ei maga.
- Mõned on instrumentaalkomponistid, kes genereerivad – sa tead, arvutitele mõeldud noodikirja –, mida saab taasesitada mis tahes pilliheliga, mille sa valid.
- Teised on seadjad ja remiksijad: anna neile meloodia või meeleolu ja nad täiendavad seda.
- Ja siis on olemas masterdamise ja abistavad tööriistad – poleerijad, mitte kokad –, kes võtavad sinu olemasoleva loo ja muudavad selle raadio- (või i-) valmis.
OpenAI ja asuvad kahes esimeses laagris. i eesmärk on genereerida täielik heli – sealhulgas vokaal – äratuntavate artistide ja žanrite stiilis. komponeerib instrumentaalseid teoseid na, mis on võimelised kombineerima veidralt meeldivaid paare (nagu kantri + Chopin), mida saad esitada mis tahes pillihelidega, mis sulle meeldivad.
Millist sa soovid, sõltub sinu missioonist.
Kiire spikker: vs.
- OpenAI : heliväljund (sünteetilise vokaaliga), artisti stiilis genereerimine, pikad töötlusajad, uurimis-/demo hõng, parem loominguliseks uurimiseks ja uute "sarnaste helide" jaoks, mitte tootmisvalmis järjepidevus.
- OpenAI : kompositsioon, kiirem kordamine, paindlik instrumentatsioon, suurepärane taustamuusika, partituuride ja vihjete jaoks; vajab sind (või -d) lõpliku heli kujundamiseks.
Kui sinu eesmärk on "Mul on vaja poleeritud, autoritasuvaba lugu lõunaks", siis sa võid soovida vaadata neist kahest kaugemale ja tänapäevaste tootmiskesksete tööriistade poole, mis rõhutavad kiirust, litsentsimise selgust ja kontrolli. Aga me jõuame sinna.
Kuidas valida õige muusika tehisintellekti tööriist (ilma oma nädalavahetust kaotamata)
Alusta lõpust. Vasta kolmele küsimusele:
- Kas sa vajad heli vokaaliga või ainult instrumentaalset?
- Kui sa soovid vokaali – sõnu, laulmist – võivad i stiilis generaatorid olla lõbusad inspiratsiooni saamiseks, kuid väljundid võivad olla udused, stiliseeritud ja juhuslikud. Tootmisvalmis vokaali jaoks vajad sa tõenäoliselt inimest või hübriidprotsessi (tehisintellekti sõnad + inimlaulja).
- Kui sa soovid instrumentaalseid taustu, sissejuhatusi ja vihjeid, on i stiilis või kaasaegsed heligeneraatorid kiiremad, puhtamad ja paremini kontrollitavad.
- Kui palju kontrolli sa vajad?
- Kui sa hoolid tempost, helistikust, struktuurist ja pilli valikutest, siis suundu -põhiste tööriistade (i žanri segavate sugulaste) või helitööriistade poole, millel on üksikasjalikud viiped ja sektsioonid. võimaldab sul noote muuta -s nagu , või .
- Kui sa soovid "üllata mind, tee see meeleolukaks", on heligeneraatorid kiired ja lõbusad – kuid vähem redigeeritavad.
- Milline on sinu litsentsimise olukord?
- i, taskuhäälingusaadete või kommertsprojektide jaoks veendu, et tööriist pakub selgeid, autoritasuvabu litsentse. "Uurimisdemod" võivad luua stiililisi väljundeid, mis eksivad ohtlikult lähedale autoriõigusega kaitstud sõrmejälgedele. Kui tööriist on ebamäärane, eelda, et sa pead konsulteerima juristiga või valima teenuse, mis selgelt sätestab kasutusõigused.
Hoia need vastused käepärast; need suunavad sind õigesse naabruskonda.
OpenAI : julge helieksperiment
on nagu paluda tehisintellektil unistada sulle bänd. Sa annad sellele žanri, ajastu, võib-olla teeseldud artisti mõju ja see keerutab välja täieliku heli, sealhulgas vokaali. Kõlab muljetavaldavalt – ja mõnikord ongi. Sa kuuled veenvaid harmoonilisi struktuure, tuttavaid rütmilisi allkirju ja "lauldud" silpe, mis flirdivad arusaadavate sõnadega.
Aga siin on peen kiri:
- See on aeglane. Kvaliteetse heli genereerimine ei ole kiirkohv. Oota pikki ootamisi ja palju varieeruvust.
- See on stilistiline, mitte täpne. Kui sa soovid "kõlab natuke nagu X", siis sa võid lõpetada "X-i kauge sugulasega, kes kolis Islandile ja hakkas tegelema ambientiga".
- Redigeerimine on raske. Sa ei saa väljundis noote kergesti ringi liigutada; see on helisupp. Sa töötad sektsioonide ja taastootmisega, mitte täpsete kirurgiliste muudatustega.
Parim: metsik ideede genereerimine, meeleolu tükid ja uurimuslikud "mis siis, kui sünteetiline laulja laulaks mu toote reklaami" eksperimendid. Ei ole ideaalne, kui sa vajad ennustatavaid, tihedalt kontrollitud vihjeid neljapäevaks.
OpenAI : -esmane komponeerimismasin
räägib kompositsiooni keelt: noodid, akordid, rütmid, struktuur – välja sülitatud na, mida saad -s ümber korraldada. Kujuta ette usinat õpilast, kes suudab kirjutada 60-sekundilise klaveripala "kinematograafilises mollhelistikus", mille sa saad hiljem virtuaalsete instrumentidega muuta keelpillideks, süntesaatoriteks või kazoo'deks.
Plussid:
- See on redigeeritav. Muuda helistikku, lükka meloodiat, vaheta pilli – on nokitsemissõbralik.
- Seda on kiire korrata. Sa saad kuulata mitmeid variatsioone ja seejärel poleerida parimat.
- See on taustakasutuseks ohutu. i stiilis väljundid on rohkem "üldine originaal" kui "see kõlab kindlasti nagu see konkreetne hitt", mis aitab litsentsimise ja originaalsusega.
Miinused:
- Vokaali pole. Kui sa vajad sõnu ja laulmist, vajad sa eraldi tööriistu (tekstist sõnadeks) ja inim- või tehisintellekti vokaalsünteesi töövooge.
- Mõnikord tavaline. Ilma hoolikate vihjete ja seadeta võid sa saada muusikat, mis kõlab... hästi. Beež kauss.
Parim: taustamuusika, korporatiivvideod, taskuhäälingusaadete taustad, slaidiseansi heliribad ja kõik, kus sa soovid kontrolli ja redigeeritavust ilma täieliku heli genereerimise segaduseta.
Muud muusika tehisintellekti tööriistad, mida tasub teada (ja kuhu need sobivad)
Maastik muutub kiiremini kui trummar, kes avastas espresso, kuid kategooriad jäävad samaks:
- Heligeneraatorid tugevate juhtnuppudega: need loovad valmis heliribasid tekstiviipadest, mõnikord vartega (eraldiseisvad trummi/bassi/meloodia ribad), et saaksid remiksida. Suurepärane, kui sa vajad midagi täna kasutatavat ja sa ei soovi .
- ja kompositsiooni assistendid: need ehitavad meloodiaid, akordiprogressioone ja seadeid, mida sa saad redigeerida. Suurepärane inimestele, kes soovivad jääda oma mugavustsooni.
- Masterdamine ja poleerijad: nad võtavad sinu loo – tehisintellekti genereeritud või inimtekkelise – ja parandavad tasemeid, -d ja valjust professionaalse läike jaoks.
- Helidisaini/sampleri tööriistad: vähem täielike laulude kohta, rohkem tekstuuride, silmuste ja efektide kohta.
"Muude muusika tehisintellekti tööriistade" vahel valides otsi:
- Vihje selgust: kas sa saad määrata tempo, helistiku, žanri segu, meeleolu, intensiivsuse?
- Ekspordivõimalused: helivarred, failid, integratsioon.
- Litsentsi selgus: kas väljund on kommertskasutuseks autoritasuvaba? Kas on olemas omistamisnõuded?
- Kiirus ja järjepidevus: kas tööriist toodab sarnaste viipade korral sarnaseid tulemusi? Või on see rulett?
Kuidas kirjutada viipasid, mis ei aja robotit segadusse
Muusika tehisintellekt on valiv. See ei loe sinu mõtteid; see loeb sinu omadussõnu. Mõtle nagu režissöör.
Proovi seda viipe skeletti heligeneraatorite jaoks:
- Žanr + ajastu: "kergendav sünt-pop, 2010ndate algus"
- Helistik: "A moll" (kui toetatud)
- Struktuur: "30 sekundit, sissejuhatus + ehitus + lühike konks"
- Meeleolu ja kasutus: "soe, optimistlik, ettevõtte selgitaja taust"
- Pilli kaldumine: "vapper süntesaatori juht, tihe kick, sidechain bass"
Ja -esmaste tööriistade jaoks:
- Taktid: "16 takti, silmusena korratav"
- Keerukus: "lihtne meloodia, kolmkõla akordid, aeg-ajalt mööduvad toonid"
- Dünaamika: "õrn crescendo viimases 4 taktis"
- Žanri segu: "lo-fi hip-hop kohtub keelpillikvartetiga"
Mis juhtub, kui sa oled ebamäärane? Sa saad ebamäärase. "Tee lahedat muusikat" kipub tootma poebrändi granola audioekvivalenti: hea küll, aga sa unustad selle lõunaks.
Praktiline demo: õige tööriista valimine viie reaalse stsenaariumi jaoks
Mängime sobitajat.
- Sa vajad 15-sekundilist logoheli i kanalile.
- Vali: -esmane kompositsioon. Miks? Sa soovid midagi tihedat, brändinguga seotut ja silmusena korratavat. Genereeri kolm variatsiooni, viska parim -sse, vaheta pille, kuni see sobib sinu kanali meeleoluga, ja ekspordi.
- Nipp: hoia seda ühes helistikus, lihtsa meloodia, rütmilise konksuga. Seejärel salvesta varred tulevaste variatsioonide jaoks.
- Sa soovid instrumentaalset tausta 3-minutilisele taskuhäälingusaate segmendile.
- Vali: heligeneraator selge "tausta" viipega (ilma vokaalita). Miks? Kiirus ja järjepidevus on olulised; sa ei soovi üllatus kazoo soolot oma tõsise intervjuu all.
- Nipp: küsi "madala kontrastsusega seadet" ja väldi rahvarohket kesksagedust – hääled elavad seal.
- Sa teed lühifilmi meeleoluka, areneva partituuriga.
- Vali: -esmane tööriistad teemade jaoks + heligeneraatorid tekstuuride jaoks. Miks? Teemad vajavad redigeeritavust, et pildiga kokku sobituda; tekstuure saab kihistada ambient heli abil.
- Nipp: ehita -s juhtmotiive, ekspordi varred ja puista heliga genereeritud atmosfääri, kus vaja.
- Sa soovid "stiilipärast" popvokaal lugu satiiriks.
- Vali: i stiilis heligeneratsioon eksperimenteerimiseks, seejärel (kui avaldad) asenda originaalvokaalidega või sessioonilauljaga, et vältida litsentsimise peavalu.
- Nipp: kasuta tehisintellekti, et prototüüpida meloodiat ja meeleolu. Ära saada stiilipärast vokaali sellisena, nagu see on, kui sa vajad puhtaid jooni.
- Sa juhid väikest ettevõtet ja vajad autoritasuvaba muusikat reklaamide jaoks – eile.
- Vali: tootmisele keskendunud heligeneraatorid selge litsentsimise + varre ekspordiga.
- Nipp: hoia viiped tempo ja meeleolu suhtes konkreetsed, testi kahte või kolme variatsiooni ja salvesta oma lemmikud kataloogi.
Pärast genereerimist kontrollnimekiri: tehisintellekti müra muutmine tegelikuks muusikaks
Isegi hea tehisintellekti väljund võib kõlada nagu see jättis hommikusöögi vahele. Siin on kiire poleerimisrutiin:
- Kärbi ja struktureeri: lõika parimad 30–60 sekundit. Korralda sissejuhatus, ehitus, konks ja lõpp.
- müra: kui see on taust, siis eemalda õrnalt 2–4 kHz, et teha ruumi kõnele.
- Kontrolli madalat otsa: taltsuta põminat umbes 60–120 Hz, et see ei mudaks sinu miksi.
- Lisa natuke kompressiooni: silu tippe; ära pigista elu sellest välja.
- Kontrolli mono ühilduvust: sinu publiku Bluetooth kõlar ei ole lava.
väljundite jaoks:
- Vali paremad pilli raamatukogud: vaikimisi "üldine klaver" kõlab nagu sinu hambaarsti ooteruum.
- Humaniseeri ajastust ja kiirust: varieeri veidi nootide pikkusi ja helitugevusi. Muidu saad sa roboti retsitali vibratsiooni.
- Lisa üleminekuid: paisumised, tõusud ja trummitäited aitavad muusikal hingata.
Lõksud, mille eest keegi sind ei hoiata (kuni sa postitad i)
- Ebamäärane stiilitsoon: "Kõlab nagu X" võib kalduda "liiga palju nagu X". Kui sinu projekt on avalik või kommertslik, väldi liiga spetsiifilist artisti jäljendamist.
- Helitugevuse kasv: tehisintellekti heligeneraatorid armastavad valju masterdamist. Sobita valjus oma platvormiga, et sa ei laseks kuulajaid õhku.
- Silmusõmblused: lühikesed tehisintellekti lood on mõnikord kuuldava klõpsuga. Ristfade sinu otsad.
- Üle viipamine: viisteist omadussõna ajavad mudelid segadusse. Vali viis, mis on olulised.
Kus Sider.AI sobib (sinu sõbralik abiline)
Siin on üllatus: Sider.AI saab aidata muusika ümber olevates osades. Koosta oma viipe ideed, korda žanri kirjeldusi ja isegi genereeri lühikesi skripte või video visandeid, mis sobivad sinu loo meeleoluga. Mõtle sellele kui lõikelaua hoidjale, kes hoiab sinu loomingulise protsessi liikumas. See ei asenda sinu -d, aga kui sa ütled sellele: "Kirjuta kolm variatsiooni 30-sekundilisest 'kergendavast tehnika' viipest heligeneraatorile, igaüks tempo ja struktuuriga", siis see sülitab välja kasutatavaid valikuid, mida saad otse oma muusika tööriista kleepida. Käepärane. Kuidas võrrelda tööriistu 30-minutilise küpsetusvõistlusega
Kui sa oled lõhestunud i, i ja muude muusika tehisintellekti tööriistade vahel, siis tee ajastatud test:
- Määratle üks lühikirjeldus: "Kaks 30-sekundilist instrumentaalset vihjet, üks elav (120 ), üks meeleolukas (80 )."
- Loo sama viipe kõigis tööriistades.
- Hinda igaüht: kiirus, kontroll (kas sa saad parandada vale nooti?), väljundi kvaliteet, litsentsi selgus ja varre/ eksport.
- Vali võitja oma kasutusjuhtumi jaoks.
Sa õpid 30-minutilise praktilise puurimise käigus rohkem kui 3 tunni jooksul funktsioonide loendeid lugedes.
Redigeerimine vs. genereerimine: tea, millises maailmas sa elad
i maailma inimesed armastavad redigeerimist. Nad soovivad -t, mida nad saavad nagu savi voolida. i maailma inimesed armastavad avastamist. Nad soovivad heli, mis neid üllatab.
Kui sul ei ole -d või sa ei armasta ajajooni ja klaverirulle, siis kalduda heligeneraatorite poole, millel on head varre ekspordid. Kui sa oled us või is mugav, siis tunduvad -esmane tööriistad nagu kodu.
Viipe retseptid, mida sa saad varastada
- Ettevõtte selgitaja taust: "Soe indie-electroonica, 110 , õrn vapper süntesaatori juht, arenevad padjad, vokaali pole, madala kontrastsusega miks hääle jaoks, 45 sekundit, nupulõpp."
- Kinematograafiline pinge vihje: "Tume orkestri hübriid, 70 , A moll, ostinaato keelpillid, kauged taiko löögid, hõredad klaveri motiivid, 30 sekundit, ehitus + löök."
- Lo-fi õppe silmus: "Lo-fi hip-hop, 85 , vinüül krabin, pehme , harjatud snare, 16-taktiline silmus, lõdvestunud swing."
- Retro mängu chiptune: "8-bitine chiptune, 140 , rõõmsad arpeggiod, ruutlaine juht, lihtsad kolmkõla akordid, 8 takti, silmusena korratav."
Kopeeri, kleebi, muuda ja sa oled valmis.
Millal inimmuusikud ikka veel võidavad (spoiler: sageli)
Tehisintellekt on suurepärane kiiruse, mitmekesisuse ja kohahoidja vihjete jaoks. Inimesed on suurepärased nüansside, emotsioonide ja täpse pildimuutusega sobitamisel. Kui sinu projekt on kõrge panusega – filmifestival, brändi lansseerimine –, kaalu hübriidtöövooge: kasuta tehisintellekti ideede uurimiseks, seejärel anna teatepulk heliloojale (või sulle, sina suurepärane mitmekülgne inimene), et lihvida lõplikku lugu.
Hea uudis: -esmane tööriistad muudavad selle üleandmise sujuvaks. Vartega heligeneraatorid aitavad ka.
Tõrkeotsingu külgriba: Appi, mu tehisintellekti lugu kõlab nagu kaerahelbed
- See on pudrune: suurenda rütmilist määratlust. Küsi "selge kick mustri" või "sünkopeeritud hi-hatid" ja tõsta -i 10 võrra.
- See on karm: alanda kõrge otsa -d; küsi "pehme kõrge sageduse profiili" või vähenda heleduse omadussõnu.
- See on hõivatud: küsi "minimaalset seadet" või "kahe pilli tekstuuri" (padjad + bass). Lõika kesksagedust.
- See on igav: lisa konks – lühike meloodia, mis kordub iga 8 takti järel. Küsi "meeldejäävat motiivi".
- See ei loo sujuvalt silmust: nõua "silmusena korratavat lõppu" ja lisa sinu -s silmuse punkti juures 10–20 ms ristfader.
vs. vs. muud muusika tehisintellekti tööriistad: reaalse maailma otsus
- Kui sa soovid redigeeritavaid kompositsioone, siis mine i stiilis peale. See on sinu parim sõber taustaülesannete ja paindlike partituuride jaoks.
- Kui sa soovid veidraid, stiliseeritud heli uurimisi (sealhulgas sünteetilist vokaali), mängi iga – aga kohtle seda nagu visandiraamatut, mitte tehast.
- Kui sa vajad kiireid tootmis lugusid ja selgeid litsentse, siis võidavad kaasaegsed varrega heligeneraatorid praktilisuse poolest mõlemad.
- Poleerimiseks viska oma lõplik lugu masterdamise tööriista või iniminseneri kätte.
Õige valik sõltub sinu projektist, sinu isust redigeerida ja sinu tähtajast. Nagu alati: testi, muuda, usalda oma kõrvu.
Üks viimane asi...
Siin on võlutrikk, millest keegi ei räägi: parimad tulemused tulevad siis, kui sa kirjeldad lugu, mitte ainult heli. "Muusika asutajale, kes räägib lootusrikka loo segastest prototüüpidest ja lõpuks õigeks saamisest" annab parema vibratsiooni kui "kergendav instrumentaal". Maali stseen ja tehisintellekt maalib vastu.
Sellega haara oma viiped, käivita oma valitud muusika tehisintellekt ja vaata, mida sinu sülearvuti komponeerib. Halvimal juhul saad sa midagi rumalat ja õpid palju. Parimal juhul saab sinu järgmine video, taskuhäälingusaade või projekt heliriba, mis on üllatavalt sina.
Kiire viide: valik OpenAI i, i ja muude muusika tehisintellekti tööriistade vahel
- Vali , kui: sa vajad stiliseeritud helieksperimente, sünteetilist vokaali ja sa oled ettearvamatusega.
- Vali MuseNet, kui: Vajad muudetavat MIDI-t, selget struktuuri ja paindlikku instrumentatsiooni.
- Vali tootmisele keskendunud helitööriistad, kui: Vajad kiirust, stem-eksporte ja selget kommerts litsentsi.
- Kasuta Sider.AI-d, kui: Soovid abi muusika ümber viipade, ülevaadete ja loominguliste lühikirjelduste koostamisel.
Nüüd mine tee natuke müra – plaaniga.
KKK
K1: Kuidas valida taustamuusika jaoks Jukeboxi ja MuseNeti vahel?
Taustamuusika jaoks on MuseNeti stiilis MIDI-tööriistad tavaliselt paremad, kuna saad redigeerida tempot, helistikku ja instrumente. Jukebox sobib paremini stiliseeritud helieksperimentideks, kuid selle väljundeid on raskem häälkõne jaoks sobivaks muuta.
K2: Kas ma saan AI loodud muusikat kommertseesmärkidel kasutada ilma juriidiliste probleemideta?
Jah – kui muusika AI-tööriist pakub selget, tasuta litsentsi kommertskasutuseks. Väldi avalikes väljaannetes Jukeboxi-sarnaste mudelite "stiilis" vokaale ning eelista tootmistööriistu, millel on selged litsentsitingimused ja stem-/MIDI-ekspordid.
K3: Mis on muusika AI-tööriistade jaoks parim viiba formaat?
Ole konkreetne: žanr + ajastu, tempo (BPM), helistik, struktuur, meeleolu ja instrumentatsioon. MIDI-generaatorite (nt MuseNet) puhul lisa takti pikkus, taktimõõt ja keerukus, et saada loop'itavaid, redigeeritavaid tulemusi.
K4: Kuidas panna AI muusika dialoogi alla sobima ilma kokkupõrgeteta?
Küsi madala kontrastsusega seadeid ja väldi rahvarohket keskmist sagedusala; seejärel EQ abil tee õrn langus umbes 2–4 kHz juures. Hoia dünaamika sujuv kerge kompressiooniga ja testi miksi väikesel kõlaril, et jäljendada reaalse maailma kuulamist.
K5: Kas Sider.AI on muusika AI-tööriistadega töötamisel kasulik?
See on mugav viipade, skriptide ja loominguliste lühikirjelduste koostamiseks ja itereerimiseks, mis sobivad sinu loo meeleoluga. Mõtle Sider.AI-le kui planeerimisassistendile, mis aitab sul Jukeboxist, MuseNetist või mõnest muust muusika AI-st paremaid tulemusi saada.