روزی که لپتاپ من تلاش کرد یک آهنگ موفق بنویسد
چند ماه پیش، من کاری را انجام دادم که هر فرد بالغ معقولی هنگام مواجهه با یک ضربالاجل قریبالوقوع و یک آشپزخانه بیعیب و نقص انجام میدهد: از کامپیوترم خواستم یک موسیقی متن جذاب برایم بنویسد. نه به این دلیل که تنبل هستم (خب، کمی)، بلکه به این دلیل که ابزارهای هوش مصنوعی موسیقی قسم میخورند که میتوانند ملودیها را سریعتر از آنکه بتوانید بگویید «بدون حق امتیاز» بیرون بدهند.
و وای—چه سیرکی. یک ابزار یک تصنیف قدرتمند دهه 90 را به زبان انگلیسی جعلی شبیه Billie Eilish خواند. دیگری یک کوارتت جاز شاد برای یک اسلاید درباره ذخیرهسازی ابری به من داد. سومی چیزی تولید کرد که подозрительно شبیه اجرای ضبط بچهام بعد از سه عدد Capri Sun بود.
بنابراین اگر نام Jukebox و MuseNet شرکت OpenAI—و باغوحش در حال گسترش ابزارهای هوش مصنوعی موسیقی—را شنیدهاید، ممکن است تعجب کنید: کدام یک را باید واقعاً استفاده کنید؟ برای مقدمه پادکست خود؟ رقص TikTok خود؟ موسیقی فیلم خود؟ عقل خود؟
بیایید این موضوع را با یک تور زبان ساده از چشمانداز هوش مصنوعی موسیقی مرتب کنیم، جایی که وعده بزرگ است، تفاوتها مهم هستند، و انتخاب درست تقریباً بهطور کامل به این بستگی دارد که شما چه کاری میخواهید انجام دهید.
ابزارهای هوش مصنوعی موسیقی واقعاً چه هستند؟
هوش مصنوعی موسیقی را مانند انواع مختلف سرآشپزها در نظر بگیرید:
- برخی آهنگسازانی هستند که سعی میکنند آهنگهای جدیدی را به سبک یک هنرمند یا دوره خاص بسازند. آنها آواز، شعر و سازبندی را آماده میکنند—مانند یک «گروه کاور» که هرگز نمیخوابد.
- برخی آهنگسازان ساز هستند که MIDI تولید میکنند—میدانید، نت موسیقی برای کامپیوترها—که میتوان آن را با هر صدای ساز دلخواهی پخش کرد.
- برخی دیگر تنظیمکننده و ریمیکسکننده هستند: به آنها یک ملودی یا حال و هوا بدهید، و آنها آن را پر و بال میدهند.
- و سپس ابزارهای مسترینگ و کمکی وجود دارند—صیقلدهندهها، نه سرآشپزها—که آهنگ موجود شما را میگیرند و آن را برای رادیو (یا TikTok) آماده میکنند.
Jukebox و MuseNet شرکت OpenAI در دو گروه اول قرار دارند. هدف Jukebox تولید صدای کامل—از جمله آواز—به سبک هنرمندان و ژانرهای قابل تشخیص است. MuseNet قطعات سازی را به صورت MIDI میسازد، که قادر به ترکیب جفتسازیهای عجیب و لذتبخش (مانند کانتری + شوپن) است که میتوانید آن را با هر صدای ساز دلخواهی رندر کنید.
اینکه کدام یک را میخواهید به ماموریت شما بستگی دارد.
برگه تقلب سریع: Jukebox در مقابل MuseNet
- Jukebox شرکت OpenAI: خروجی صدا (با آواز مصنوعی)، تولیدات به سبک هنرمند، زمان پردازش طولانی، حس تحقیق/نسخه نمایشی، برای اکتشاف خلاقانه و «شبیهسازیهای» بدیع بهتر است، ثبات آماده تولید نیست.
- MuseNet شرکت OpenAI: ترکیب MIDI، تکرار سریعتر، سازبندی انعطافپذیر، عالی برای موسیقی پسزمینه، پارتیتورها و نشانهها؛ به شما (یا یک DAW) نیاز دارد تا صدای نهایی را شکل دهید.
اگر هدف شما این است که «من به یک آهنگ صیقلی و بدون حق امتیاز تا ناهار نیاز دارم»، ممکن است بخواهید فراتر از این دو به ابزارهای مدرن متمرکز بر تولید نگاه کنید که بر سرعت، وضوح مجوز و کنترلها تأکید دارند. اما به آنجا خواهیم رسید.
چگونه ابزار هوش مصنوعی موسیقی مناسب را انتخاب کنیم (بدون از دست دادن آخر هفته خود)
با در نظر گرفتن پایان شروع کنید. به سه سوال پاسخ دهید:
- آیا به صدا با آواز نیاز دارید یا فقط به ساز؟
- اگر آواز—شعر، آواز—میخواهید، ژنراتورهای سبک Jukebox میتوانند برای الهامبخشیدن سرگرمکننده باشند، اما خروجیها میتوانند مبهم، سبکدار و شانسی باشند. برای آواز آماده تولید، احتمالاً به یک انسان یا یک فرآیند ترکیبی (اشعار هوش مصنوعی + خواننده انسانی) نیاز خواهید داشت.
- اگر تختهای سازی، مقدمهها و نشانهها میخواهید، MIDI به سبک MuseNet یا ژنراتورهای صوتی مدرن سریعتر، تمیزتر و قابل کنترلتر خواهند بود.
- به چقدر کنترل نیاز دارید؟
- اگر به تمپو، کلید، ساختار و انتخاب ساز اهمیت میدهید، به سمت ابزارهای مبتنی بر MIDI (خویشاوندان ترکیبی ژانر MuseNet) یا ابزارهای صوتی با اعلانها و بخشهای دقیق هدایت شوید. MIDI به شما امکان میدهد نتها را در یک DAW مانند Logic، Ableton یا GarageBand تغییر دهید.
- اگر «من را غافلگیر کن، آن را احساسی کن» میخواهید، ژنراتورهای صوتی سریع و سرگرمکننده هستند—اما کمتر قابل ویرایش هستند.
- برای YouTube، پادکستها یا پروژههای تجاری، مطمئن شوید که ابزار مجوزهای واضح و بدون حق امتیاز ارائه میدهد. «نسخههای نمایشی تحقیق» میتوانند خروجیهای به سبک تولید کنند که بهطور خطرناکی به اثر انگشتهای دارای حق چاپ نزدیک میشوند. اگر یک ابزار مبهم است، فرض کنید که باید با یک وکیل مشورت کنید یا سرویسی را انتخاب کنید که حقوق استفاده را به وضوح بیان کند.
این پاسخها را دم دست نگه دارید. آنها شما را به محله مناسب هدایت میکنند.
Jukebox شرکت OpenAI: آزمایش صوتی جسورانه
Jukebox مانند این است که از یک هوش مصنوعی بخواهید یک گروه را برای شما خواب ببیند. شما به آن یک ژانر، یک دوره، شاید یک تأثیر هنرمند فرضی میدهید، و صداهای کامل، از جمله آواز را بیرون میدهد. چشمگیر به نظر میرسد—و گاهی اوقات هم همینطور است. شما ساختارهای هارمونیک قانعکننده، امضاهای ریتمیک آشنا و هجاهای «خوانده شده» را میشنوید که با اشعار قابل فهم معاشقه میکنند.
اما در اینجا حروف ریز آمده است:
- کند است. تولید صدای با کیفیت بالا قهوه فوری نیست. منتظر زمانهای طولانی و تغییرات زیاد باشید.
- سبکدار است، نه دقیق. اگر میخواهید «تقریباً شبیه X به نظر برسد»، ممکن است با «پسر عموی دور X که به ایسلند نقل مکان کرده و وارد محیط شده است» روبرو شوید.
- ویرایش سخت است. شما نمیتوانید به راحتی نتها را در خروجی جابجا کنید. این سوپ صوتی است. شما با بخشها و بازسازی کار میکنید تا ویرایشهای دقیق جراحی.
بهترین برای: ایدهپردازی وحشیانه، قطعات احساسی و آزمایشهای اکتشافی «اگر یک خواننده مصنوعی تبلیغات محصول من را بخواند چه میشود». وقتی به نشانههای قابل پیشبینی و کاملاً کنترلشده تا پنجشنبه نیاز دارید، ایدهآل نیست.
MuseNet شرکت OpenAI: دستگاه آهنگسازی MIDI-اول
MuseNet به زبان آهنگسازی صحبت میکند: نتها، آکوردها، ریتمها، ساختار—که به صورت MIDI بیرون میآیند و میتوانید آنها را در یک DAW دوباره تنظیم کنید. یک دانشجوی کوشا را تصور کنید که میتواند یک قطعه پیانو 60 ثانیهای را در «کلید مینور سینمایی» بنویسد، که بعداً میتوانید آن را با سازهای مجازی به رشتهها، سینتها یا کازوها تبدیل کنید.
مزایا:
- قابل ویرایش است. کلید را تغییر دهید، ملودی را هل دهید، ساز را عوض کنید—MIDI برای دستکاری دوستانه است.
- تکرار آن سریع است. شما میتوانید چندین تغییر را امتحان کنید، سپس بهترین آنها را صیقل دهید.
- برای استفاده در پسزمینه ایمن است. خروجیهای به سبک MuseNet بیشتر «اصلی عمومی» هستند تا «مطمئناً شبیه آن آهنگ خاص به نظر میرسد»، که به صدور مجوز و اصالت کمک میکند.
معایب:
- بدون آواز. اگر به شعر و آواز نیاز دارید، به ابزارهای جداگانه (برای متن به شعر) و گردشهای کاری синтез синтезу انسان یا هوش مصنوعی نیاز خواهید داشت.
- گاهی اوقات وانیلی. بدون اعلانها و تنظیم دقیق، ممکن است موسیقی دریافت کنید که… خوب به نظر میرسد. یک کاسه بژ.
بهترین برای: موسیقی پسزمینه، فیلمهای شرکتی، تختهای پادکست، موسیقی متن اسلاید و هر چیزی که در آن میخواهید کنترل و قابلیت ویرایش بدون آشفتگی تولید کامل صدا را داشته باشید.
سایر ابزارهای هوش مصنوعی موسیقی که ارزش دانستن دارند (و جایی که قرار میگیرند)
چشمانداز سریعتر از یک درامر که اسپرسو را کشف کرده است تغییر میکند، اما دستهها ثابت میمانند:
- ژنراتورهای صوتی با کنترلهای قوی: اینها آهنگهای صوتی تمام شده را از اعلانهای متنی ایجاد میکنند، گاهی اوقات با استمها (آهنگهای جداگانه درام/باس/ملودی) تا بتوانید ریمیکس کنید. وقتی به چیزی نیاز دارید که امروز قابل استفاده باشد و MIDI نمیخواهید عالی است.
- MIDI و دستیارهای آهنگسازی: آنها ملودیها، پیشرفتهای آکورد و تنظیماتی را میسازند که میتوانید ویرایش کنید. برای افرادی که میخواهند در منطقه комфорту DAW خود بمانند عالی است.
- مسترینگ و صیقلدهندهها: آنها آهنگ شما—تولید شده توسط هوش مصنوعی یا ساخته شده توسط انسان—را میگیرند و سطوح، EQ و بلندی صدا را برای یک درخشش حرفهای اصلاح میکنند.
- ابزارهای طراحی صدا/سمپلر: کمتر در مورد آهنگهای کامل، بیشتر در مورد بافتها، لوپها و جلوهها.
هنگام انتخاب بین «سایر ابزارهای هوش مصنوعی موسیقی»، به دنبال این موارد باشید:
- وضوح اعلان: آیا میتوانید تمپو، کلید، ترکیب ژانر، حال و هوا، شدت را مشخص کنید؟
- گزینههای خروجی: استمهای صوتی، فایلهای MIDI، ادغام DAW.
- وضوح مجوز: آیا خروجی برای استفاده تجاری بدون حق امتیاز است؟ آیا الزامات اسنادی وجود دارد؟
- سرعت و ثبات: آیا ابزار با اعلانهای مشابه نتایج مشابهی تولید میکند؟ یا رولت است؟
چگونه اعلانهایی بنویسیم که ربات را گیج نکند
هوش مصنوعی موسیقی مشکلپسند است. ذهن شما را نمیخواند. صفات شما را میخواند. مانند یک کارگردان فکر کنید.
این اسکلت اعلان را برای ژنراتورهای صوتی امتحان کنید:
- ژانر + دوره: «سینتپاپ نشاطبخش، اوایل دهه 2010»
- کلید: «A مینور» (در صورت پشتیبانی)
- ساختار: «30 ثانیه، مقدمه + ساخت + قلاب مختصر»
- حال و هوا و استفاده: «گرم، خوشبینانه، پسزمینه توضیحدهنده شرکتی»
- تکیه بر ساز: «سرب مصنوعی خوشصدا، ضربه محکم، باس سایدچین»
و برای ابزارهای MIDI-اول:
- میلهها: «16 میله، قابل تکرار»
- پیچیدگی: «ملودی ساده، آکوردهای سهصدایی، لحنهای گذرای گاه به گاه»
- پویایی: «کرشندو ملایم در 4 میله آخر»
- ترکیب ژانر: «هیپهاپ لوفای با کوارتت زهی ملاقات میکند»
وقتی مبهم هستید چه اتفاقی میافتد؟ مبهم میشوید. «موسیقی باحال بساز» تمایل دارد معادل صوتی گرانولای تجاری تولید کند: خوب است، اما تا ناهار آن را فراموش خواهید کرد.
نسخه نمایشی عملی: انتخاب ابزار مناسب برای پنج سناریوی واقعی
بیایید نقش همسانساز را بازی کنیم.
- شما به یک آهنگ لوگوی 15 ثانیهای برای یک کانال YouTube نیاز دارید.
- انتخاب: آهنگسازی MIDI-اول. چرا؟ شما چیزی محکم، مارکدار و قابل تکرار میخواهید. سه تغییر ایجاد کنید، بهترین را در یک DAW رها کنید، سازها را عوض کنید تا با حال و هوای کانال شما مطابقت داشته باشد و صادر کنید.
- نکته: آن را در یک کلید، ملودی ساده، قلاب ریتمیک نگه دارید. سپس استمها را برای تغییرات آینده ذخیره کنید.
- شما یک تخت سازی برای یک بخش پادکست 3 دقیقهای میخواهید.
- انتخاب: ژنراتور صوتی با اعلان واضح «پسزمینه» (بدون آواز). چرا؟ سرعت و ثبات مهم است. شما یک تکنوازی کازو غافلگیرکننده در زیر مصاحبه جدی خود نمیخواهید.
- نکته: «تنظیم کمکنتراست» را بخواهید و از شلوغی میانی خودداری کنید—صداها در آنجا زندگی میکنند.
- شما در حال ساختن یک فیلم کوتاه با یک موسیقی متن احساسی و در حال تکامل هستید.
- انتخاب: ابزارهای MIDI-اول برای تمها + ژنراتورهای صوتی برای بافتها. چرا؟ تمها برای مطابقت با تصویر به قابلیت ویرایش نیاز دارند. بافتها را میتوان با صدای محیطی لایهبندی کرد.
- نکته: لایتموتیفها را در MIDI بسازید، استمها را صادر کنید و فضای تولید شده توسط صدا را در صورت نیاز بپاشید.
- شما یک آهنگ آوازی پاپ «به سبک» برای یک هجو میخواهید.
- انتخاب: تولید صدای سبک Jukebox برای آزمایش، سپس (در صورت انتشار) با آوازهای اصلی یا یک خواننده جلسه جایگزین کنید تا از سردردهای صدور مجوز جلوگیری کنید.
- نکته: از هوش مصنوعی برای نمونهسازی اولیه ملودی و حال و هوا استفاده کنید. اگر به خطوط قانونی تمیز نیاز دارید، آواز به سبک را به همان صورت ارسال نکنید.
- شما یک کسب و کار کوچک را اداره میکنید و به موسیقی بدون حق امتیاز برای تبلیغات—دیروز—نیاز دارید.
- انتخاب: ژنراتورهای صوتی متمرکز بر تولید با مجوز روشن + صادرات استم.
- نکته: اعلانها را خاص تمپو و حال و هوا نگه دارید، دو یا سه تغییر را آزمایش کنید و موارد دلخواه خود را در یک کاتالوگ ذخیره کنید.
چک لیست پس از تولید: تبدیل نویز هوش مصنوعی به موسیقی واقعی
حتی خروجی خوب هوش مصنوعی میتواند به نظر برسد که صبحانه را رد کرده است. در اینجا یک روال صیقلدهی سریع وجود دارد:
- برش و ساختار: 30–60 ثانیه بهترین را برش دهید. مقدمه، ساخت، قلاب و یک پایان دکمهای را ترتیب دهید.
- EQ درهم و برهمی: اگر یک تخت پسزمینه است، به آرامی 2–4 کیلوهرتز را بیرون بیاورید تا فضایی برای گفتار ایجاد شود.
- پایینترین حد را کنترل کنید: بومهای اطراف 60–120 هرتز را رام کنید تا میکس شما را گل آلود نکند.
- کمی فشردهسازی اضافه کنید: قلهها را صاف کنید. زندگی را از آن نگیرید.
- سازگاری مونو را بررسی کنید: بلندگوی بلوتوث مخاطب شما یک صحنه Dolby Atmos نیست.
برای خروجیهای MIDI:
- کتابخانههای ساز بهتری را انتخاب کنید: «پیانوی MIDI عمومی» پیشفرض شبیه اتاق انتظار دندانپزشک شما به نظر میرسد.
- زمانبندی و سرعت را انسانی کنید: طول نتها و حجمها را کمی تغییر دهید. در غیر این صورت، حال و هوای اجرای رباتیک را خواهید گرفت.
- انتقالها را اضافه کنید: Swell، risers و drum fills به موسیقی کمک میکنند نفس بکشد.
موانعی که هیچ کس به شما هشدار نمیدهد (تا زمانی که در YouTube پست کنید)
- منطقه سبک عجیب و غریب: «شبیه X به نظر میرسد» میتواند به «خیلی شبیه X» تبدیل شود. اگر پروژه شما عمومی یا تجاری است، از تقلید بیش از حد خاص هنرمند خودداری کنید.
- خزش صدا: ژنراتورهای صوتی هوش مصنوعی عاشق مسترهای بلند هستند. بلندی صدا را با پلتفرم خود مطابقت دهید تا شنوندگان را منفجر نکنید.
- درزهای حلقه: آهنگهای کوتاه هوش مصنوعی گاهی اوقات کلیکهای حلقه قابل شنیدن دارند. انتهای خود را متقاطع کنید.
- اعلان بیش از حد: پانزده صفت مدلها را گیج میکند. پنج مورد را انتخاب کنید که مهم هستند.
جایی که Sider.AI قرار میگیرد (همراه دوستانه شما)
در اینجا یک شگفتی وجود دارد: Sider.AI میتواند در قسمتهای اطراف موسیقی کمک کند. ایدههای اعلان خود را پیشنویس کنید، در توضیحات ژانر تکرار کنید و حتی اسکریپتهای کوتاه یا طرحهای ویدیویی را ایجاد کنید که با حال و هوای آهنگ شما مطابقت داشته باشد. آن را به عنوان دستیاری در نظر بگیرید که تختهای در دست دارد و روند خلاقانه شما را در حرکت نگه میدارد. جای DAW شما را نمیگیرد، اما اگر به آن بگویید: «سه تغییر از یک اعلان 30 ثانیهای «فناوری نشاطبخش» برای یک ژنراتور صوتی بنویس، هر کدام با تمپو و ساختار»، گزینههای قابل استفادهای را بیرون میدهد که میتوانید مستقیماً در ابزار موسیقی خود جایگذاری کنید. سودمند. نحوه مقایسه ابزارها با یک پخت و پز 30 دقیقهای
اگر بین Jukebox، MuseNet و سایر ابزارهای هوش مصنوعی موسیقی مردد هستید، یک آزمایش زمانبندی شده را اجرا کنید:
- یک خلاصه کوتاه را تعریف کنید: «دو نشانه سازی 30 ثانیهای، یکی پرانرژی (120 BPM)، یکی احساسی (80 BPM).»
- همان اعلان را در سراسر ابزارها ایجاد کنید.
- هر کدام را بر اساس: سرعت، کنترل (آیا میتوانید یک نت ترش را اصلاح کنید؟)، کیفیت خروجی، وضوح مجوز و صادرات استم/MIDI امتیاز دهید.
- برنده را برای مورد استفاده خود انتخاب کنید.
شما در 30 دقیقه کاوش عملی بیشتر از 3 ساعت خواندن لیست ویژگیها یاد خواهید گرفت.
ویرایش در مقابل تولید: بدانید در کدام دنیا زندگی میکنید
افراد دنیای MuseNet عاشق ویرایش هستند. آنها MIDI میخواهند که بتوانند مانند خاک رس مجسمهسازی کنند. افراد دنیای Jukebox عاشق کشف هستند. آنها صدا میخواهند که آنها را غافلگیر کند.
اگر مالک DAW نیستید یا خطوط زمانی و رولهای پیانو را دوست ندارید، به سمت ژنراتورهای صوتی با صادرات استم خوب متمایل شوید. اگر در Logic یا Ableton راحت هستید، ابزارهای MIDI-اول احساس میکنند که در خانه هستید.
دستور العملهای اعلان که میتوانید بدزدید
- تخت توضیحدهنده شرکتی: «ایندی-الکترونیکا گرم، 110 BPM، سرب مصنوعی خوشصدا ملایم، پدهای در حال تکامل، بدون آواز، میکس کمکنتراست برای صداگذاری، 45 ثانیه، پایان دکمهای.»
- نشانه تنش سینمایی: «هیبرید ارکسترال تاریک، 70 BPM، A مینور، رشتههای استیناتو، ضربههای تایکوی دور، موتیفهای پیانوی پراکنده، 30 ثانیه، ساخت + نیش.»
- حلقه مطالعه لوفای: «هیپهاپ لوفای، 85 BPM، خش خش وینیل، رودز ملایم، سنج براشخورده، حلقه 16 میلهای، چرخش آرام.»
- چیپتون بازی رترو: «چیپتون 8 بیتی، 140 BPM، آرپژهای شاد، سرب موج مربعی، آکوردهای سهصدایی ساده، 8 میله، قابل تکرار.»
کپی، جایگذاری، تنظیم کنید و شما حرکت میکنید.
چه زمانی نوازندگان انسانی هنوز برنده میشوند (اسپویلر: اغلب)
هوش مصنوعی برای سرعت، تنوع و نشانههای جایگزین عالی است. انسانها برای تفاوتهای ظریف، احساسات و مطابقت با ویرایشهای دقیق تصویر عالی هستند. اگر پروژه شما پرمخاطره است—یک جشنواره فیلم، راهاندازی یک برند—گردشهای کاری هیبریدی را در نظر بگیرید: از هوش مصنوعی برای کشف ایدهها استفاده کنید، سپس چوب دستی را به یک آهنگساز (یا به شما، ای شخص فوقالعاده با استعداد) بسپارید تا آهنگ نهایی را تقویت کند.
خبر خوب: ابزارهای MIDI-اول این تحویل را روان میکنند. ژنراتورهای صوتی با استمها نیز کمک میکنند.
نوار کناری عیبیابی: کمک، آهنگ هوش مصنوعی من شبیه فرنی است
- شل است: تعریف ریتمیک را افزایش دهید. «الگوی ضربه واضح» یا «سنجهای های-هت سنکوپدار» را بخواهید و BPM را 10 واحد افزایش دهید.
- خشن است: EQ بالایی را کاهش دهید. «نمایه فرکانس بالای نرم» را درخواست کنید یا صفات روشنایی را کاهش دهید.
- شلوغ است: «تنظیم حداقل» یا «بافت دو سازه» (پد + باس) را بخواهید. میانی را برش دهید.
- خستهکننده است: یک قلاب اضافه کنید—ملودی کوتاهی که هر 8 میله تکرار میشود. «موتیف به یاد ماندنی» را درخواست کنید.
- به طور روان حلقه نمیشود: «پایان قابل حلقه» را اجباری کنید و در نقطه حلقه در DAW خود 10–20 میلیثانیه кроссфейд اضافه کنید.
MuseNet در مقابل Jukebox در مقابل سایر ابزارهای هوش مصنوعی موسیقی: رای واقعی
- اگر ترکیبهای قابل ویرایش میخواهید، به MIDI به سبک MuseNet بروید. این بهترین دوست شما برای کارهای پسزمینه و партитур гармония است.
- اگر اکتشافات صوتی عجیب و غریب و سبکدار (از جمله آوازهای مصنوعی) میخواهید، با Jukebox بازی کنید—اما با آن مانند یک دفترچه طراحی رفتار کنید، نه یک کارخانه.
- اگر به آهنگهای تولید سریع و مجوزهای واضح نیاز دارید، ژنراتورهای صوتی مدرن با صادرات استم برای کاربردی بودن از هر دو بهتر هستند.
- برای صیقلدادن، مورد نهایی خود را در یک ابزار مسترینگ یا یک مهندس انسانی بیاندازید.
انتخاب درست به پروژه شما، اشتهای شما برای ویرایش و ضربالاجل شما بستگی دارد. مثل همیشه: تست کنید، تنظیم کنید، به گوشهای خود اعتماد کنید.
یک نکته آخر…
در اینجا یک ترفند جادویی وجود دارد که هیچکس در مورد آن صحبت نمیکند: بهترین نتایج زمانی به دست میآیند که داستان را توصیف کنید، نه فقط صدا را. «موسیقی برای یک بنیانگذار که داستانی امیدوارکننده در مورد نمونههای اولیه نامرتب و بالاخره درست کردن آن میگوید» ارتعاشات بهتری نسبت به «سازی نشاطبخش» ایجاد میکند. صحنه را نقاشی کنید، و هوش مصنوعی پاسخ میدهد.
با این کار، اعلانهای خود را بردارید، هوش مصنوعی موسیقی انتخابی خود را روشن کنید و ببینید لپتاپ شما چه چیزی میسازد. در بدترین حالت، شما چیز احمقانهای دریافت میکنید و چیزهای زیادی یاد میگیرید. در بهترین حالت، ویدیوی بعدی، پادکست یا پروژه شما یک موسیقی متن دریافت میکند که بهطور شگفتانگیزی شماست.
مرجع سریع: انتخاب بین Jukebox، MuseNet و سایر ابزارهای هوش مصنوعی موسیقی شرکت OpenAI
- Jukebox را انتخاب کنید زمانی که: به آزمایشهای صوتی سبکدار، آوازهای مصنوعی نیاز دارید و با غیرقابل پیشبینی بودن مشکلی ندارید.
- هنگامی که به MIDI قابل ویرایش، ساختار منظم و سازبندی انعطافپذیر نیاز دارید، MuseNet را انتخاب کنید.
- هنگامی که به سرعت، خروجی ساقه (stem exports) و مجوز تجاری واضح نیاز دارید، ابزارهای صوتی متمرکز بر تولید را انتخاب کنید.
- زمانی که میخواهید در ساخت اعلانها (prompts)، طرحها و خلاصههای خلاقانه در مورد موسیقی خود کمک بگیرید، از Sider.AI استفاده کنید.
حالا با یک برنامه، سروصدا به پا کنید.
سوالات متداول
سوال 1: چگونه بین Jukebox و MuseNet برای موسیقی پسزمینه انتخاب کنم؟
برای موسیقی پسزمینه، ابزارهای MIDI به سبک MuseNet معمولاً برنده هستند زیرا میتوانید تمپو، کلید و سازها را ویرایش کنید. Jukebox برای آزمایشهای صوتی سبکدار بهتر است، اما تنظیم خروجیهای آن برای میکسهای مناسب voiceover دشوارتر است.
سوال 2: آیا میتوانم از موسیقی تولید شده توسط هوش مصنوعی به صورت تجاری و بدون دردسرهای قانونی استفاده کنم؟
بله - اگر ابزار هوش مصنوعی موسیقی، مجوزهای واضح و بدون حق امتیاز برای استفاده تجاری ارائه دهد. از آوازهای «به سبک» مدلهای Jukebox در نسخههای عمومی اجتناب کنید و ابزارهای تولید با شرایط مجوز صریح و خروجیهای ساقه/MIDI را ترجیح دهید.
سوال 3: بهترین فرمت اعلان (prompt) برای ابزارهای هوش مصنوعی موسیقی چیست؟
مشخص باشید: ژانر + دوره، تمپو (BPM)، کلید، ساختار، حال و هوا و سازبندی. برای تولیدکنندههای MIDI مانند MuseNet، طول میزان، میزان نما و پیچیدگی را اضافه کنید تا نتایج قابل حلقه و ویرایش به دست آورید.
سوال 4: چگونه موسیقی هوش مصنوعی را زیر دیالوگ قرار دهم بدون اینکه تداخل ایجاد کند؟
آرایشهای کمکنتراست را درخواست کنید و از میدرنج شلوغ اجتناب کنید؛ سپس یک افت ملایم در حدود 2-4 کیلوهرتز EQ کنید. دینامیک را با فشردگی (compression) ملایم صاف نگه دارید و میکس را روی یک بلندگوی کوچک تست کنید تا تقلیدی از گوش دادن در دنیای واقعی باشد.
سوال 5: آیا Sider.AI هنگام کار با ابزارهای هوش مصنوعی موسیقی مفید است؟
برای ساخت و تکرار اعلانها (prompts)، اسکریپتها و خلاصههای خلاقانهای که با حال و هوای آهنگ شما مطابقت دارند، مفید است. Sider.AI را به عنوان یک دستیار برنامهریزی در نظر بگیرید که به شما کمک میکند خروجیهای بهتری از Jukebox، MuseNet یا هر هوش مصنوعی موسیقی دیگری دریافت کنید.