Штучний інтелект

Використання штучного інтелекту в музиці стає дедалі більш складним

mm

Застосування штучного інтелекту в музиці зростає вже кілька років.  Як пояснює Kumba Sennaar, три поточні застосування штучного інтелекту в музичній індустрії лежать у сфері музичної композиції, музичного стримінгу та монетизації музики, де платформи штучного інтелекту допомагають артистам монетизувати свій музичний контент на основі даних про активність користувачів.

Все почалося ще у 1957 році, коли Learn Hiller і Leonard Issacson програмували Illiac I для створення “Illiac Suite for String Quartet”, першої роботи, повністю написаної штучним інтелектом, а потім, через 60 років, це переросло у повні альбоми, такі як альбом Taryn Southern, створений Amper Music у 2017 році. Наразі у Southern понад 452 тисячі підписників на YouTube, а пісня “Lovesick” з альбому була прослухана та переглянута понад 45 тисячами користувачів.

Але з того часу застосування штучного інтелекту в цій сфері стало ще більш складним і розгалуженим. Open AI створила MuseNet, як пояснює компанія, “глибоку нейронну мережу, яка може генерувати 4-хвилинні музичні композиції з 10 різними інструментами та може поєднувати стилі від кантрі до Моцарта до The Beatles. MuseNet не була явно запрограмована нашим розумінням музики, а натомість відкрила закономірності гармонії, ритму та стилю, навчаючись передбачати наступний токен у сотнях тисяч файлів MIDI. MuseNet використовує ту ж загальну безоплатну технологію, як і GPT-2, великомасштабну трансформерну модель, навчену передбачати наступний токен у послідовності, незалежно від того, чи це аудіо, чи текст.”

З іншого боку, як повідомляє GeekWire, серед інших, доктор Мік Гріерсон, комп’ютерний вчений і музикант з Goldsmiths, Університет Лондона, був недавно доручений італійським виробником автомобілів Fiat створити список з 50 найбільш іконічних поп-пісень за допомогою алгоритмів. Його аналітичне програмне забезпечення було використано для визначення того, “що робить ці пісні помітними, включаючи ключ, кількість ударів на хвилину, різноманітність акордів, ліричний зміст, тимбральне різноманіття та сонічну відмінність”.

За його результатами, пісня, яка мала найкращу суміш зазначених параметрів, була “Smells Like Teen Spirit” групи Nirvana, попереду пісень U2 “One” і Джона Леннона “Imagine”. Пісня Nirvana була потім використана компанією FIAT для просування свого нового моделі FIAT 500. Гріерсон пояснив, що алгоритми показали, що “звучання цих пісень та спосіб їх поєднання є високо унікальним у кожному випадку”.

Іншим застосуванням стала бібліотека musicnn, яка, як пояснюється, використовує глибокі нейронні мережі для автоматичного тегування пісень. Моделі “які включені до бібліотеки, досягають найкращих результатів у публічних оцінках”. Музика (як музикант) та її найкращі моделі були випущені як відкрита бібліотека. Проект був розроблений Музичною технологічною групою Університету Помпеу Фабри у Барселоні, Іспанія.

У своєму аналізі застосування Джорді Понс використав musicnn для аналізу та тегування іншої іконічної пісні, “Bohemian Rhapsody” групи Queen. Він помітив, що співочий голос Фредді Мерк’юрі був позначений як жіночий голос, тоді як інші його передбачення були досить точними. Надання musicnn у відкритому доступі дозволяє подальше вдосконалення процесу тегування.

У звіті про використання штучного інтелекту у музичному стримінгу Digital Music News висновує, що “введення штучного інтелекту та технологій машинного навчання суттєво покращило спосіб, яким ми слухаємо музику. Завдяки швидким досягненням у сфері штучного інтелекту та подібних технологій, ми, ймовірно, побачимо багато футуристичних вдосконалень у найближчі роки.”

Колишній дипломат і перекладач для ООН, зараз фріланс-журналіст/письменник/дослідник, зосереджений на сучасних технологіях, штучному інтелекті та сучасній культурі.