Искусственный интеллект
Использование искусственного интеллекта в музыке становится всё более сложным

Применение искусственного интеллекта в музыке увеличивается уже несколько лет. Как объясняет Kumba Sennaar, три текущих применения ИИ в музыкальной индустрии лежат в области музыкальной композиции, музыкального стриминга и монетизации музыки, где платформы ИИ помогают артистам монетизировать свою музыкальную контент на основе данных о деятельности пользователей.
Все началось еще в 1957 году, когда Learn Hiller и Leonard Issacson запрограммировали Illiac I для создания “Illiac Suite for String Quartet”, первого произведения, полностью написанного искусственным интеллектом, а затем, через 60 лет, это превратилось в полноценные альбомы, такие как альбом Taryn Southern, произведенный Amper Music в 2017 году. В настоящее время у Southern более 452 тысяч подписчиков на YouTube, и песня “Lovesick” из альбома была прослушана и просмотрена более 45 000 зрителей.
Но с тех пор применение ИИ в этой области стало более сложным и разветвленным. Open AI создал MuseNet, как объясняет компания, “глубокую нейронную сеть, которая может генерировать 4-минутные музыкальные композиции с 10 различными инструментами и может объединять стили от кантри до Моцарта до The Beatles. MuseNet не был явно запрограммирован с нашим пониманием музыки, а вместо этого открыл закономерности гармонии, ритма и стиля, обучаясь предсказывать следующий токен в сотнях тысяч MIDI-файлов. MuseNet использует ту же общую технологию без надзора, что и GPT-2, крупномасштабная модель трансформер, обученная предсказывать следующий токен в последовательности, будь то аудио или текст.”
С другой стороны, как сообщает GeekWire, среди других, доктор МICK Гриерсон, компьютерный ученый и музыкант из Goldsmiths, University of London, был недавно поручен итальянским производителем автомобилей Fiat создать список из 50 наиболее иконических поп-песен с помощью алгоритмов. Его аналитическое программное обеспечение было использовано для определения “того, что делает песни заметными, включая ключ, количество ударов в минуту, разнообразие аккордов, текстовое содержание, тимбральное разнообразие и звуковую вариацию.”
Согласно его результатам, песня, которая имела лучшую комбинацию заданных параметров, была “Smells Like Teen Spirit” группы Nirvana, опередив “One” группы U2 и “Imagine” Джона Леннона. Песня Nirvana была затем использована компанией FIAT для продвижения своей новой модели FIAT 500. Гриерсон объяснил, что алгоритмы показали, что “звуки, которые используются в этих песнях, и то, как они объединены, очень уникальны в каждом случае.”
Другое применение было подготовлено библиотекой musicnn, которая, как объясняется, использует глубокие свёрточные нейронные сети для автоматического тегирования песен. Модели “которые включены достигают лучших результатов в публичных оценочных бенчмарках.” музыки (как в музыканте) и ее лучшие модели были выпущены как библиотека с открытым исходным кодом. Проект был разработан Музыкальной технологической группой Universitat Pompeu Fabra, расположенной в Барселоне, Испания.
В своем анализе применения Jordi Pons использовал musicnn для анализа и тегирования другой иконической песни, “Bohemian Rhapsody” группы Queen. Он заметил, что вокальный голос Фредди Меркури был помечен как женский голос, в то время как его другие прогнозы были довольно точными. Сделав musicnn доступным как открытый исходный код, становится возможным дальнейшее усовершенствование процесса тегирования.
Сообщая об использовании ИИ в музыкальном стриминге, Digital Music News заключает, что “введение искусственного интеллекта и технологий машинного обучения значительно улучшило способ, которым мы слушаем музыку. Благодаря быстрым достижениям в области ИИ и подобных технологий, мы, скорее всего, увидим множество футуристических улучшений в ближайшие годы.”












