Trí tuệ nhân tạo

Sự Sử Dụng Trí Tuệ Nhân Tạo Trong Âm Nhạc Đang Trở Nên Phong Phú Hơn

mm

Việc áp dụng trí tuệ nhân tạo trong âm nhạc đã tăng lên trong vài năm gần đây.  Como Kumba Sennaar giải thích, ba ứng dụng hiện tại của AI trong ngành âm nhạc nằm ở lĩnh vực sáng tác âm nhạc, phát trực tuyến âm nhạc và kiếm tiền từ âm nhạc, nơi các nền tảng AI giúp các nghệ sĩ kiếm tiền từ nội dung âm nhạc của họ dựa trên dữ liệu từ hoạt động của người dùng.

Tất cả bắt đầu từ năm 1957 khi Learn Hiller và Leonard Issacson lập trình Illiac I để sản xuất “Illiac Suite for String Quartet”, tác phẩm đầu tiên được viết hoàn toàn bởi trí tuệ nhân tạo, sau đó, 60 năm sau, nó trở thành các album hoàn chỉnh như album Taryn Southern được sản xuất bởi Amper Music vào năm 2017. Hiện tại, Southern có hơn 452 nghìn người đăng ký trên YouTube và “Lovesick” một bài hát từ album đã được nghe và xem bởi hơn 45.000 người xem.

Nhưng kể từ đó, việc áp dụng AI trong lĩnh vực này đã trở nên tinh vi hơn và mở rộng hơn. Open AI đã tạo ra MuseNet, như công ty giải thích, “một mạng lưới thần kinh sâu có thể tạo ra các bản nhạc 4 phút với 10 loại nhạc cụ khác nhau và có thể kết hợp các phong cách từ nhạc đồng quê đến Mozart đến The Beatles. MuseNet không được lập trình rõ ràng với sự hiểu biết của chúng tôi về âm nhạc, nhưng thay vào đó, nó đã khám phá ra các mẫu hòa âm, nhịp điệu và phong cách bằng cách học cách dự đoán token tiếp theo trong hàng trăm nghìn tệp MIDI. MuseNet sử dụng cùng công nghệ không giám sát chung như GPT-2, một mô hình chuyển đổi lớn được đào tạo để dự đoán token tiếp theo trong một chuỗi, cho dù âm thanh hay văn bản.

Mặt khác, như GeekWire báo cáo, среди những người khác, Tiến sĩ Mick Grierson, nhà khoa học máy tính và nhạc sĩ từ Goldsmiths, Đại học London gần đây được nhà sản xuất ô tô Ý Fiat ủy thác để sản xuất một danh sách 50 bài hát pop nổi tiếng nhất sử dụng thuật toán. Phần mềm phân tích của ông được sử dụng để “xác định Điều gì làm cho các bài hát đáng chú ý, bao gồm khóa, số nhịp mỗi phút, sự đa dạng của hợp âm, nội dung lời bài hát, sự đa dạng về âm sắc và sự thay đổi âm thanh.”

Theo kết quả của ông, bài hát có sự kết hợp tốt nhất của các tham số đã đặt là “Smells Like Teen Spirit” của Nirvana, đứng trước “One” của U2 và “Imagine” của John Lennon. Bài hát của Nirvana sau đó được FIAT sử dụng để quảng cáo mẫu FIAT 500 mới. Grierson giải thích rằng các thuật toán đã chỉ ra rằng, ‘Âm thanh mà những bài hát này sử dụng và cách chúng được kết hợp là rất độc đáo trong mỗi trường hợp.’

Một ứng dụng khác được chuẩn bị bởi musicnn library, như được giải thích, sử dụng các mạng lưới thần kinh sâu để tự động gắn thẻ các bài hát. Các mô hình “đã bao gồm đạt được điểm số tốt nhất trong các tiêu chuẩn đánh giá công khai.” âm nhạc (như nhạc sĩ) và các mô hình tốt nhất của nó đã được phát hành dưới dạng thư viện mã nguồn mở. Dự án đã được phát triển bởi Nhóm Công nghệ Âm nhạc của Universitat Pompeu Fabra, nằm ở Barcelona, Tây Ban Nha.

Trong phân tích của mình về ứng dụng, Jordi Pons đã sử dụng musicnn để phân tích và gắn thẻ một bài hát khác nổi tiếng, “Bohemian Rhapsody” của Queen. Ông nhận thấy rằng giọng hát của Freddie Mercury được gắn thẻ là giọng nữ, trong khi các dự đoán khác của nó khá chính xác. Việc làm cho musicnn có sẵn dưới dạng mã nguồn mở cho phép tinh chỉnh quá trình gắn thẻ thêm.

Báo cáo về việc sử dụng AI trong phát trực tuyến âm nhạc, Digital Music News kết luận rằng “sự giới thiệu của trí tuệ nhân tạo và công nghệ học máy đã cải thiện đáng kể cách chúng ta nghe nhạc. Nhờ sự tiến bộ nhanh chóng trong AI và các công nghệ tương tự, chúng ta có khả năng sẽ thấy nhiều cải tiến trong tương lai.

Cựu nhà ngoại giao và dịch giả cho Liên Hợp Quốc, hiện là nhà báo / nhà văn / nhà nghiên cứu tự do, tập trung vào công nghệ hiện đại, trí tuệ nhân tạo và văn hóa hiện đại.