sơ khai Hazel Savage, CEO & Đồng sáng lập Musiio - Chuỗi phỏng vấn - Unite.AI
Kết nối với chúng tôi

Phỏng vấn

Hazel Savage, Giám đốc điều hành & Đồng sáng lập Musiio – Loạt bài phỏng vấn

mm

Được phát hành

 on

viện bảo tàng cung cấp các công cụ phân tích, gắn thẻ và tìm kiếm do AI cung cấp cho một số danh mục âm nhạc lớn nhất thế giới, bao gồm Sony Music, Hipgnosis, Amanotes, Epidemic Sound và Blanco Y Negro trong số các khách hàng của họ.

Một nghệ sĩ guitar yêu thích nhạc Rock đã trở thành Đồng sáng lập & Giám đốc điều hành, Hazel Savage đã có 15 năm làm việc trong ngành công nghiệp âm nhạc cho một số thương hiệu âm nhạc lớn nhất thế giới – từ việc sắp xếp các kệ hàng tại HMV, đến điều hành các nhóm trong các doanh nghiệp đi đầu về nghe nhạc và đề xuất, Hazel hiểu nhu cầu của ngành từ nhạc sĩ cho đến công ty đa quốc gia lớn.

Bạn đã hoạt động trong ngành công nghiệp âm nhạc hơn 15 năm, điều gì khiến bạn đam mê âm nhạc đến vậy và tại sao bạn lại muốn tham gia vào ngành công nghiệp âm nhạc?

Cha mẹ tôi là những người khá rock and roll. Họ là những người hâm mộ âm nhạc cuồng nhiệt, vì vậy tôi luôn được bao quanh bởi âm nhạc khi lớn lên. Sau đó, vào sinh nhật lần thứ 13 của mình, tôi có một cây đàn guitar. Tôi vẫn chơi và đam mê biểu diễn trực tiếp. Vì vậy, khi tôi đang tìm hiểu xem mình sẽ làm gì với cuộc đời mình, thật hợp lý khi tập trung vào thứ mà tôi đã dành gần như toàn bộ thời gian của mình để làm.

Cuối cùng tôi đã làm vô số thứ liên quan đến nhau. Tôi đã chơi trong một ban nhạc. Tôi đã quản lý các ban nhạc. Tôi điều hành các đêm câu lạc bộ. Tôi đã phát tờ rơi cho các đêm câu lạc bộ của người khác, điều hành danh sách khách mời, và trước khi tôi biết điều đó, nó đã trở thành một nghề nghiệp, mặc dù chắc chắn là nghiêng về công nghệ.

Bạn có thể chia sẻ câu chuyện về nguồn gốc đằng sau Musiio không?

Công việc đầu tiên của tôi sau khi tốt nghiệp đại học là xếp các kệ hàng trong HMV (cửa hàng băng đĩa ở Vương quốc Anh). Vì vậy, bạn có thể nói rằng tôi đã nhận thức được các vấn đề trong việc phân loại âm nhạc kể từ đó. Vài năm trôi qua nhanh chóng (thông qua Shazam, Pandora và Universal) và tôi đang làm việc cho một nền tảng âm nhạc UGC với hàng nghìn bản nhạc được tải lên mỗi ngày. Tôi đã làm việc với một người phát nhạc phải đối chiếu thủ công các bản nhạc hay nhất tải lên thành các danh sách phát. Anh ấy sẽ nghe hàng trăm bản nhạc mỗi ngày. Một số ngày, anh ấy có đủ nội dung phù hợp cho một danh sách phát. Một số ngày anh ấy đã không. Tôi bắt đầu tự hỏi liệu có cách nào để tự động hóa việc tìm kiếm các bản nhạc hay nhất cho một tình huống nhất định hay không. Bằng cách đó, anh ấy có thể sử dụng các kỹ năng của mình với tư cách là một chuyên gia âm nhạc để quản lý, thay vì chỉ hoạt động như một bộ lọc cho âm nhạc tồi.

Musiio được thành lập khi tôi gặp người đồng sáng lập Aron Pettersson thông qua vườn ươm khởi nghiệp Doanh nhân đầu tiên ở Singapore vào năm 2018. Aron là một thiên tài AI. Khi chúng tôi nói về những cách chúng tôi có thể làm việc cùng nhau, chúng tôi nhận ra rằng chúng tôi có thể sử dụng các kỹ năng AI của Aron để giải quyết vấn đề lọc dựa trên nhạc, tự động gắn thẻ hoặc tìm kiếm nhạc theo thể loại, tâm trạng, BPM, v.v. hoặc tìm kiếm dựa trên dấu vân tay . Aron đã xây dựng một nguyên mẫu của thuật toán trong một buổi chiều và chúng tôi đã đặt nó hoạt động trên một kho lưu trữ nhạc miễn phí. Chúng tôi ra ngoài ăn trưa, để nó xử lý dữ liệu. Khi chúng tôi trở lại, chúng tôi đã rất ngạc nhiên bởi độ chính xác của kết quả. Chúng tôi không thể hy vọng có một bằng chứng về khái niệm thành công hơn. Từ đó, chúng tôi đã tối ưu hóa thuật toán một cách ồ ạt. Chúng tôi có một nhóm âm nhạc giúp dạy AI và tiến hành QA, đồng thời chúng tôi đã phát hành các sản phẩm để gắn thẻ, tìm kiếm tài liệu tham khảo âm thanh, danh sách phát và thậm chí lựa chọn phân đoạn bài hát cho các nền tảng như TikTok.

Các loại thuật toán học máy khác nhau được sử dụng là gì?

Chúng tôi đã xây dựng các thuật toán độc quyền của riêng mình và chúng tôi coi đây là công thức bí mật của mình! Người đồng sáng lập của tôi, Aron, đã đi đầu trong lĩnh vực máy học trong hơn một thập kỷ, làm việc về sinh học phân tử, khoa học thần kinh, vật lý và thậm chí cả phát triển trò chơi. Anh ấy lãnh đạo nhóm AI của chúng tôi. Chúng tôi cũng tận dụng công nghệ tuyệt vời hiện có như TensorFlow, Kubernetes và Dịch vụ đám mây của Google để có khả năng mở rộng và cung cấp sản phẩm của mình trên quy mô lớn, với số lượng lớn nhất, chúng tôi đã gắn thẻ 5,000,000 bản nhạc mỗi ngày! Chúng tôi cũng đã dành nhiều thời gian và nỗ lực hợp lý hóa quy trình công việc của mình trong JIRA; vấn đề không chỉ là bạn sử dụng công cụ nào mà còn là bạn có thể làm việc hiệu quả như thế nào với nhóm các nhà phát triển và chuyên gia âm nhạc. Sự kết hợp của hai đội Trí tuệ nhân tạo và Âm nhạc là phần thứ hai trong công thức bí mật của chúng tôi.

Một số thách thức đằng sau việc xây dựng một công cụ tìm kiếm cho âm nhạc là gì?

Tốc độ và độ chính xác là những thách thức lớn với tìm kiếm. Nó phải nhanh vì mọi người đang sử dụng nó trong thời gian thực. Điều này khác với việc gắn thẻ vì người dùng sẽ thường thực hiện một số truy vấn tìm kiếm, nhưng việc gắn thẻ chỉ xảy ra một lần.

Có nhiều điều bạn có thể làm để tăng tốc độ tìm kiếm. Bạn chỉ có thể hiển thị các bản nhạc có cùng thẻ với bản gốc của mình, nhưng bạn sẽ hy sinh độ chính xác. Chẳng hạn, tìm kiếm tham chiếu âm thanh thuần túy trên danh mục 200 triệu bản nhạc có thể mất nhiều thời gian, vì vậy bạn phải liên tục cân bằng giữa tốc độ và độ chính xác cũng như tìm kiếm giải pháp. Nó phức tạp và một số kiến ​​thức khó có được, nhưng điều tôi có thể chia sẻ là chúng tôi chuyển đổi tệp âm thanh thành ảnh phổ, dấu vân tay có độ chi tiết cao của tệp âm thanh và khi chúng tôi tiến hành tìm kiếm tham chiếu âm thanh, thuật toán sẽ phân tích tới 1,500 điểm dữ liệu – vượt xa những gì có thể chỉ với các thẻ từ. Và nó chọn ra những đặc điểm âm nhạc khó diễn tả như chất lượng giọng hát, bầu không khí và sự rung cảm. Chúng tôi cũng cho phép người dùng xác định các bộ lọc để tìm kiếm của họ có thể nhanh hơn và tập trung hơn.

Một thách thức khác là cách bạn quản lý mức độ liên quan. Hầu hết mọi người sẽ không lướt qua trang kết quả đầu tiên, vì vậy chúng tôi đã dành nhiều thời gian cho việc đó.

Musiio giải quyết vấn đề gì cho khách hàng b2b?

Chúng tôi phục vụ bất cứ ai với một danh mục âm nhạc. Chúng tôi đã xây dựng công nghệ để mở rộng quy mô, cho dù bạn là một nhạc sĩ không có thời gian để gắn thẻ nhạc và muốn tập trung vào việc sáng tạo hay một dịch vụ phát trực tuyến với hàng trăm triệu bản nhạc.

Chúng tôi giúp các hãng thu âm sắp xếp dữ liệu của họ để điều hướng danh mục tốt hơn, chúng tôi giúp các công ty đồng bộ hóa (những người đưa nhạc vào video/TV và phim) khám phá những viên ngọc ẩn và chúng tôi giúp các dịch vụ phát trực tuyến xây dựng danh sách phát tốt hơn. Vấn đề mà tất cả các công ty này gặp phải là việc xử lý âm thanh thủ công bằng cách nghe từng bản nhạc tốn nhiều công sức và khó thực hiện chính xác trong một thời gian dài. Tôi đã gắn thẻ 1000 bản nhạc làm thử nghiệm. Phải mất hai tuần và không vui chút nào. AI của chúng tôi có thể gắn thẻ hàng triệu bản nhạc mỗi ngày với độ chính xác 90-99%.

Với sản phẩm Musiio Search của chúng tôi, chúng tôi cho phép khách hàng B2B của mình cung cấp tính năng tìm kiếm tài liệu tham khảo bằng âm thanh. Nếu nhà sản xuất video đang tìm kiếm vị trí âm nhạc, họ sẽ bắt đầu bằng cách tìm hiểu kỳ vọng của khách hàng về thể loại, tâm trạng, BPM và sau đó tìm kiếm trên trang web họ đã chọn.

Musiio tắt quá trình này với các đối tác cài đặt tìm kiếm của chúng tôi bằng cách cho phép cùng một nhà sản xuất video sử dụng 'bản nhạc tham chiếu' để tìm kiếm toàn bộ cơ sở dữ liệu trong vòng vài giây. Trí tuệ nhân tạo của chúng tôi sẽ quét bản nhạc tham chiếu và trả về âm thanh phù hợp nhất.

Musiio gần đây đã ra mắt sản phẩm NFT Song Slicer, bạn có thể mô tả đây là sản phẩm gì không?

NFT Song Slicer là một nguyên mẫu được thiết kế để giúp các nghệ sĩ nhận được nhiều giá trị hơn từ âm nhạc của họ. Nó sử dụng quy trình do AI điều khiển để tìm các câu luyến láy mong muốn trong một bản nhạc – tối đa ba câu cho mỗi bài hát – và cung cấp mã thời gian để nghệ sĩ có thể tạo các phần bài hát này dưới dạng NFT. Nó cũng có thể thực hiện việc này một cách tự động cho toàn bộ danh mục, giúp các nhãn hiệu và nghệ sĩ có danh mục lớn phía sau dễ dàng tạo nhanh các tài sản kỹ thuật số có thể sưu tập mới.

Một số trường hợp sử dụng tiềm năng cho loại sản phẩm Song Slicer này là gì?

Đối với chủ sở hữu danh mục hoặc nghệ sĩ có danh mục phía sau phong phú, NFT Song Slicer có thể chọn các phần có giá trị nhất trong hàng triệu bài hát mỗi ngày. Ví dụ: các hãng thu âm sau đó có thể biến các lát cắt bài hát này thành NFT và bán chúng dưới dạng hàng hóa kỹ thuật số phiên bản giới hạn.

Với cuộc cách mạng phát trực tuyến, người hâm mộ khó có thể kiếm được một đô la nào từ nghệ sĩ mà họ yêu thích. Chúng tôi xem NFT Song Slicer như một cách để người hâm mộ ủng hộ nghệ sĩ yêu thích của họ và để người hâm mộ sở hữu các bộ sưu tập kỹ thuật số. Mỗi phần cũng có thể được định giá khác nhau bởi một chủ sở hữu quyền. Ví dụ, một đoạn điệp khúc có thể đắt hơn một đoạn thơ.

Và, bởi vì NFT Song Slicer xác định các phần có giá trị nhất của bản nhạc, chúng tôi thấy công nghệ này đưa ra dự đoán giá trị cho NFT và thậm chí toàn bộ danh mục nhạc.

Tầm nhìn của bạn cho tương lai của Musiio là gì?

Tôi nói rằng Musiio là một phần ba của một công ty trị giá hàng tỷ đô la. Để xây dựng công ty đó, bạn cần ba phần. Đầu tiên là quyền truy cập hợp pháp vào khối lượng dữ liệu lớn hoặc “đường ống dẫn”. Phần thứ hai là công nghệ. Đây là chúng tôi, và chúng tôi rất giỏi trong những gì chúng tôi làm. Phần thứ ba và cũng là phần cuối cùng là nhãn: một cách để kiếm tiền từ những gì bạn tìm thấy, tìm kiếm hoặc khám phá. Musiio luôn nỗ lực hướng tới mục tiêu dài hạn này.

Bạn có cảm thấy rằng AI sẽ có thể viết và tạo nhạc trong tương lai gần không?

Tôi khá thẳng thắn về việc không phải là một fan hâm mộ lớn của AI cho sự sáng tạo. Đó là một thử nghiệm học thuật thú vị và có những hệ thống làm được điều đó, nhưng tôi không thấy cần thiết. Musiio hoạt động rất tốt vì không ai muốn gắn thẻ hàng nghìn bài hát mỗi ngày. Nó không thú vị và bạn không cần một người để làm điều đó một cách hiệu quả hoặc nhanh chóng. Nhưng làm nhạc? Tôi không chắc lắm. Không thiếu những người muốn sáng tác nhạc.

Mặc dù vậy, tôi nghĩ rằng chúng ta còn ít nhất 10 đến XNUMX năm nữa mới có âm nhạc hay do AI tạo ra. Tôi đã nghe một số bản nhạc piano do AI tạo ra vào một ngày khác, và thật khó để biết liệu nó được viết bởi AI hay chỉ là một người không thành thạo lắm. Tôi không tin rằng màn trình diễn của AI sẽ không thể phân biệt được với một người chơi thành công.

Và tại sao bạn muốn nó được? Phần lớn điều làm cho âm nhạc trở nên thú vị là truyền thuyết xung quanh một nghệ sĩ, tính cách, phong cách và thông điệp của họ. Nó không chỉ là về âm nhạc.

Có điều gì khác mà bạn muốn chia sẻ về Musiio không?

Tôi rất vui vì Musiio vừa được trao vị trí số 4 trong Fast Company's 10 Công Ty Âm Nhạc Sáng Tạo Nhất Năm 2022. Đội ngũ và công nghệ của chúng tôi đã phát triển từ hạt giống ý tưởng để được quốc tế công nhận cùng với những tên tuổi lớn trong ngành như Hipgnosis và SoundCloud. Đó là sự tôn vinh máu, mồ hôi và nước mắt mà đội ngũ của chúng tôi đã đổ vào các sản phẩm hàng đầu trong ngành của chúng tôi. Chúng tôi rất vui mừng được đứng đầu trong sự giao thoa giữa âm nhạc và công nghệ. Và biết rằng có những trường hợp sử dụng mà chúng tôi thậm chí còn chưa nghĩ tới khiến tôi rất phấn khích về tương lai.

Cảm ơn bạn về cuộc phỏng vấn tuyệt vời, độc giả muốn tìm hiểu thêm hãy truy cập viện bảo tàng.

Một đối tác sáng lập của unity.AI & một thành viên của Hội đồng Công nghệ Forbes, Antoine là một nhà tương lai học người đam mê tương lai của AI và robot.

Ông cũng là người sáng lập của Chứng khoán.io, một trang web tập trung vào đầu tư vào công nghệ đột phá.