Wywiady
Hazel Savage, CEO & Co-Founder of Musiio – Wywiad z serii

Musiio zapewnia narzędzia do analizy, tagowania i wyszukiwania opartych na sztucznej inteligencji dla niektórych z największych na świecie katalogów muzycznych, wśród których znajdują się Sony Music, Hipgnosis, Amanotes, Epidemic Sound i Blanco Y Negro.
Gitarzystka kochająca rock, która została współzałożycielem i CEO, Hazel Savage spędziła 15 lat w branży muzycznej, pracując dla niektórych z największych marek muzycznych na świecie – od układania półek w HMV, po zarządzanie zespołami w firmach na czele słuchania i rekomendacji muzyki, Hazel rozumie potrzeby branży, od muzyka po wielonarodowe korporacje.
Przez 15 lat jesteś w branży muzycznej, co sprawia, że jesteś tak pasjonatem muzyki, i dlaczego chciałeś się zaangażować w branżę muzyczną?
Moi rodzice byli dość rock and roll. Byli ogromnymi fanami muzyki, więc zawsze byłem otoczony muzyką w dorastaniu. Potem, na moje 13. urodziny, dostałem gitarę. Nadal gram i mam pasję do występów na żywo. Więc, gdy próbowałem się zdecydować, co będę robił ze swoim życiem, miało sens skupić się na czymś, na co poświęciłem prawie cały swój czas.
Zrobiłem wiele rzeczy luźno związanych z muzyką. Grałem w zespole. Zarządzałem zespołami. Prowadziłem nocne kluby. Rozdawałem ulotki na inne kluby, prowadziłem listy gości, i zanim się zorientowałem, stało się to moją karierą, chociaż z wyraźnym nachyleniem w stronę technologii.
Czy mógłbyś podzielić się historią powstania Musiio?
Mój pierwszy pracę po ukończeniu studiów było układanie półek w HMV (brytyjskim sklepie z płytami). Można więc powiedzieć, że jestem świadomy problemów z kategoryzowaniem muzyki od samego początku. Przeskoczmy kilka lat do przodu (przez Shazam, Pandora i Universal), i pracowałem dla platformy muzycznej UGC z tysiącami utworów uploadowanych dziennie. Pracowałem z twórcą playlist, który musiał ręcznie zestawić najlepsze utwory do playlist. Słuchał setek utworów dziennie. Niektóre dni miał wystarczająco odpowiedniego materiału na playlistę. Niektóre dni nie. Zacząłem się zastanawiać, czy nie ma sposobu, aby zautomatyzować wyszukiwanie najlepszych utworów dla danej sytuacji. W ten sposób mógłby on użyć swoich umiejętności jako eksperta od muzyki do kuracji, a nie tylko jako filtr dla złej muzyki.
Musiio powstało, gdy spotkałem mojego współzałożyciela Arona Petterssona przez inkubator start-upów Entrepreneur First w Singapurze w 2018 roku. Aron jest geniuszem AI. Gdy rozmawialiśmy o sposobach, w jakie moglibyśmy współpracować, zrealizowaliśmy, że możemy użyć umiejętności Arona w AI, aby rozwiązać problem filtrowania opartego na muzyce, automatycznego tagowania lub wyszukiwania muzyki według gatunków, nastrojów, BPM itp. lub wyszukiwań opartych na odciskach palców. Aron zbudował prototyp algorytmu w ciągu popołudnia, i uruchomiliśmy go na darmowym archiwum muzyki. Wyszedłem na lunch, pozostawiając go do przetworzenia danych. Gdy wróciliśmy, byliśmy zaskoczeni dokładnością wyników. Nie mogliśmy sobie życzyć bardziej udanego dowodu pojęcia. Od tego czasu optymalizowaliśmy algorytm ogromnie. Mamy zespół muzyczny, który pomaga nauczyć AI i prowadzi kontrolę jakości, i wydaliśmy produkty do tagowania, wyszukiwania odniesień audio, tworzenia playlist i nawet wyboru segmentów utworów dla platform takich jak TikTok.
Jakie różne typy algorytmów machine learning są używane?
Zbudowaliśmy własne algorytmy własnościowe, i uważamy to za nasz sekret! Mój współzałożyciel Aron pracował na czele machine learning przez ponad dekadę, pracując w dziedzinach biologii molekularnej, neurologii, fizyki i nawet rozwoju gier. Prowadzi nasz zespół AI. Korzystamy również z dostępnych technologii, takich jak TensorFlow, Kubernetes i Google Cloud Services, aby zapewnić skalowalność i dostarczyć nasze produkty na ogromną skalę, przy naszym największymolum, tagowaliśmy 5 000 000 utworów dziennie! Spędziliśmy również znaczną ilość czasu i wysiłku na usprawnienie naszych workflow w JIRA; to nie tylko o tym, jakie narzędzia używasz, ale jak efektywnie możesz pracować z zespołem deweloperów i ekspertów od muzyki. Połączenie obu zespołów AI i Muzyki jest drugą częścią naszego sekretu.
Jakie są niektóre z wyzwań związanych z budową silnika wyszukiwania dla muzyki?
Szybkość i dokładność to główne wyzwania związane z wyszukiwaniem. Musi to być szybkie, ponieważ ludzie używają go w czasie rzeczywistym. To różni się od tagowania, ponieważ użytkownik często wykonuje wiele zapytań wyszukiwania, ale tagowanie występuje tylko raz.
Istnieją różne rzeczy, które można zrobić, aby przyspieszyć wyszukiwanie. Można po prostu wyświetlić utwory, które mają takie same tagi jak utwór nasion, ale poświęcilibyśmy dokładność. Czyste wyszukiwanie odniesienia audio w katalogu 200 milionów utworów, na przykład, może zająć dużo czasu, więc jesteśmy ciągle w równowadze pomiędzy szybkością a dokładnością i szukamy rozwiązań. To jest trudne i niektóre z nich są ciężko wywalczone, ale to, co mogę podzielić, to to, że konwertujemy pliki audio na spectrogramy, bardzo szczegółowe odciski palców plików audio, i gdy wykonujemy wyszukiwanie odniesienia audio, algorytm analizuje do 1500 punktów danych – znacznie więcej, niż to, co jest możliwe z samymi tagami. I wyłapuje trudne do opisania cechy muzyczne, takie jak jakość wokalna, atmosfera i wibruje. Pozwalamy również użytkownikom na definiowanie filtrów, więc ich wyszukiwania mogą być szybsze i bardziej ukierunkowane.
Innym wyzwaniem jest to, jak zarządza się istotnością. Większość ludzi nie przejdzie poza pierwszą stronę wyników, więc spędziliśmy wiele czasu na tym.
Jakie problemy rozwiązuje Musiio dla klientów B2B?
Obsługujemy każdego, kto ma katalog muzyczny. Zbudowaliśmy technologie, aby skalować, niezależnie od tego, czy jesteś muzykiem, który nie ma czasu na tagowanie muzyki i chce się skoncentrować na tworzeniu, czy usługą streamingową z setkami milionów utworów.
Pomagamy wytwórniom płytowym zorganizować ich dane w celu lepszej nawigacji katalogu, pomagamy firmom sync (które umieszczają muzykę w wideo/TV i filmie) odkryć ukryte perełki, i pomagamy usługom streamingowym tworzyć lepsze playlisty. Problem, z którym borykają się wszystkie te firmy, polega na tym, że przetwarzanie audio ręcznie przez słuchanie każdego utworu jest czasochłonne i trudne do wykonania dokładnie przez dłuższy czas. Otagowałem 1000 utworów jako eksperyment. Zajęło to dwa tygodnie i nie było to zabawne. Nasz AI może otagować miliony utworów dziennie z dokładnością 90-99%.
Z naszym produktem Musiio Search, pozwalamy naszym klientom B2B oferować wyszukiwanie odniesienia audio jako funkcję. Jeśli producent wideo szuka umieszczenia muzyki, zacznie to od zrozumienia oczekiwań klienta dotyczących gatunku, nastroju, BPM, a następnie wyszuka na wybranej stronie.
Musiio skraca ten proces z naszymi partnerami, którzy instalują nasze wyszukiwanie, pozwalając temu samemu producentowi wideo użyć “utworu odniesienia”, aby wyszukać całą bazę danych w ciągu kilku sekund. Nasz AI zeskanuje utwór odniesienia i zwróci najbliższe dopasowania audio.
Musiio niedawno uruchomiło produkt NFT Song Slicer, czy mógłbyś opisać, co to jest?
NFT Song Slicer to prototyp zaprojektowany, aby pomóc artystom uzyskać więcej wartości z ich muzyki. Używa procesu napędzanego przez AI, aby znaleźć pożądane hooki w utworze – do trzech na utwór – i podaje czas, aby artysta mógł wybić te sekcje utworu jako NFT. Może to również zrobić automatycznie dla całych katalogów, ułatwiając labelom i artystom z dużymi katalogami szybkie tworzenie nowych cyfrowych kolekcjonerskich aktywów.
Jakie są niektóre potencjalne przypadki użycia produktu Song Slicer?
Dla właścicieli katalogów lub artystów z obszernym katalogiem, NFT Song Slicer może wybrać najcenniejsze sekcje w milionach utworów dziennie. Wytwórnie, na przykład, mogą następnie przekształcić te sekcje utworów w NFT i sprzedać je jako ograniczone edycje cyfrowych pamiątek.
Z rewolucją streamingową, stało się trudno dla fanów, aby dostać dolara do kieszeni artystów, których kochają. Spójrzmy na NFT Song Slicer jako sposób, w jaki fani mogą wspierać swoich ulubionych artystów, i dla fanów, aby posiadać cyfrowe kolekcje. Każdy kawałek może być również wyceniony inaczej przez posiadacza praw. Na przykład, refren może kosztować więcej niż wers.
I, ponieważ NFT Song Slicer identyfikuje najcenniejsze sekcje utworu, widzimy tę technologię oferującą przewidywania wartości dla NFT i nawet całych katalogów muzycznych.
Jaka jest twoja wizja przyszłości Musiio?
Mówię, że Musiio to jedna trzecia firmy wartej miliard dolarów. Aby zbudować tę firmę, potrzebujesz trzech części. Pierwsza to legalny dostęp do dużych ilości danych, czyli “potok”. Druga część to technologia. To my, i jesteśmy bardzo dobrzy w tym, co robimy. Trzecia i ostatnia część to etykieta: sposób na monetyzację tego, co znajdziesz, wyszukasz lub odkryjesz. Musiio zawsze pracuje nad tym długoterminowym celem.
Czy uważasz, że AI będzie w stanie pisać i generować muzykę w niedalekiej przyszłości?
Jestem dość otwarcie przeciwny AI w kreatywności. To fajny akademicki eksperyment, i istnieją systemy, które to robią, ale po prostu nie widzę potrzeby. Musiio działa tak dobrze, ponieważ nikt nie chce tagować tysięcy utworów dziennie. To nie jest zabawne, i nie potrzebujesz osoby, aby to zrobić skutecznie lub szybko. Ale tworzenie muzyki? Nie jestem tak pewny.
Nawet tak, myślę, że jesteśmy co najmniej 5-10 lat od AI-generowanej muzyki, która brzmi dobrze. Słyszałem niektóre AI-generowane utwory fortepianowe kilka dni temu, i trudno powiedzieć, czy zostały napisane przez AI, czy po prostu przez kogoś, kto nie jest zbyt uzdolniony. Nie jestem przekonany, że AI-wykonanie będzie kiedykolwiek nie do odróżnienia od doświadczonego wykonawcy.
I dlaczego byś tego chciał? Tyle, co sprawia, że muzyka jest interesująca, to lore wokół artysty, jego osobowość, styl i przeszkody. To nie tylko o muzyce.
Czy jest coś jeszcze, co chciałbyś podzielić o Musiio?
Jestem bardzo podekscytowany, że Musiio zostało właśnie nagrodzone 4. miejscem w rankingu Fast Company 10 Najbardziej Innowacyjnych Firm Muzycznych 2022. Nasz zespół i technologia wzrosły od ziarenka pomysłu do uzyskania międzynarodowego uznania obok dużych nazw branżowych, takich jak Hipgnosis i SoundCloud. To hołd dla krwi, potu i łez, które nasz zespół włożył w nasze produkty przodujące w branży. Jesteśmy tak podekscytowani, aby być na szczycie skrzyżowania muzyki i technologii. I wiedząc, że istnieją przypadki użycia, o których jeszcze nie myśleliśmy, sprawia, że jestem bardzo podekscytowany przyszłością.
Dziękuję za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić Musiio.












