Følg os

Kunstig intelligens

Google afslører AI-musikmodel, der skaber musik hurtigere end afspilning

mm

Forestil dig dette: En musiker sidder ved sin computer og komponerer ikke note for note, men styrer en AI-samarbejdspartner gennem en liveoptræden – han ændrer genrer, blander instrumenter og udforsker lydterritorier, der findes mellem etablerede musikalske stilarter. Dette sker nu med Googles Magenta RealTime (RT), en open source-model, der bringer realtidsinteraktivitet til AI-musikgenerering.

Magenta RT, der netop er udgivet, tvinger os til at ændre vores opfattelse af musik genereret af kunstig intelligens. I modsætning til tidligere modeller, der krævede, at brugerne ventede på, at komplette numre skulle gengives, genererer Magenta RT musik hurtigere, end den afspilles, hvilket muliggør ægte interaktion i realtid. For musikbranchen – der allerede kæmper med kunstig intelligens' forstyrrende indflydelse – åbner denne teknologi døre for helt nye former for kreativ udtryk, samtidig med at den rejser dybe spørgsmål om forfatterskab, performance og fremtiden for menneskelig musikalitet.

ForstĂĄelse af Magenta RealTime

I sin kerne er Magenta RT en autoregressiv transformermodel med 800 millioner parametre, men det, der adskiller den, er dens tilgang til udfordringen med realtidsgenerering. Modellen genererer kontinuerlige musikstrømme i 2-sekunders bidder, der hver især er betinget af de foregående 10 sekunders lydoutput og en dynamisk justerbar stilintegrering. Denne arkitektur giver musikere mulighed for at manipulere stilintegreringen i realtid og effektivt styre det musikalske output, mens det udfolder sig.

Den tekniske præstation her kan ikke overvurderes. På en gratis Google Colab TPU genererer Magenta RT 2 sekunders lyd på bare 1.25 sekunder – en realtidsfaktor på 1.6. Denne hastighed er muliggjort gennem flere innovationer:

  • Bloker autoregressionI stedet for at generere hele spor pĂĄ Ă©n gang, arbejder modellen i smĂĄ, hĂĄndterbare bidder, der kan behandles hurtigt.
  • SpectroStream CodecEn efterfølger til SoundStream, der muliggør hi-fi 48kHz stereolyd
  • MusicCoCa-indlejringerEn ny fælles model for indlejring af musik og tekst, der giver semantisk kontrol over genereringsprocessen.

Det, der gør dette særligt imponerende, er, at i modsætning til API-baserede løsninger eller batchorienterede generationsmodeller understøtter Magenta RT streamingsyntese med en fremadrettet realtidsfaktor større end 1. Det betyder, at modellen faktisk kan komme foran afspilningen og skabe en buffer, der sikrer en jævn og uafbrudt musikalsk strømning.

Magenta RealTime Colab Eksempel

Fra passiv generering til aktiv ydeevne

Implikationerne af realtidsgenerering af AI-musik rækker langt ud over de tekniske specifikationer. Som Magenta-teamet bemærker: "Live interaktion kræver mere af spilleren, men kan tilbyde mere til gengæld. Den kontinuerlige perception-handling-løkke mellem mennesket og modellen giver adgang til en kreativ flowtilstand, der centrerer oplevelsen omkring glæden ved processen frem for det endelige produkt."

Dette skift fra passiv til aktiv engagement adresserer en af ​​de primære kritikpunkter af AI-genereret indhold: dets potentiale til at oversvømme markedet med sjælløs, masseproduceret musik. Realtidsmodeller "undgår naturligvis at skabe en syndflod af passivt indhold, fordi de i sagens natur balancerer lytning med generering i et 1:1-forhold". Hvert øjeblik af skabt musik kræver et øjeblik med menneskelig opmærksomhed og beslutningstagning.

Overvej de muligheder, dette ĂĄbner op for:

  • Live forestillingDJ's og elektroniske musikere kan integrere AI som et responsivt instrument i deres sæt, hvilket bidrager til det voksende værktøjssæt af AI-værktøjer til musikere der forbedrer snarere end erstatter menneskelig kreativitet
  • Interaktive installationerKunstnere kan skabe miljøer, hvor musikken reagerer pĂĄ publikumsbevægelser eller miljømæssige faktorer
  • UddannelsesværktøjerStuderende kan udforske musikalske koncepter gennem øjeblikkelig, hĂĄndgribelig feedback
  • Spil-soundtracksDynamiske scores, der tilpasser sig spillerens handlinger i realtid

Disruption og muligheder

Musikbranchen står ved en skillevej. Omsætningen i musikbranchen forventes at stige med 17.2%, delvist drevet af AI-genereret musik., hvor det globale AI-musikmarked var vurderet til 2.9 milliarder dollars i 2024. Alligevel kommer denne vækst med betydelige bekymringer fra kunstnere og branchefolk.

Forskning fra Goldmedia forudsiger, at musikere uden ordentlige kompensationssystemer kan miste op til 27 % af deres omsætning inden 2028 i takt med at AI-genereret indhold vokser. Frygten er håndgribelig – vil AI erstatte menneskelige musikere? Vil værdien af ​​menneskelig kreativitet blive forringet i en verden, hvor alle kan generere professionelt klingende musik?

Magenta RT tilbyder et nuanceret svar på disse bekymringer. Ved at positionere sig selv som et open source-værktøj, der forbedrer snarere end erstatter menneskelig kreativitet, giver det en model for, hvordan AI og musikere kan sameksistere. Kravet om menneskelig input i realtid sikrer, at teknologien forstærker menneskelig kreativitet snarere end at fungere autonomt.

Demokratisering vs. devaluering

En af de mest betydningsfulde virkninger af Magenta RT er dens potentiale til at demokratisere musikproduktion. Modellen er designet til i sidste ende at køre på forbrugerhardware og er allerede funktionel på gratis Colab TPU'er. Denne tilgængelighed betyder, at håbefulde musikere uden dyrt udstyr eller formel uddannelse kan eksperimentere med komplekse musikalske ideer og dermed slutte sig til det voksende økosystem af AI musik generatorer som transformerer kreative arbejdsgange.

Denne demokratisering indebærer dog risici. komponisten Mark Henry Phillips bemærker i sine eksperimenter med AI-musikgenerering, mistænker han, at han "snart ikke længere vil kunne tjene til livets ophold som musiker, da virksomheder begynder at bruge teknologien direkte selv". Den lethed, hvormed AI kan generere musik i kommerciel kvalitet, truer traditionelle indtægtsstrømme for professionelle musikere.

Der er dog et andet perspektiv at overveje. Ligesom digital fotografering ikke eliminerede professionelle fotografer, men ændrede karakteren af ​​deres arbejde, kan AI-musikgenerering omforme snarere end erstatte musikalske karrierer. Nøglen ligger i, hvordan musikere tilpasser og integrerer disse værktøjer i deres kreative proces.

Fremkomsten af ​​realtidsgenerering af AI-musik bringer også presserende etiske spørgsmål i forgrunden. Ophavsret, ejerskab og fair kompensation er fortsat omstridte emner. 90 % af musikere mener, at AI-virksomheder bør bede om tilladelse, før de bruger ophavsretligt beskyttet musik til træning, hvilket fremhæver spændingen mellem teknologisk innovation og kunstneriske rettigheder.

Magenta RTs open source-tilgang tilbyder en potentiel vej fremad. Ved at gøre teknologien frit tilgængelig og træne den på cirka 190,000 timers instrumentalmusik fra flere kilder har Google forsøgt at omgå nogle ophavsretlige bekymringer, samtidig med at de stadig producerer en funktionel model.

Modellens begrænsninger afspejler også etiske overvejelser. Selvom Magenta RT er i stand til at generere ikke-leksikalske vokaliseringer og summen, er den ikke betinget af sangtekster og genererer sandsynligvis ikke faktiske ord. Dette designvalg hjælper med at undgå potentielle problemer med at generere upassende tekstindhold, mens værktøjet fokuserer på instrumental komposition.

Fremtiden for musikalsk samarbejde mellem mennesker og kunstig intelligens

Idet vi står på tærsklen til denne nye æra inden for musikskabelse, er der flere tendenser, der dukker op:

  1. Hybride skabelsesmodellerI stedet for at erstatte musikere bliver værktøjer som Magenta RT samarbejdspartnere. Nylige udviklinger inden for beat tracking-systemer med nul latenstid og forbedret kontrollerbarhed vise, hvordan AI kan synkronisere med menneskelige kunstnere i realtid.
  2. Nye præstationsparadigmerKonceptet med at "optræde" med AI åbner helt nye kunstneriske muligheder. Musikere lærer at "spille" på disse systemer som instrumenter, udvikler teknikker til at lokke specifikke lyde frem og navigere i latente musikalske rum.
  3. Uddannelsesrevolutionen: AI-musikgenereringsteknologi har revolutioneret musikundervisning, med platforme, der tilbyder interaktive oplevelser, der lytter til brugernes præstationer og giver øjeblikkelig feedback.Teknisk konvergensMed innovationer inden for neurale lydkodeker og optimerede arkitekturer, værktøjer som MusicFX DJ kan nu streame 48kHz stereolyd i produktionskvalitet i realtid, hvilket bringer AI-genereret musik til professionelle kvalitetsstandarder.

Omfavn den kollaborative fremtid

Magenta RealTime giver et glimt ind i en fremtid, hvor grænserne mellem menneskelig og maskines kreativitet bliver mere og mere flydende. Ved at kræve menneskelig input i realtid og fokusere på processen snarere end blot outputtet, tilbyder den en model for AI, der forbedrer snarere end erstatter menneskelig kreativitet.

Teknologiens open source-natur og tilgængelighed på forbrugerhardware demokratiserer musikskabelse, mens dens realtidsbegrænsninger sikrer, at menneskelig handlekraft forbliver central for den kreative proces. Som Magenta-teamet understreger, har det altid været kernen i deres mission at forbedre menneskelig kreativitet – ikke at erstatte den.

For musikere, producere og musikelskere er budskabet klart: Musikkens fremtid ligger ikke i at vælge mellem menneskelig eller kunstig intelligens-skabelse, men i at udforske de enorme kreative muligheder, der opstår, når de to arbejder sammen i realtid. Magenta RT er en invitation til at gentænke, hvad musikskabelse kan være i kunstig intelligens' tidsalder.

I takt med at vi bevæger os fremad, må musikbranchen kæmpe med vigtige spørgsmål om fair kompensation, ophavsret og værdien af ​​menneskelig kreativitet. Men hvis værktøjer som Magenta RT er nogen indikation, vil musikkens fremtid være præget af samarbejde, eksperimentering og nye udtryksformer, som vi kun lige er begyndt at forestille os.

Alex McFarland er en AI-journalist og forfatter, der udforsker den seneste udvikling inden for kunstig intelligens. Han har samarbejdet med adskillige AI-startups og publikationer verden over.