Verbinding met ons

Google onthul KI-musiekmodel wat vinniger as terugspeel skep

Kunsmatige Intelligensie

Google onthul KI-musiekmodel wat vinniger as terugspeel skep

Stel jou dit voor: 'n Musikant sit by hul rekenaar en komponeer nie noot vir noot nie, maar stuur 'n KI-medewerker deur 'n lewendige optrede – hy verander genres, meng instrumente en verken klankgebiede wat tussen gevestigde musiekstyle bestaan. Dit gebeur nou met Google se Magenta RealTime (RT), 'n oopbronmodel wat intydse interaktiwiteit na KI-musiekgenerering bring.

Magenta RT, wat pas vrygestel is, dwing ons om ons denke oor KI-gegenereerde musiek te verander. Anders as vorige modelle wat vereis het dat gebruikers moes wag vir volledige snitte om weer te gee, genereer Magenta RT musiek vinniger as wat dit terugspeel, wat ware interaksie intyds moontlik maak. Vir die musiekbedryf – wat reeds worstel met KI se ontwrigtende invloed – maak hierdie tegnologie deure oop vir heeltemal nuwe vorme van kreatiewe uitdrukking terwyl dit diepgaande vrae oor outeurskap, uitvoering en die toekoms van menslike musikantskap laat ontstaan.

Verstaan ​​Magenta RealTime

In sy kern is Magenta RT 'n outoregressiewe transformatormodel met 800 miljoen parameters, maar wat dit onderskei, is die benadering tot die uitdaging van intydse generering. Die model genereer deurlopende musiekstrome in 2-sekonde-blokke, elk gekondisioneer op die vorige 10 sekondes van klankuitset en 'n dinamies verstelbare stylinbedding. Hierdie argitektuur laat musikante toe om die stylinbedding intyds te manipuleer en die musikale uitset effektief te stuur soos dit ontvou.

Die tegniese prestasie hier kan nie oorskat word nie. Op 'n gratis Google Colab TPU genereer Magenta RT 2 sekondes oudio in slegs 1.25 sekondes – 'n intydse faktor van 1.6. Hierdie spoed word moontlik gemaak deur verskeie innovasies:

  • Blok outoregressieEerder as om hele bane gelyktydig te genereer, werk die model in klein, hanteerbare stukke wat vinnig verwerk kan word.
  • SpectroStream-kodek'n Opvolger van SoundStream wat hoë-trou 48kHz stereo-klank moontlik maak
  • MusicCoCa-inbeddings'n Nuwe gesamentlike musiek-teks inbeddingsmodel wat semantiese beheer oor die genereringsproses moontlik maak.

Wat dit veral indrukwekkend maak, is dat Magenta RT, anders as API-gebaseerde oplossings of bondelgeoriënteerde generasiemodelle, stroomsintese met 'n voorwaartse intydse faktor groter as 1 ondersteun. Dit beteken dat die model eintlik voor kan kom op terugspeel, wat 'n buffer skep wat gladde, ononderbroke musikale vloei verseker.

Magenta RealTime Colab Voorbeeld

Van Passiewe Generasie tot Aktiewe Prestasie

Die implikasies van intydse KI-musiekgenerering strek veel verder as tegniese spesifikasies. Soos die Magenta-span opmerk: "Regstreekse interaksie vereis meer van die speler, maar kan meer in ruil daarvoor bied. Die deurlopende persepsie-aksie-lus tussen die mens en die model bied toegang tot 'n kreatiewe vloei-toestand, wat die ervaring op die vreugde van die proses bo die finale produk fokus."

Hierdie verskuiwing van passiewe na aktiewe betrokkenheid spreek een van die primêre kritiekpunte teen KI-gegenereerde inhoud aan: die potensiaal daarvan om die mark te oorstroom met siellose, massa-geproduseerde musiek. Intydse modelle "vermy natuurlik die skep van 'n vloedgolf van passiewe inhoud, want hulle balanseer intrinsiek luister met generering in 'n 1:1-verhouding". Elke oomblik van musiek wat geskep word, vereis 'n oomblik van menslike aandag en besluitneming.

Oorweeg die moontlikhede wat dit bied:

  • Lewendige optredeDJ's en elektroniese musikante kan KI as 'n responsiewe instrument in hul stelle inkorporeer, wat bydra tot die groeiende gereedskapskis van KI-gereedskap vir musikante wat menslike kreatiwiteit verbeter eerder as vervang
  • Interaktiewe InstallasiesKunstenaars kan omgewings skep waar musiek reageer op gehoorbewegings of omgewingsfaktore
  • Opvoedkundige gereedskapStudente kan musikale konsepte verken deur middel van onmiddellike, tasbare terugvoer
  • SpelklankbaneDinamiese tellings wat intyds by spelersaksies aanpas

Ontwrigting en Geleentheid

Die musiekbedryf staan ​​by 'n kruispad. Inkomste in die musiekbedryf sal na verwagting met 17.2% toeneem, deels gedryf deur KI-gegenereerde musiek., met die wêreldwye KI-musiekmark wat in 2.9 op $2024 miljard werd was. Tog kom hierdie groei met beduidende kommer van kunstenaars en bedryfspersoneel.

Navorsing deur Goldmedia voorspel dat musikante sonder behoorlike vergoedingstelsels tot 27% van hul inkomste teen 2028 kan verloor namate KI-gegenereerde inhoud toeneem. Die vrees is tasbaar – sal KI menslike musikante vervang? Sal die waarde van menslike kreatiwiteit verminder word in 'n wêreld waar enigiemand professioneel klinkende musiek kan genereer?

Magenta RT bied 'n genuanseerde antwoord op hierdie bekommernisse. Deur homself te posisioneer as 'n oopbron-instrument wat menslike kreatiwiteit verbeter eerder as vervang, bied dit 'n model vir hoe KI en musikante kan saambestaan. Die vereiste vir intydse menslike insette verseker dat die tegnologie menslike kreatiwiteit versterk eerder as om outonoom te funksioneer.

Demokratisering teenoor Devaluasie

Een van die belangrikste impakte van Magenta RT is die potensiaal daarvan om musiekskepping te demokratiseer. Die model is ontwerp om uiteindelik op verbruikershardeware te werk en is reeds funksioneel op vrye Colab TPU's. Hierdie toeganklikheid beteken dat aspirant-musikante sonder duur toerusting of formele opleiding met komplekse musikale idees kan eksperimenteer en by die groeiende ekosisteem van ... kan aansluit. KI musiek kragopwekkers wat kreatiewe werkstrome transformeer.

Hierdie demokratisering kom egter met risiko's. komponis Mark Henry Phillips merk op in sy eksperimente met KI-musiekgenerering, vermoed hy dat hy “binnekort nie meer as musikant ’n bestaan ​​sal kan maak nie, aangesien maatskappye die tegnologie self direk begin gebruik”. Die gemak waarmee KI musiek van kommersiële gehalte kan genereer, bedreig tradisionele inkomstestrome vir professionele musikante.

Tog is daar nog 'n perspektief om te oorweeg. Net soos digitale fotografie nie professionele fotograwe uitgeskakel het nie, maar die aard van hul werk verander het, kan KI-musiekgenerering musikale loopbane hervorm eerder as vervang. Die sleutel lê in hoe musikante hierdie gereedskap aanpas en integreer in hul kreatiewe proses.

Die opkoms van intydse KI-musiekgenerering bring ook dringende etiese vrae na vore. Kopiereg, eienaarskap en billike vergoeding bly omstrede kwessies. 90% van musikante glo dat KI-maatskappye toestemming moet vra voordat hulle kopieregmusiek vir opleiding gebruik, wat die spanning tussen tegnologiese innovasie en artistieke regte beklemtoon.

Magenta RT se oopbronbenadering bied een potensiële pad vorentoe. Deur die tegnologie vrylik beskikbaar te stel en dit op ongeveer 190,000 XNUMX uur instrumentale voorraadmusiek uit verskeie bronne te oefen, het Google probeer om sommige kopieregkwessies te omseil terwyl hulle steeds 'n bekwame model vervaardig.

Die model se beperkings weerspieël ook etiese oorwegings. Alhoewel dit in staat is om nie-leksikale vokalisasies en neurie te genereer, is Magenta RT nie gekondisioneer op lirieke nie en is dit onwaarskynlik dat dit werklike woorde sal genereer. Hierdie ontwerpkeuse help om potensiële probleme met die generering van onvanpaste liriese inhoud te vermy terwyl die instrument op instrumentale komposisie gefokus word.

Die Toekoms van Mens-KI Musikale Samewerking

Terwyl ons op die rand van hierdie nuwe era in musiekskepping staan, is daar verskeie tendense wat na vore kom:

  1. Hibriede SkeppingsmodelleEerder as om musikante te vervang, word gereedskap soos Magenta RT medewerkers. Onlangse ontwikkelings in maatopsporingstelsels met nul latensie en verbeterde beheerbaarheid wys hoe KI intyds met menslike kunstenaars kan sinchroniseer.
  2. Nuwe PrestasieparadigmasDie konsep van "uitvoering" met KI bied heeltemal nuwe artistieke moontlikhede. Musikante leer om hierdie stelsels soos instrumente te "speel", ontwikkel tegnieke om spesifieke klanke te lok en deur latente musikale ruimtes te navigeer.
  3. Opvoedkundige Revolusie: KI-musiekgenereringstegnologie het musiekonderrig gerevolusioneer, met platforms wat interaktiewe ervarings bied wat na gebruikers se prestasies luister en onmiddellike terugvoer bied.Tegniese KonvergensieMet innovasies in neurale klankkodeke en geoptimaliseerde argitekture, gereedskap soos MusicFX DJ kan nou produksiekwaliteit 48kHz stereo-klank intyds stroom, wat KI-gegenereerde musiek na professionele kwaliteitsstandaarde bring.

Omhels die Samewerkende Toekoms

Magenta RealTime bied 'n kykie na 'n toekoms waar die grense tussen menslike en masjienkreatiwiteit toenemend vloeibaar word. Deur intydse menslike insette te vereis en op die proses te fokus eerder as net die uitset, bied dit 'n model vir KI wat menslike kreatiwiteit verbeter eerder as vervang.

Die tegnologie se oopbron-aard en toeganklikheid op verbruikershardeware demokratiseer musiekskepping, terwyl die intydse beperkings verseker dat menslike agentskap sentraal tot die kreatiewe proses bly. Soos die Magenta-span beklemtoon, was die verbetering van menslike kreatiwiteit – nie die vervanging daarvan nie – nog altyd die kern van hul missie.

Vir musikante, vervaardigers en musiekliefhebbers is die boodskap duidelik: die toekoms van musiek lê nie in die keuse tussen menslike of KI-skepping nie, maar in die verkenning van die ontsaglike kreatiewe moontlikhede wat ontstaan ​​wanneer die twee intyds saamwerk. Magenta RT is 'n uitnodiging om te herverbeel wat musiekskepping in die era van KI kan wees.

Soos ons vorentoe beweeg, moet die musiekbedryf worstel met belangrike vrae oor billike vergoeding, kopiereg en die waarde van menslike kreatiwiteit. Maar as gereedskap soos Magenta RT enige aanduiding is, sal die toekoms van musiek een van samewerking, eksperimentering en nuwe vorme van uitdrukking wees wat ons nou eers begin verbeel.

Alex McFarland is 'n KI-joernalis en skrywer wat die jongste ontwikkelings in kunsmatige intelligensie ondersoek. Hy het wêreldwyd met talle KI-opstarters en publikasies saamgewerk.