Andersons vinkel
Google har forbudt træning af deepfakes i Colab

Inden for de sidste to uger har Google stille og roligt ændret betingelserne for brug af Colab, så det nu er forbudt at bruge tjenesten til at træne deepfakes.

Maj-opdateringen bringer et forbud mod deepfake-træning til Colab. Kilde: https://research.google.com/colaboratory/faq.html#limitations-and-restrictions
Den første web-arkiverede version fra Internet Archive, der indeholder forbuddet mod deepfakes, blev fanget sidste tirsdag, den 24. maj. Den sidste fanget version af Colab-FAQ, der ikke nævner forbuddet, var fra den 14. maj.
Af de to populære deepfake- distributions, DeepFaceLab (DFL) og FaceSwap, der begge er forks af den kontroversielle og anonyme kode, der blev lagt ud på Reddit i 2017, synes kun den mere berygtede DFL at være direkte mål for forbuddet. Ifølge deepfake-udvikler ‘chervonij’ på DFL-discord, giver kørsel af softwaren i Google Colab nu en advarsel:
‘Du kan være i gang med at køre kode, der ikke er tilladt, og dette kan begrænse din evne til at bruge Colab i fremtiden. Venligst læs de forbudte handlinger, der er specificeret i vores FAQ.’
Men interessant nok er brugeren stadig tilladt at fortsætte med at køre koden.

Den nye advarsel, der mødte DFL-deepfakers, der forsøgte at køre koden på Google Colab. Kilde: https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136
Ifølge en bruger på Discord for den rivaliserende distribution FaceSwap, synes projektets kode ikke at udløse advarslen, hvilket antyder, at koden for DeepFaceLab (der også er arkitekturen for real-time deepfake-streaming-implementering DeepFaceLive), der er den mest dominerende deepfakes-metode, er specifikt mål for Colab.
FaceSwap-co-lead-udvikler Matt Tora kommenterede*:
‘Jeg finder det meget usandsynligt, at Google gør dette af ethiske grunde, men mere fordi Colabs formål er at give studerende/datavidenskabsmænd/forskere mulighed for at køre beregningskrævende GPU-kode på en let og tilgængelig måde, uden omkostninger. Men jeg formoder, at en ikke ubetydelig mængde brugere udnytter denne ressource til at oprette deepfake-modeller i stor målestok, hvilket er både beregningskrævende og tager en ikke ubetydelig mængde træningstid at producere resultater.’
‘Man kunne sige, at Colab læner mere mod den uddannelsesmæssige, forskningsmæssige side af AI. Kørsel af scripts, der kræver lidt brugerinput eller forståelse, går mod denne tendens. Hos FaceSwap forsøger vi at fokusere på at uddanne brugeren i AI og de mekanismer, der er involveret, samtidig med at vi sænker barrieren for indgang. Vi opmuntrer stærkt til etisk brug af softwaren og mener, at det hjælper med at uddanne folk om, hvad der er muligt i dagens verden, snarere end at holde det skjult for en udvalgt få.’
‘Desværre kan vi ikke kontrollere, hvordan vores værktøjer ultimate bruges, eller hvor de køres. Det bedrøver mig, at en vej er lukket for folk til at eksperimentere med vores kode, men i forhold til at beskytte denne ressource for at sikre dens tilgængelighed for den faktiske målgruppe, finder jeg det forståeligt.’
Der er intet bevis for, at den nye begrænsning kun gælder den gratis version af Google Colab – ved bunden af listen over forbudte handlinger, som deepfakes nu er tilføjet, står der ‘Yderligere begrænsninger findes for betalende brugere’, hvilket antyder, at disse er basisregler. I forhold til deepfakes-forbuddet har dette forvirret nogle, da ‘kryptovaluta-udvinding’ og ‘deltagelse i peer-to-peer-fildeling’ er inkluderet i både den gratis og pro-version af ‘Begrænsninger’-sektionen.
Ifølge denne logik er alt, der er forbudt i den gratis ‘Begrænsninger’-sektion, tilladt i Pro-versionen, så længe Pro-versionen ikke udtrykkeligt forbudder det, herunder ‘kørsel af afvisningsangreb’ og ‘adgangskode-knækning’. De yderligere begrænsninger for Pro-niveauet er primært beskæftiget med ikke at ‘underleje’ Pro-Colab-adgang, på trods af de forvirrende og selektive duplikate forbud.
Google Colab er en dedikeret implementering af Jupyter-notebook-miljøer, der giver mulighed for fjerntræning af maskinlæringsprojekter på langt kraftigere GPU’er, end mange brugere kan betale for.
Siden deepfake-træning er en VRAM-sulten forfølgelse, og siden begyndelsen af GPU-mangelen, har mange deepfakers i de seneste år valgt at undgå hjemmetræning til fordel for fjerntræning i Colab, hvor det er muligt, afhængigt af chance og niveau, at træne en deepfake-model på kraftige kort som Tesla T4 (16GB VRAM, omkring 2.000 USD), V100 (32GB VRAM, omkring 4.000 USD) og den mægtige A100 (80GB VRAM, MSRP på 32.097,00 USD), blandt andre.
Forbuddet mod Colab-træning synes sandsynligt at reducere poolen af deepfakers, der kan træne højopløsningsmodeller, hvor input- og output-billeder er større, mere egnede til højopløsningsresultater og i stand til at udtrække og reproducere større ansigtsdetaljer.
Nogle af de mest dedikerede deepfake-hobbyister og entusiaster, ifølge Discord- og forum-indlæg, har investeret kraftigt i lokal hardware i de sidste par år, på trods af de høje priser på GPU’er.
Men på grund af de høje omkostninger er undergrupper opstået for at tackle udfordringerne ved at træne deepfakes på Colabs, med tilfældig GPU-allokering som det mest almindelige klagepunkt, siden Colab begrænsede brugen af højendegradede GPU’er til gratis brugere.
* I private beskeder på Discord
Først publiceret den 28. maj 2022.
Revideret kl. 7:28, korrektion af citat-typografi.
Revideret kl. 12:40 – tilføjet klarificering omkring gratis og pro-niveau deepfake-forbud, så vidt det kan forstås fra ‘gratis’ og ‘pro’-lister over forbud.












