Connect with us

Kunstmatige intelligentie

Google heeft de training van deepfakes in Colab verboden

mm

Op een bepaald moment in de afgelopen twee weken heeft Google stilzwijgend de voorwaarden van dienst voor zijn Colab-gebruikers gewijzigd, waarbij een bepaling is toegevoegd dat Colab-diensten niet langer mogen worden gebruikt om deepfakes te trainen.

De update van mei brengt een deepfake-verbod naar Colab. Source: https://research.google.com/colaboratory/faq.html#limitations-and-restrictions

De update van mei brengt een deepfake-verbod naar Colab. Source: https://research.google.com/colaboratory/faq.html#limitations-and-restrictions

De eerste web-gearchiveerde versie van de Internet Archive die het deepfake-verbod bevat, werd opgenomen op de 24e mei. De laatste opgenomen versie van de Colab-FAQ die het verbod niet vermeldt, was op de 14e mei.

Van de twee populaire deepfake-creatie-distributies, DeepFaceLab (DFL) en FaceSwap, die beide forks zijn van de omstreden en anonieme code die in 2017 op Reddit is gepost, lijkt alleen de meer beruchte DFL rechtstreeks door het verbod te zijn getroffen. Volgens deepfake-ontwikkelaar ‘chervonij’ op de DFL Discord, produceert het uitvoeren van de software in Google Colab nu een waarschuwing:

‘U kunt code uitvoeren die niet is toegestaan, en dit kan uw mogelijkheid beperken om Colab in de toekomst te gebruiken. Houd er rekening mee dat de verboden acties zijn gespecificeerd in onze FAQ.’

Echter, interessant genoeg, mag de gebruiker momenteel doorgaan met de uitvoering van de code.

De nieuwe waarschuwing die DFL-deepfakers begroette toen ze probeerden de code uit te voeren op Google Colab. Source: https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136

De nieuwe waarschuwing die DFL-deepfakers begroette toen ze probeerden de code uit te voeren op Google Colab. Source: https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136

Volgens een gebruiker in de Discord voor de rivaliserende distributie FaceSwap, lijkt de code van dat project nog niet de waarschuwing te triggeren, wat suggereert dat de code voor DeepFaceLab (ook de voedingsarchitectuur voor real-time deepfake-streaming-implementatie DeepFaceLive), veruit de meest dominante deepfakes-methode, specifiek door Colab is getarget.

FaceSwap-co-lead-ontwikkelaar Matt Tora merkte op*:

‘Ik vind het zeer onwaarschijnlijk dat Google dit doet om ethische redenen, meer dat de raison d’être van Colab is om studenten/datawetenschappers/onderzoekers in staat te stellen om computatie-intensieve GPU-code uit te voeren op een gemakkelijke en toegankelijke manier, zonder kosten. Echter, ik vermoed dat een niet-onbetekenend aantal gebruikers deze resource exploiteren om deepfake-modellen te creëren, op grote schaal, wat zowel computatie-intensief is als een aanzienlijke hoeveelheid trainings tijd vereist om resultaten te produceren.’

‘Je zou kunnen zeggen dat Colab meer leunt naar de educatieve, onderzoeks kant van AI. Het uitvoeren van scripts die weinig gebruikersinvoer of begrip vereisen, gaat in tegen deze. Bij FaceSwap proberen we ons te focussen op het onderwijzen van de gebruiker in AI en de mechanismen die erbij betrokken zijn, terwijl we de drempel naar toegang verlagen. We moedigen ethisch gebruik van de software aan en vinden dat het beschikbaar stellen van deze soort tools aan een bredere doelgroep mensen onderwijst in termen van wat haalbaar is in de huidige wereld, in plaats van het weg te stoppen voor een selecte groep.’

‘Helaas kunnen we niet controleren hoe onze tools uiteindelijk worden gebruikt, noch waar ze worden uitgevoerd. Het spijt me dat een weg is afgesloten voor mensen om te experimenteren met onze code, echter, in termen van het beschermen van deze specifieke resource om de beschikbaarheid ervan voor het daadwerkelijke doelpubliek te garanderen, vind ik het begrijpelijk.’

Er is geen bewijs dat de nieuwe beperking alleen van toepassing is op de gratis laag van Google Colab – onderaan de lijst met verboden activiteiten waaraan deepfakes nu zijn toegevoegd, staat de opmerking ‘Aanvullende beperkingen bestaan voor betaalde gebruikers’, wat aangeeft dat dit basisregels zijn. Met betrekking tot het deepfake-verbod, heeft dit enkele verwarring veroorzaakt, aangezien ‘cryptocurrency-mijnbouw’ en ‘deelname aan peer-to-peer-bestandsdeling’ zijn opgenomen in zowel de gratis als de pro-‘Beperkingen’-sectie.

Volgens deze logica is alles wat in de gratis ‘Beperkingen’-sectie is verboden, toegestaan in de Pro-versie, zolang de Pro-versie het niet uitdrukkelijk verbiedt, inclusief ‘het uitvoeren van denial-of-service-aanvallen’ en ‘wachtwoordkraken’. De aanvullende beperkingen voor de Pro-laag zijn voornamelijk gericht op het niet ‘onderverhuren’ van pro-Colab-toegang, ondanks de verwarrende en selectieve dubbele verboden.

Google Colab is een gewijd implementatie van Jupyter notebook-omgevingen, die het mogelijk maken om machine learning-projecten op afstand te trainen op veel krachtigere GPUs dan veel gebruikers zich kunnen veroorloven.

Aangezien deepfake-training een VRAM-hongerige onderneming is, en aangezien de komst van de GPU-hongersnood, hebben veel deepfakers in recente jaren thuis training verlaten ten gunste van afstands training in Colab, waar het, afhankelijk van de kans en laag, mogelijk is om een deepfake-model te trainen op krachtige kaarten zoals de Tesla T4 (16GB VRAM, momenteel rond de $2k USD), de V100 (32GB VRAM, rond de $4k USD), en de machtige A100 (80GB VRAM, MSRP van $32.097,00), onder andere.

Het verbod op Colab-training lijkt waarschijnlijk de pool van deepfakers te verkleinen die in staat zijn om hogeresolutie-modellen te trainen, waar de invoer- en uitvoer-afbeeldingen groter zijn, meer geschikt voor hoogresolutie-resultaten, en in staat zijn om meer gezichtsdetails te extraheren en te reproduceren.

Sommige van de meest toegewijde deepfake-hobbyisten en -enthousiasten, volgens Discord- en forumberichten, hebben in de afgelopen paar jaar veel geïnvesteerd in lokale hardware, ondanks de hoge prijzen van GPUs.

Echter, gezien de hoge kosten die hiermee gemoeid zijn, zijn subgemeenschappen ontstaan om de uitdagingen van het trainen van deepfakes op Colabs aan te pakken, waarbij de meest voorkomende klacht de willekeurige GPU-toewijzing is, sinds Colab het gebruik van hogere-end GPUs voor gratis gebruikers heeft beperkt.

 

* In privéberichten op Discord

Publicatie 28 mei 2022.
Herzien 7:28 AM EST, correctie van quote-typfout.
Herzien 12:40 PM EST – toegevoegde verduidelijking met betrekking tot gratis en pro-laag deepfake-verbod, voor zover dit kan worden begrepen uit de ‘gratis’ en ‘pro’-lijsten van verboden.

Schrijver over machine learning, domeinspecialist in menselijke beeldsynthese. Voormalig hoofd onderzoekscontent bij Metaphysic.ai.