Inteligência artificial

Google baniu treinamento de deepfakes no Colab

Publicado 28 de maio de 2022

Atualização do 9 de dezembro de 2022

Martin Anderson

Em algum momento nas últimas duas semanas, o Google alterou discretamente os termos de serviço para seus usuários do Colab, acrescentando uma estipulação de que os serviços do Colab não podem mais ser usados para treinar deepfakes.

A atualização de maio traz uma proibição de deepfake para o Colab. Fonte: https://research.google.com/colaboratory/faq.html#limitations-and-restrictions

A primeira versão arquivada na web do Internet Archive que apresenta a proibição do deepfake foi capturada na última terça-feira, dia 24 de maio. A última versão capturada do Colab FAQ que não não mencione que a proibição foi sobre o 14 Maio.

Das duas distribuições populares de criação de deepfake, DeepFace Lab (DFL) e Troca de rosto, sendo que ambos são bifurcações do código controverso e anônimo postado no Reddit em 2017, só que mais notório O DFL parece ter sido alvo direto da proibição. De acordo com o desenvolvedor de deepfakes 'chervonij' no Discord do DFL, o software está sendo executado no Google Colab agora. produz um aviso:

Você pode estar executando código não permitido, o que pode restringir sua capacidade de usar o Colab no futuro. Observe as ações proibidas especificadas em nossas Perguntas Frequentes.

No entanto, curiosamente, o usuário está atualmente autorizado a continuar com a execução do código.

O novo aviso que recebeu os deepfakers do DFL tentando executar o código no Google Colab. Fonte: https://discord.com/channels/797172242697682985/797391052042010654/979823182624219136

De acordo com um usuário no Discord para a distribuição rival FaceSwap, o código desse projeto aparentemente ainda não aciona o aviso, sugerindo que o código para DeepFaceLab (também a arquitetura de alimentação para implementação de streaming deepfake em tempo real) DeepFace Live), de longe o método deepfakes mais dominante, foi especificamente visado pelo Colab.

O desenvolvedor co-líder do FaceSwap, Matt Tora, comentou*:

"Acho muito improvável que o Google esteja fazendo isso por qualquer razão ética específica, mas sim que a razão de ser do Colab é que estudantes/cientistas de dados/pesquisadores possam executar código de GPU computacionalmente caro de forma fácil e acessível, gratuitamente. No entanto, suspeito que uma quantidade considerável de usuários esteja explorando esse recurso para criar modelos deepfake em escala, o que é computacionalmente caro e exige um tempo considerável de treinamento para produzir resultados."

Pode-se dizer que o Colab se inclina mais para o lado educacional e de pesquisa da IA. Executar scripts que exigem pouca intervenção do usuário, nem mesmo compreensão, tende a ir contra isso. Na Faceswap, buscamos nos concentrar em educar o usuário sobre IA e os mecanismos envolvidos, ao mesmo tempo em que reduzimos as barreiras de entrada. Incentivamos fortemente o uso ético do software e acreditamos que disponibilizar esse tipo de ferramenta para um público mais amplo ajuda a educar as pessoas sobre o que é possível alcançar no mundo atual, em vez de mantê-lo oculto para alguns poucos selecionados.

Infelizmente, não podemos controlar como nossas ferramentas são usadas, nem onde são executadas. É triste que uma oportunidade tenha sido fechada para que as pessoas experimentem nosso código. No entanto, em termos de proteger este recurso específico para garantir sua disponibilidade para o público-alvo real, acho isso compreensível.

Não há evidências de que a nova restrição se limite apenas ao nível gratuito do Google Colab – no final da lista de atividades proibidas às quais os deepfakes foram adicionados agora, está a nota 'Existem restrições adicionais para usuários pagos', indicando que estes são regulamentos de linha de base. Em relação à proibição de deepfakes, isso tem confundido alguns, já que 'mineração de criptomoedas' e 'envolvendo-se no compartilhamento de arquivos ponto a ponto' estão incluídos nas seções 'Restrições' gratuitas e profissionais.

Por essa lógica, tudo o que é proibido na seção gratuita 'Restrições' é permitido na versão Pro, desde que a versão Pro não o proíba explicitamente, incluindo 'executando ataques de negação de serviço'e 'quebra de senha'. As restrições adicionais para o nível Pro estão principalmente relacionadas a não "sublocar" o acesso ao Pro Colab, apesar das proibições duplicadas confusas e seletivas.

O Google Colab é uma implementação dedicada de Caderno Jupyter ambientes, que permitem o treinamento remoto de projetos de aprendizado de máquina em GPUs muito mais poderosas do que muitos usuários podem pagar.

Como o treinamento deepfake é uma atividade que exige muita VRAM, e desde o advento da escassez de GPU, muitos deepfakers nos últimos anos têm evitado o treinamento em casa em favor do treinamento remoto no Colab, onde é possível, dependendo da chance e do nível, treinar um modelo deepfake em placas poderosas como a Tesla T4 (16 GB VRAM, atualmente em torno de $ 2k USD), o V100 (32 GB VRAM, cerca de $ 4k USD) e o poderoso A100 (80 GB VRAM, MSRP de $ 32,097.00), entre outros.

A proibição do treinamento do Colab provavelmente reduzirá o pool de deepfakers capazes de treinar modelos de alta resolução, onde as imagens de entrada e saída são maiores, mais adequadas a resultados de alta resolução e capazes de extrair e reproduzir maiores detalhes faciais.

Alguns dos entusiastas e entusiastas do deepfake mais comprometidos, de acordo com o Discord e as postagens do fórum, investiram pesadamente em hardware local nos últimos dois anos, apesar dos altos preços das GPUs.

No entanto, dados os altos custos envolvidos, subcomunidades surgiram para lidar com os desafios de treinar deepfakes em Colabs, sendo a alocação aleatória de GPU a reclamação mais comum, já que o Colab limitava o uso de GPUs de ponta a usuários gratuitos.

* Em mensagens privadas no Discord

Publicado pela primeira vez em 28 de maio de 2022.
Revisado 7:28 AM EST, correção de erro de digitação da citação.
Revisado às 12h40 EST – esclarecimentos adicionais sobre proibições de deepfakes nos níveis gratuito e profissional, conforme pode ser melhor compreendido nas listas de proibições "gratuitas" e "profissionais".

Tópicos relacionados:notícias de IA falsificações profundas deepfake

Martin Anderson

Escritor sobre machine learning, especialista em domínio em síntese de imagem humana. Ex-chefe de conteúdo de pesquisa na Metaphysic.ai.
Site pessoal: martinanderson.ai
Contato: [email protected]
Twitter: @manders_ai

Unir-se.AI

Google baniu treinamento de deepfakes no Colab

Você pode gostar