Líderes de pensamento
Por que a Privacidade de Dados será a Questão Técnica Definidora de 2024
No centro das atenções do mundo da tecnologia, chatbots impulsionados por IA, como o ChatGPT, estão atraindo atenção, redesenhando indústrias como as conhecemos. Com cada avanço, papéis tradicionais estão desaparecendo – escritores, gurus de marketing, até especialistas em TI se veem na linha de corte. Em junho de 2023, apenas nos EUA, um impressionante total de 3.900 americanos perderam seus empregos para a IA. No entanto, essa disruptura é apenas um prelúdio do que está por vir.
À medida que a IA continua suas conquistas em várias indústrias, uma onda de apreensão cresce em relação à violação de direitos autorais e violações de privacidade. A pergunta paira no ar: como podemos garantir um equilíbrio delicado entre progresso e privacidade?
Faíscas de preocupação
Para começar, devo explicar como os modelos de IA, como o ChatGPT, funcionam. Eles geram resultados com base nos dados que aprendem durante o treinamento. Se o modelo pode criar textos que parecem ter sido escritos por Shakespeare no estilo da literatura inglesa antiga, isso significa que ele já “viu” esse conteúdo antes durante seu período de preparação, antes de seu lançamento.
De fato, os algoritmos de aprendizado de máquina (ML) por trás de cada modelo de IA são treinados em vastas quantidades de dados para performar bem. Por exemplo, existem sistemas que ajudam médicos em diagnósticos — eles analisam tomografias e encontram anormalidades que podem indicar doenças específicas, como câncer de pulmão. Eles geralmente são treinados em milhões de imagens médicas. Sem isso, não poderiam reconhecer artefatos em exames.
À medida que a demanda por ferramentas de IA aumenta exponencialmente, gigantes da tecnologia estão coletando vastas quantidades de dados para treinar seus modelos. E, às vezes, esses dados incluem informações sensíveis sobre pessoas e organizações. Além disso, eles são frequentemente obtidos por meio da raspagem de milhões de páginas da web sem qualquer acordo com os proprietários.
Isso desperta preocupações públicas sobre privacidade, transparência e controle sobre informações pessoais na internet. Uma pesquisa da Deloitte de 2023 revelou que a maioria dos respondentes busca mais proteção e controle sobre como seus dados são usados. Quase nove em cada dez expressaram o desejo de visualizar e excluir dados coletados, com 80% sentindo que merecem compensação pelas empresas que lucram com seus dados. Nos EUA, os cidadãos cresceram mais preocupados sobre como seus dados são usados, com cerca de sete em cada dez adultos americanos (71%) compartilhando essas preocupações, um aumento em relação a 64% em 2019.
Batalhas legais
Além disso, algumas organizações estão levando essas questões ao tribunal. De acordo com a Fortune, em novembro de 2023, havia mais de 100 processos relacionados à IA navegando pelo sistema jurídico. Esses casos cobrem uma gama de preocupações, incluindo disputas de propriedade intelectual, a propagação de conteúdo prejudicial e casos de discriminação.
Entre esses casos estavam ações judiciais movidas por artistas que acusaram desenvolvedores de modelos de aprendizado profundo e de texto-para-imagem, como Stable Diffusion e Midjourney, de utilizar sua arte digital em treinamento de IA sem consentimento. Eles argumentaram que as empresas por trás desses produtos haviam coletado bilhões de imagens da internet, incluindo as deles, para instruir os modelos a gerar suas próprias imagens.
Em dezembro de 2023, o importante jornal americano The New York Times entrou nessas batalhas legais processando a OpenAI, desenvolvedora por trás do próspero ChatGPT, por violação de direitos autorais. A ação enfatizou que milhões de artigos publicados por organizações de mídia foram utilizados para treinar chatbots automatizados, que agora rivalizam a publicação como fonte de informações confiáveis.
Questões futuras
Em resposta a essas preocupações prementes, governos em todo o mundo estão se unindo para confrontar as ansiedades públicas. Por exemplo, representantes de doze órgãos reguladores globais emitiram uma declaração conjunta em agosto de 2023, focando na raspagem de dados e proteção de privacidade. A declaração veio de autoridades na Argentina, Austrália, Canadá, Colômbia, Hong Kong, Jersey, México, Marrocos, Nova Zelândia, Noruega, Suíça e Reino Unido. Enquanto isso, na Califórnia, o Projeto de Lei Delete foi assinado em lei, visando corretores de dados e estabelecendo regulamentações adicionais para coleta e gerenciamento de dados pessoais.
Apesar dos esforços concertados, prevejo que as preocupações com privacidade e propriedade de dados manterão sua proeminência no discurso público ao longo de 2024 e além. Além disso, o aumento de processos judiciais sobre propriedade intelectual sinaliza apenas a ponta do iceberg. É provável que testemunhemos um aumento nos casos que se concentram na precisão e segurança dos dados, especialmente diante da proliferação desenfreada de deepfakes e desinformação.
Enquanto tanto os setores governamentais quanto os empresariais devem redobrar seus esforços, uma abordagem cautelosa é imperativa. Apesar das apreensões crescentes, vale notar que os dados abertos continuam a desempenhar um papel fundamental no impulso à pesquisa e desenvolvimento. Tome, por exemplo, o papel inestimável do acesso público a registros de saúde durante a crise do COVID-19, acelerando o desenvolvimento de avanços médicos que salvam vidas, como as vacinas pioneiras da Moderna e da Pfizer.
A importância dos dados abertos é sublinhada pelo exemplo histórico do Projeto Genoma Humano dos EUA, onde a partilha pública de dados genéticos transformou a pesquisa genética. De maneira semelhante, a IA analisando e aprendendo com os dados pode beneficiar a sociedade, desde a categorização de mutações genéticas até o enfrentamento de desafios prementes como a mudança climática.
No negócio, os dados coletados por raspadores de web são inestimáveis para inteligência de mercado, acompanhamento de concorrentes e reconhecimento de tendências prevalecentes. Se a raspagem de web se tornar mais restrita, as empresas podem enfrentar acesso limitado a dados vitais para tomar decisões informadas, potencialmente levando a uma redução da concorrência e transparência nos preços, obstáculo à inovação e experiência do usuário subpar devido a atualizações de dados mais lentas e menos precisas.
No entanto, diante desses desafios em crescimento, existem maneiras de enfrentá-los de frente. Eu deposito minha fé no poder dos proxies para navegar essas águas turbulentas. Essas tecnologias inovadoras encobrem os endereços IP originais dos usuários, canalizando suas atividades online por meio de servidores alternativos. Não apenas eles reforçam a segurança dos dados, mas também emergem como ferramentas indispensáveis na harmonização do progresso tecnológico com a salvaguarda das liberdades individuais.












