Líderes del pensamiento
Por qué la privacidad de los datos será el problema tecnológico decisivo en 2024

En el centro de atención del mundo tecnológico, los chatbots impulsados por inteligencia artificial como ChatGPT están atrayendo la atención y remodelando las industrias tal como las conocemos. Con cada avance, los roles tradicionales se están volviendo obsoletos: los escritores, los gurús del marketing e incluso los expertos en TI se encuentran en la tabla de cortar. Sólo en junio de 2023, la asombrosa cifra de 3,900 estadounidenses lost sus trabajos a la IA. Sin embargo, esta perturbación es simplemente un preludio de lo que se avecina.
A medida que la IA continúa sus conquistas en todas las industrias, crece una ola de aprensión con respecto a la infracción de derechos de autor y las violaciones de la privacidad. La pregunta sigue siendo importante: ¿cómo podemos garantizar un delicado equilibrio entre progreso y privacidad?
Chispas de preocupación
Para empezar, permítanme explicar cómo funcionan los modelos de IA como ChatGPT. Generan resultados basados en los datos que aprenden durante el entrenamiento. Si el modelo puede crear texto que parezca escrito por Shakespeare en el mismo estilo de la literatura inglesa tradicional, significa que ya ha visto ese contenido durante su preparación, antes de su publicación.
De hecho, los algoritmos de aprendizaje automático (ML) detrás de cada modelo de IA se entrenan con grandes cantidades de datos para funcionar bien. Por ejemplo, existen sistemas que ayudan a los médicos en el diagnóstico: analizan tomografías computarizadas y encuentran anomalías que pueden indicar enfermedades específicas como el cáncer de pulmón. Por lo general, están entrenados en millones de imágenes médicas. Sin eso, no podrían reconocer artefactos en los escaneos.
A medida que la demanda de herramientas de inteligencia artificial aumenta exponencialmente, los gigantes tecnológicos recopilan cada vez más grandes cantidades de datos para entrenar sus modelos. Y a veces esos datos incluyen información confidencial sobre personas y organizaciones. Además, a menudo se obtiene raspando millones de páginas web sin ningún acuerdo por parte de los propietarios.
Esto genera preocupaciones públicas sobre la privacidad, la transparencia y el control sobre la información personal en Internet. A Encuesta de Deloitte 2023 dio a conocer que la mayoría de los encuestados buscan más protección y control sobre cómo se utilizan sus datos. Casi nueve de cada 10 expresaron su deseo de ver y eliminar los datos recopilados, y el 80% consideró que merecen una compensación por las empresas que se benefician de sus datos. Sólo en Estados Unidos, los ciudadanos han crecido más preocupado sobre cómo se utilizan sus datos, y aproximadamente siete de cada diez adultos estadounidenses (71%) comparten estas preocupaciones, frente al 64% en 2019.
Batallas legales
Además, algunas organizaciones están llevando estas cuestiones a los tribunales. Según Fortune, en noviembre de 2023, había fueron Más de 100 demandas relacionadas con la IA navegando por el sistema legal. Estos casos cubren una variedad de preocupaciones, incluidas disputas de propiedad intelectual, la propagación de contenido dañino y casos de discriminación.
Entre estos casos se encontraban demandas presentadas por artistas que acusaron a los desarrolladores de modelos de aprendizaje profundo y de conversión de texto a imagen, como Stable Diffusion y Midjourney, de utilizar su arte digital en el entrenamiento de IA sin consentimiento. Ellos argumentó que las empresas detrás de estos productos habían recopilado miles de millones de imágenes de Internet, incluidas las suyas, para instruir a los modelos a generar sus propias imágenes.
En diciembre de 2023, el importante periódico estadounidense The New York Times entró en estas batallas legales demandando a OpenAI, el desarrollador detrás del próspero ChatGPT, por infracción de derechos de autor. la demanda destacó que millones de artículos publicados por organizaciones de medios se utilizaron para entrenar chatbots automatizados, que ahora rivalizan con los medios de comunicación como fuente de información confiable.
Problemas futuros
En respuesta a estas preocupaciones apremiantes, los gobiernos de todo el mundo se están uniendo para enfrentar las ansiedades públicas. Por ejemplo, representantes de doce organismos reguladores a nivel mundial emitido una declaración conjunta en agosto de 2023, centrada en la extracción de datos y la protección de la privacidad. La declaración provino de autoridades de Argentina, Australia, Canadá, Colombia, Hong Kong, Jersey, México, Marruecos, Nueva Zelanda, Noruega, Suiza y el Reino Unido. Mientras tanto, en California, la Ley de Eliminación fue firmado se convierta en ley, apuntando a los intermediarios de datos y estableciendo regulaciones adicionales para la recopilación y gestión de datos personales.
A pesar de los esfuerzos concertados, preveo que las preocupaciones sobre la privacidad y la propiedad de los datos mantendrán su prominencia en el discurso público a lo largo de 2024 y más allá. Además, el aumento de las demandas por propiedad intelectual es sólo la punta del iceberg. Es probable que seamos testigos de un aumento en los casos centrados en la precisión y seguridad de los datos, particularmente en medio de la proliferación desenfrenada de deepfakes y desinformación.
Si bien tanto el sector gubernamental como el empresarial deben redoblar sus esfuerzos, es imperativo adoptar un enfoque cauteloso. A pesar de la creciente inquietud, cabe destacar que los datos abiertos siguen desempeñando un papel fundamental para impulsar la investigación y el desarrollo. Tomemos, por ejemplo, el invaluable papel que desempeñó el acceso público a los historiales médicos durante la crisis de la COVID-19, acelerando el desarrollo de avances médicos vitales, como las vacunas desarrolladas por Moderna y Pfizer.
La importancia de los datos abiertos queda subrayada por el ejemplo histórico del Proyecto Genoma Humano de EE. UU., donde el intercambio público de datos genéticos transformó la investigación genética. De manera similar, el análisis y el aprendizaje de los datos por parte de la IA pueden beneficiar a la sociedad, desde categorizar mutaciones genéticas hasta abordar desafíos apremiantes como el cambio climático.
En los negocios, los datos recopilados por los web scrapers son invaluables para la inteligencia de mercado, el seguimiento de la competencia y el reconocimiento de las tendencias predominantes. Si el web scraping se vuelve más restringido, las empresas pueden enfrentar un acceso limitado a datos vitales para tomar decisiones informadas, lo que podría conducir a una menor competencia y transparencia en los precios, obstáculos a la innovación y una experiencia de usuario deficiente debido a una actualización de datos más lenta y menos precisa.
Sin embargo, en medio de estos crecientes desafíos, existen vías para afrontarlos directamente. Confío en el poder de los proxies para navegar en estas aguas turbulentas. Estas tecnologías innovadoras ocultan las direcciones IP originales de los usuarios, canalizando sus actividades en línea a través de servidores alternativos. No solo refuerzan la seguridad de los datos, sino que también se convierten en herramientas indispensables para armonizar el progreso tecnológico con la protección de las libertades individuales.