Regulación
¿Deben Estar Exentos los Sistemas de Recomendación de la Era Post-Rastreo?

Al convertirse la recopilación de datos de primera parte en la nueva guía para los marketeros y corredores de datos, la mayor atención sobre los sistemas de recopilación de datos ‘cerrados’ riesgos a arrastrar a uno de los sectores de investigación de aprendizaje automático más fervientes hacia la controversia y una mayor regulación.
Las acciones tomadas por los jugadores de FAANG y los productores de FOSS en los próximos 12-18 meses están a punto de cerrar la cultura de seguimiento entre dominios que envolvió los sistemas de análisis de usuarios en los últimos veinte años, y culminó en los escándalos de Cambridge Analytica y, posteriormente, en la irresistible demanda popular de mayor privacidad en línea.
Ya sea que la implementación cumpla con el ideal, y sin importar la medida en que los sistemas de seguimiento más generalizados (como FLOC de Google y SKAdNetwork de Apple) puedan calmar la ira del consumidor y satisfacer a los anunciantes, esta nueva ola de preocupación por la privacidad del usuario solo se aplica a la extracción de datos entre dominios en un contexto ‘público’, y no a entornos de consumidor cerrados o propietarios, y a los sistemas de recomendación personalizados que impulsan el compromiso allí.
Datos Ricos en Jardines Amurallados
Plataformas como Netflix, Disney+, HBO Max, Roku y la ecoestructura de Amazon (incluyendo Prime Video y recomendaciones de productos), que utilizan sistemas de recomendación personalizados construidos a medida, se encuentran entre los servicios de contenido que ahora proliferan y se retiran a medida que la industria de transmisión se balcaniza.
A medida que la recopilación de datos de terceros se reduce, la ventaja que retienen los jugadores de transmisión más grandes en términos de acceso a datos de uso del cliente parece probable que inspire envidia y emulación, y un renovado énfasis en los marcos de primera parte como una forma de recuperar la segmentación hiperpersonalizada de los nuevos sistemas de análisis más generalizados.
Si esto sucede, no es probable que sea tan democrático o meritocrático como los criterios de entrada anteriores, porque la mayor ventaja recaerá en los proveedores con la red más extensa de plataformas de primera parte; con suficientes recursos de desarrollo para proporcionar sistemas de autenticación locales seguros; y que puedan administrar, analizar y monetizar grandes volúmenes de datos localmente.
Esto enfocaría la atención pública sobre los aspectos de privacidad de los sistemas de recomendación ‘cerrados’ de una manera que han podido evitar hasta ahora, porque, hasta este punto, han sido casos excepcionales, y han disfrutado de privilegios excepcionales, operando en un contexto en el que el usuario final ha optado explícitamente por prácticas de recopilación de datos agresivas que no están permitidas generalmente en redes abiertas.
Un Regreso Más Amplio a Entornos de Primera Parte Herméticos
Un mayor énfasis en la recopilación de datos de primera parte parece probable que traiga un regreso a los sistemas de autenticación específicos del dominio que precedieron la popularidad de los métodos de terceros proporcionados por Google (0Auth 2.0), Facebook y Twitter, así como otras plataformas sociales populares como Disqus.
Hace diez años, la adopción generalizada de estas plataformas de autenticación de terceros resolvió muchos problemas de seguridad para dominios con recursos de desarrollo limitados, pero también hizo que fuera más difícil obtener el mismo nivel de granularidad de datos de usuario activables que un sistema de autenticación y monitoreo de primera parte dedicado y local permite. En ese momento, no importaba tanto, porque el seguimiento entre dominios podía cubrir esa brecha de datos.
El Inicio de Sesión como Solución a una Crisis Existencial
Ahora, la ventaja radica en asegurarse de que el usuario esté conectado, incluso si no hay mecanismos explícitos para monetizarlo. Un ejemplo de esto es el creciente número de medios de comunicación que requieren un inicio de sesión para ver contenido, incluso cuando no hay un paywall en su lugar. Por ejemplo, The Guardian está experimentando actualmente con requisitos de inicio de sesión para vistas de artículos que provienen de búsquedas de Google:

Captura de pantalla de un ‘muro de inicio de sesión’ para una vista de artículo de The Guardian que proviene de una búsqueda de Google. Esto no se puede capturar en instantáneas de archivo web, ya que la restricción se genera mediante encabezados de referente o sistemas basados en IP que revelan Google como el origenador del clic.
Las restricciones de este tipo pueden ser difíciles de determinar para un espectador individual, ya que pueden variar en diferentes geolocalizaciones o circunstancias. Por ejemplo, el artículo de The Guardian anterior no está restringido de ninguna manera cuando se navega a él desde dentro del sitio web de The Guardian (incluso si el lector no está conectado), o cuando se accede directamente. Requerir un inicio de sesión desde una referencia de Google es un método barato de generar un aumento en la demanda de membresías sin alienar a los lectores ‘previamente capturados’.
Aunque siempre ha habido ventajas en la recopilación de datos en este tipo de compromiso de primera parte (es decir, un ‘inicio de sesión’ local), la caída del seguimiento entre dominios probablemente elevará la práctica de ‘ventajosa’ a una necesidad existencial para evitar las corrientes de datos de marketing más escasas de FLOC y SKAdNetwork.
El Impulso Hacia la Recopilación de Datos de Primera Parte
La evidencia de una ‘fiebre del oro’ de datos de primera parte es abundante. Según la opinión de un insider de la industria en Forbes, la caída de las cookies de terceros llevará a nuevas oportunidades para que las empresas curaten y vendan datos de segunda parte, donde tengan suficiente infraestructura de primera parte para convertirse efectivamente en corredores de datos por derecho propio.
Análisis en otros lugares también prevé que los minoristas (que invierten mucho en sistemas de recomendación de aprendizaje automático) se convertirán en los nuevos ‘magnates de los medios’.
En una publicación de blog, la plataforma de monetización Setupad ejemplifica la intención de la industria publicitaria de no acceder a sistemas federados y limitados de datos como FLOC, estableciendo que ‘la segmentación comportamental es la respuesta al éxito futuro para los anunciantes’, y que la captura de primera parte es el requisito previo absoluto para esto.
La segmentación comportamental es lo que causó el actual cambio tectónico en la privacidad del consumidor en primer lugar; y es lo que las industrias de marketing y de influencia profesional quieren recuperar – por proxy, por sigilo o por cualquier otro medio, sin importar que eventualmente arrastre al sector de investigación de sistemas de recomendación hacia abajo con él.
El ‘Club’ de Primera Parte
Además del requisito de infraestructura costosa, así como de recursos de seguridad y desarrollo, otro factor indica por qué solo las empresas más grandes probablemente prosperarán en la era de los sistemas de recopilación de datos de primera parte: una empresa necesitará una captura de mercado convincente para coaccionar a los consumidores de regreso a los sistemas de inicio de sesión locales que abandonaron hace una década.
Este es un movimiento arriesgado, incluso para un jugador importante, y el recuerdo de la caída de Digg en 2010 todavía acecha el mundo del SEO y el marketing. La captura de mercado más convincente que tenga una empresa, menos dañino será este movimiento, con empresas más poderosas capaces de soportar los valles y adaptarse mejor al ecosistema de primera parte que las empresas más pequeñas.
Efectos en la Investigación de Sistemas de Recomendación
A medida que esta situación evoluciona, puede amenazar el ‘pase libre’ relativo que la supervisión regulatoria ha otorgado a la investigación de sistemas de recomendación de aprendizaje automático de empresas como Google, Amazon y Netflix.
En cierta medida, las nuevas propuestas de la UE para la legislación de IA anticipan un mayor escrutinio de los sistemas de recomendación en cualquier caso. Aunque no está claro si la disposición del borrador contra ‘técnicas subliminales más allá de la conciencia de una persona para distorsionar materialmente el comportamiento de una persona’ se aplicará a los sistemas de recomendación, se anticipa que los anunciantes y los investigadores de sistemas de recomendación harán lobby para un trato excepcional.
Pero puede ser difícil hacer un caso para cercar la investigación de sistemas de recomendación en el evento de que el enfoque de ‘jardín amurallado’ se convierta en el nuevo estándar de la industria, y los prados académicos ociosos que han albergado este sector de la investigación de aprendizaje automático se conviertan en un lecho caliente de alta volumen para el desarrollo de investigación de comportamiento de primera parte comercializada en masa.
La inversión importante en flujos de trabajo de datos de primera parte puede ser la única esperanza para recrear el mismo tipo de anuncios ‘psíquicos’ y propaganda política altamente efectivos que caracterizaron la era de Cambridge Analytica; pero para los reguladores, puede parecer que la muerte de la cookie de terceros simplemente movió las prácticas ‘despreciables’ de las calles a locales cerrados. Si el efecto exterior de esas actividades despierta nuevamente la ira pública, eso puede probar ser un santuario escaso.








