Взгляд Anderson

Должны ли системы рекомендаций быть освобождены от пост-трекинговой эпохи?

Опубликовано 3 мая 2021

Обновлено 25 мая 2026

Martin Anderson

Поскольку сбор данных первого уровня становится новой целью для маркетологов и брокеров данных, повышенное внимание к ‘закрытым’ системам сбора данных рискует втянуть один из наиболее активных секторов исследований машинного обучения в поле противоречий и более строгого регулирования.

Действия, предпринятые игроками FAANG и производителями FOSS в течение следующих 12-18 месяцев, предназначены для закрытия культуры междоменного отслеживания, которая охватила системы аналитики пользователей за последние двадцать лет, и завершилась скандалами с Cambridge Analytica и, последующим, неуклонным популярным требованием увеличения онлайн-конфиденциальности.

Независимо от того, оправдывает ли реализация идеал, и независимо от того, насколько общие системы отслеживания (такие как FLOC от Google и SKAdNetwork от Apple) могут успокоить гнев потребителей и удовлетворить рекламодателей, эта новая волна заботы о конфиденциальности пользователей применяется только к междоменному извлечению данных в ‘публичном’ контексте, и не к закрытым или проприетарным потребительским средам, и к индивидуальным системам рекомендаций, которые обеспечивают вовлеченность там.

Богатые данные в огороженных садах

Платформы, такие как Netflix, Disney+, HBO Max, Roku и экосистема Amazon (включая Prime Video и рекомендации продуктов), которые используют индивидуальные системы рекомендаций машинного обучения, являются среди сервисов контента, которые сейчас распространяются и укрепляются, поскольку индустрия балканизируется.

Когда сбор данных третьего уровня отступает, преимущество, которое сохраняют более крупные игроки потокового вещания в плане тонкого доступа к данным о поведении клиентов, вероятно, вызовет зависть и подражание, и обновленный акцент на первичных рамках как способ вернуть гиперперсонализированную нацеливание из более общих новых систем аналитики.

Если это произойдет, это вряд ли будет столь демократично или меритократично, как предыдущие критерии для входа, поскольку наиболее существенное преимущество выпадет на долю поставщиков с наиболее обширной сетью первичных платформ; с достаточными ресурсами разработки для обеспечения безопасных местных систем аутентификации; и которые способны управлять, анализировать и монетизировать высокообъемные данные локально.

Это сосредоточит общественное внимание на аспектах конфиденциальности ‘закрытых’ систем рекомендаций таким образом, что они в значительной степени смогли избежать до сих пор, поскольку, до этой точки, они были исключительными случаями и наслаждались исключительными привилегиями, действуя в контексте, где конечный пользователь явно согласился на агрессивные практики сбора данных, которые обычно не допускаются в открытых сетях.

Более широкое возвращение к герметичным первичным средам

Увеличенный акцент на первичных данных, вероятно, приведет к возвращению к доменно-специфическим системам аутентификации, которые предшествовали популярности методов третьего уровня, предоставляемых Google (0Auth 2.0), Facebook и Twitter, а также другим популярным модульным социальным платформам, таким как Disqus.

Десять лет назад широкое внедрение этих платформ аутентификации третьего уровня решило многие проблемы безопасности для доменов с ограниченными ресурсами разработки, но также сделало более трудным получение той же степени действенных данных о пользователях, которую позволяет посвященная и местная система аутентификации и мониторинга первого уровня. В то время это не имело большого значения, поскольку междоменное отслеживание могло мостить этот разрыв в данных.

Вход в качестве решения экзистенциального кризиса

Теперь преимущество заключается в том, чтобы убедиться, что пользователь вошел в систему, даже если нет явных механизмов для его монетизации. Одним из примеров этого является растущее количество медиа-ресурсов, которые требуют входа для просмотра контента, даже если нет платной стены.

Ограничения этого типа могут быть трудными для определения для отдельного зрителя, поскольку они могут варьироваться по геолокациям или другим обстоятельствам. Например, вышеуказанная статья в Guardian не ограничена ни в коем случае, когда она навигируется изнутри веб-сайта Guardian (даже если читатель не вошел в систему), или когда доступна напрямую. Требование входа с ссылки Google – это дешевый метод генерации спроса на увеличение членства без отталкивания ‘заранее захваченных’ читателей.

Хотя всегда были преимущества сбора данных в этом типе первичного взаимодействия (т.е. ‘местный’ вход), падение междоменного отслеживания, вероятно, возвысит эту практику из ‘преимущественной’ в экзистенциальную необходимость для избежания более скудных маркетинговых потоков данных FLOC и SKAdNetwork.

Импульс к сбору данных первого уровня

Свидетельства ‘золотой лихорадки’ первичных данных многочисленны. Согласно мнению одного инсайдера индустрии в Forbes, падение файлов cookie третьего уровня приведет к новым возможностям для компаний курировать и продавать вторичные данные, когда у них достаточно первичной инфраструктуры, чтобы эффективно стать брокерами данных по своей собственной инициативе.

Анализ в других местах также прогнозирует, что ритейлеры (которые инвестируют много в системы рекомендаций машинного обучения) станут новыми ‘медиа-магнатами’.

В блог-посте платформа монетизации Setupad демонстрирует намерение рекламной индустрии не уступать федеративным, ограниченным данными системам, таким как FLOC, заявляя, что ‘целевая нацеливание – это ответ на будущий успех для рекламодателей’, и что захват первого уровня является абсолютным предварительным условием для этого.

Целевая нацеливание – это то, что вызвало текущий тектонический сдвиг в потребительской конфиденциальности в первую очередь; и это то, чего хотят достичь маркетинговая и профессиональная индустрия влиятельных лиц – по доверенности, тайно или любыми другими средствами, независимо от того, что это может в конечном итоге втянуть сектор исследований систем рекомендаций в грязь вместе с ним.

Клуб первого уровня

Помимо требования к дорогостоящей инфраструктуре, а также ресурсам безопасности и разработки, другой фактор указывает на то, почему только более крупные компании, вероятно, процветают в эпоху систем сбора данных первого уровня: компании необходимо иметь убедительную рыночную долю, чтобы заставить потребителей вернуться в местные системы входа, которые они были рады отказаться decade назад.

Это рискованный шаг, даже для крупного игрока, и память о гибели Digg в 2010 году все еще преследует мир SEO и маркетинга. Чем более убедительна рыночная доля компании, тем менее вредным будет этот шаг, и более мощные компании смогут лучше выдержать трудности и адаптироваться к экосистеме первого уровня, чем более мелкие компании.

Влияние на исследования систем рекомендаций

Когда эта ситуация развивается, она может угрожать относительной ‘свободной пропуску’, которую регулирующее надзор предоставило исследованию систем рекомендаций машинного обучения компаниям, таким как Google, Amazon и Netflix.

До некоторой степени новые предложения ЕС по законодательству об ИИ предвидят более пристальное внимание к системам рекомендаций в любом случае. Хотя неясно, будет ли положение проекта против ‘сублиминальных техник за пределами сознания человека для того, чтобы существенно исказить поведение человека’ применяться к системам рекомендаций, ожидается, что рекламодатели и исследователи систем рекомендаций будут лоббировать исключительное отношение.

Но может быть трудно сделать дело для изоляции исследований систем рекомендаций в случае, если подход ‘огороженного сада’ становится новым отраслевым стандартом, и академические пастбища, которые принимали этот сектор исследований машинного обучения, становятся высокообъемным горячим местом для коммерциализированного развития исследований поведения первого уровня.

Крупные инвестиции в потоки данных первого уровня могут быть единственной надеждой на воссоздание тех же высокоэффективных ‘психических’ реклам и политической пропаганды, которые характеризовали эпоху Cambridge Analytica; но для регулирующих органов может показаться, что смерть файла cookie третьего уровня просто переместила ‘нечестные’ практики с улиц на закрытые территории. Если внешний эффект этих действий снова вызовет общественное негодование, это может оказаться скудным убежищем.