Регулирование
Должны ли системы рекомендаций быть освобождены от пост-трекинговой эпохи?

Когда сбор данных первого уровня становится новой целью для маркетологов и брокеров данных, повышенное внимание к “закрытым” системам сбора данных рискует затянуть один из самых ярких исследовательских секторов машинного обучения в скандал и более строгую регуляцию.
Действия, предпринятые игроками FAANG и производителями FOSS в течение следующих 12-18 месяцев, предназначены для закрытия культуры междоменного отслеживания, которая охватила системы аналитики пользователей за последние двадцать лет, и завершилась скандалами с Cambridge Analytica и, в результате, неуклонным популярным требованием увеличения онлайн-приватности.
Независимо от того, оправдывает ли реализация идеал, и независимо от степени, в которой более обобщенные системы отслеживания (такие как Google’s FLOC и Apple’s SKAdNetwork) могут смягчить потребительское раздражение и удовлетворить рекламодателей, эта новая волна обеспокоенности по поводу приватности пользователей применяется только к междоменному извлечению данных в “публичном” контексте, и не к закрытым или проприетарным потребительским средам, и к индивидуальным системам рекомендаций, которые обеспечивают вовлеченность там.
Богатые данные в запертых садах
Платформы, такие как Netflix, Disney+, HBO Max, Roku и экосистема Amazon (включая Prime Video и рекомендации продуктов), которые используют индивидуальные системы рекомендаций машинного обучения, являются среди сервисов контента, которые сейчас распространяются и укрепляются, поскольку индустрия потокового вещания балканизируется.
Когда третье отслеживание данных отступает, преимущество, которое эти более крупные игроки потокового вещания сохраняют в плане тонкого доступа к данным о поведении клиентов, кажется, скорее всего, вдохновит зависть и подражание, и обновленный акцент на первичных рамках как способ clawing back гипер-персонализированной нацеливания из более обобщенных новых аналитических систем.
Если это произойдет, это вряд ли будет так демократично или меритократично, как приоритетные критерии для входа, потому что самое большое преимущество будет у поставщиков с самой обширной сетью первичных платформ; с достаточно большими ресурсами разработки, чтобы обеспечить безопасные локальные системы аутентификации; и которые способны управлять, анализировать и монетизировать высокий объем данных локально.
Это сосредоточит общественное внимание на аспектах приватности “закрытых” систем рекомендаций таким образом, что они в основном смогли избежать до сих пор, потому что, до этой точки, они были исключительными случаями, и наслаждались исключительными привилегиями, действуя в контексте, где конечный пользователь явно выбрал агрессивные практики сбора данных, которые обычно не разрешены в открытых сетях.
Более широкое возвращение к герметичным первичным средам
Увеличенный акцент на первичных данных, кажется, приведет к возвращению к домен-специфическим системам аутентификации, которые предшествовали популярности третьих методов, предоставляемых Google (0Auth 2.0), Facebook и Twitter, а также другие популярные модульные социальные платформы, такие как Disqus.
Десять лет назад широкое внедрение этих третьих платформ аутентификации решило многие проблемы безопасности для доменов с ограниченными ресурсами разработки, но также сделало более трудным получение той же степени детальных данных о поведении пользователей, которую позволяет посвященная и локальная первичная система аутентификации и мониторинга. В то время это не имело большого значения, потому что междоменное отслеживание могло мостить этот разрыв в данных.
Вход как решение экзистенциального кризиса
Теперь преимущество заключается в том, чтобы убедиться, что пользователь вошел в систему, даже если нет явных механизмов для его монетизации. Одним из примеров этого является растущее количество медиа-ресурсов, которые требуют входа для просмотра контента, даже если нет платной стены.
Например, The Guardian в настоящее время экспериментирует с требованиями входа для просмотра статей, которые приходят из поисковых запросов Google:

Скриншот ‘стены входа’ для просмотра статьи The Guardian, который пришел из поискового запроса Google. Это нельзя захватить в веб-архивных снимках, поскольку ограничение генерируется либо заголовками реферера, либо системами, основанными на IP-адресах, которые раскрывают Google как источник клика.
Ограничения этого типа могут быть трудными для определения для отдельного зрителя, поскольку они могут варьироваться в разных геолокациях или других обстоятельствах. Например, вышеуказанная статья The Guardian не ограничена никаким образом, когда она навигируется изнутри сайта The Guardian (даже если читатель не вошел в систему), или когда доступен напрямую. Требование входа от реферала Google – это дешевый метод генерации спроса на увеличение членства без отталкивания “предварительно захваченных” читателей.
Хотя всегда были преимущества сбора данных в этом типе первичной вовлеченности (т.е. “локальный” вход), падение междоменного отслеживания, вероятно, возвысит эту практику из “преимущественной” в экзистенциальную необходимость для избежания более скудных потоков маркетинговых данных FLOC и SKAdNetwork.
Импульс к сбору первичных данных
Доказательства “золотой лихорадки” первичных данных многочисленны. Согласно мнению одного из инсайдеров индустрии в Forbes, падение третьих файлов cookie приведет к новым возможностям для компаний курировать и продавать вторичные данные, когда у них достаточно первичной инфраструктуры, чтобы эффективно стать брокерами данных по своему праву.
Анализ в других местах также прогнозирует, что розничные продавцы (которые инвестируют много в системы рекомендаций машинного обучения) станут новыми “медиа-могулами”.
В блог-посте платформа монетизации Setupad демонстрирует намерение рекламной индустрии не уступать федеративным, ограниченным данными системам, таким как FLOC, заявляя, что ‘целевая реклама – это ответ на будущий успех рекламодателей’, и что первичный захват – это абсолютное предварительное условие для этого.
Целевая реклама – это то, что вызвало текущий тектонический сдвиг в потребительской приватности в первую очередь; и это то, чего хотят маркетинговая и профессиональная индустрия влияния – вернуть – по прокси, тайно или любыми другими средствами, независимо от того, может ли это в конечном итоге затянуть сектор исследований систем рекомендаций вниз в грязь вместе с ним.
Клуб первичных данных
Помимо требования дорогостоящей инфраструктуры, а также ресурсов безопасности и разработки, другой фактор указывает на то, почему только более крупные компании, вероятно, процветают в эпоху систем сбора первичных данных: компания должна иметь убедительную рыночную долю, чтобы принудить потребителей вернуться в локальные системы входа, которые они были рады отказаться decade назад.
Это рискованный шаг, даже для крупного игрока, и память о гибели Digg в 2010 году все еще преследует мир SEO и маркетинга. Чем более убедительна рыночная доля компании, тем менее вредным будет этот шаг, и более мощные компании смогут лучше выдержать трудности и адаптироваться к экосистеме первичных данных, чем более мелкие компании.
Влияние на исследования систем рекомендаций
Когда эта ситуация развивается, она может угрожать относительной “свободной пропуску”, которую регулирующий надзор предоставил исследованиям систем рекомендаций машинного обучения компаниям, таким как Google, Amazon и Netflix.
В некоторой степени новые предложения ЕС по законодательству об ИИ предвидят более пристальное внимание к системам рекомендаций в любом случае. Хотя неясно, будет ли положение проекта против ‘сублиминальных техник за пределами сознания человека, чтобы существенно исказить поведение человека’ применяться к системам рекомендаций, ожидается, что рекламодатели и исследователи систем рекомендаций будут лоббировать за исключительное обращение.
Но может быть трудно сделать дело для изоляции исследований систем рекомендаций в случае, если подход “запертого сада” станет новым отраслевым стандартом, и академические пастбища, которые принимали этот сектор исследований машинного обучения, станут высокообъемным горячим местом для коммерциализированных исследований первичных данных.
Крупные инвестиции в потоки первичных данных могут быть единственной надеждой на воссоздание тех же эффективных “психических” рекламных объявлений и политической пропаганды, которые характеризовали эпоху Cambridge Analytica; но для регулирующих органов может показаться, что смерть третьего файла cookie просто переместила “неприличные” практики с улиц на закрытые территории. Если внешний эффект этих действий снова вызовет общественное негодование, это может оказаться скудным убежищем.






