Anderson 视角
是否应豁免推荐系统免于追踪时代的影响?

随着第一方数据采集成为营销商和数据经纪人的新导航星,’封闭’数据采集系统所带来的关注度增加,可能会将机器学习研究领域中最热衷的研究领域拖入争议和更严格的监管之中。
FAANG 玩家和 FOSS 生产者在接下来的 12-18 个月内采取的行动将会关闭过去二十年来主导用户分析系统的跨域跟踪文化,这种文化最终导致了剑桥分析公司丑闻和随后不可抗拒的对在线隐私的需求增加。
无论实施是否达到理想状态,或者更广泛的跟踪系统(如 Google 的 FLOC 和 Apple 的 SKAdNetwork)是否能够缓解消费者的愤怒和满足广告商的需求,这种新的对用户隐私的关注仅适用于 ‘公共’ 环境中的跨域数据提取,而不适用于封闭或专有消费环境和为其提供动力的定制推荐系统。
围墙花园中的丰富数据
使用自定义机器学习推荐系统的平台,如 Netflix、Disney+、HBO Max、Roku 和亚马逊生态系统(包括 Prime Video 和产品推荐),是目前正在扩张和巩固的内容服务之一,因为流媒体行业正在 分裂。
随着第三方数据采集的衰退,这些较大的流媒体播放器在客户使用数据方面的优势可能会激发羡慕和模仿,并且会重新强调第一方框架,以便从更广泛的新分析系统中夺回超个人化的定位。
如果这种情况发生,它不太可能像以前的入场标准那样民主或公平,因为最大的优势将归于拥有最广泛的第一方平台的提供商;拥有足够的开发资源来提供安全的本地身份验证系统;并且能够在本地管理、分析和货币化大量数据。
这将使公众对 ‘封闭’ 推荐系统的隐私方面进行审查,这是它们迄今为止基本上能够避免的,因为在此之前,它们是例外情况,并享有特殊特权,在用户明确选择加入激进的数据采集行为的背景下,这些行为通常不允许在开放网络中进行。
回到更广泛的封闭第一方环境
对第一方数据的强调可能会带来对域名特定身份验证系统的回归,这些系统在过去曾经被 Google(0Auth 2.0)、Facebook 和 Twitter 等第三方身份验证平台所取代。
十年前,第三方身份验证平台的广泛采用解决了许多安全问题,但也使得获得与专用和本地第一方身份验证和监控系统相同的可行用户数据变得更加困难。当时,这并不是问题,因为跨域跟踪可以弥补这一数据差距。
登录作为解决生存危机的方法
现在,优势在于确保用户登录,即使没有明确的机制来货币化他们。例如,许多媒体机构现在要求登录才能查看内容,即使没有付费墙。例如,The Guardian 目前正在尝试对来自 Google 搜索的文章查看要求登录:

来自 Google 搜索的 Guardian 文章查看的 ‘登录墙’ 截图。这不能在网页存档快照中捕获,因为该限制是由 referrer 标头或 IP 基于系统生成的,这些系统揭示了 Google 是点击的起源。
这种限制可能对个别查看者来说很难确定,因为它们可能会根据地理位置或其他情况而有所不同。例如,上述 Guardian 文章在从 Guardian 网站内部导航时(即使读者未登录)或 直接访问 时没有任何限制。从 Google 引用要求登录是一种廉价的方法,可以在不疏远 ‘预先捕获’ 的读者的情况下增加会员需求。
虽然这种第一方参与方式一直有数据采集优势(即 ‘本地’ 登录),但跨域跟踪的衰落可能会将这种做法从 ‘有利’ 提升到 ‘必要’,以避免 FLOC 和 SKAdNetwork 的更少的营销数据流。
向第一方数据采集的推动力
第一方数据 ‘淘金热’ 的证据很明显。根据 Forbes 上一位行业内幕人士的看法,第三方 cookie 的衰落将为公司带来新的机会,让他们能够 策划和出售第二方数据,只要他们拥有足够的第一方基础设施,就可以成为自己的数据经纪人。
其他分析预测,零售商(他们大量投资机器学习推荐系统)将 成为下一个媒体巨头。
在一篇博客文章中,货币化平台 Setupad 体现了广告业的意图,即不屈服于联邦、数据受限的系统,如 FLOC,声明 ‘行为定位是广告商未来的成功答案’,并且第一方捕获是这一点的绝对先决条件。
行为定位是 导致 当前消费者隐私领域的巨大变化的原因;也是营销和专业影响者行业希望通过任何手段(包括代理、隐秘或其他手段)夺回的东西——即使这可能最终将推荐系统研究领域拖入泥潭。
第一方 ‘俱乐部’
除了昂贵的基础设施、安全和开发资源的要求外,另一个因素表明,只有较大的公司才可能在第一方数据采集系统的时代蓬勃发展:一家公司需要有令人信服的市场份额,以便说服消费者回到十年前他们放弃的本地登录系统中。
这是一个冒险的举动,即使对于大公司来说也是如此,2010 年 Digg 的 衰落 的记忆仍然困扰着 SEO 和营销世界。公司的市场份额越大,这种举动就越不具破坏性,大公司将更好地应对第一方生态系统的波动。
对推荐系统研究的影响
随着这种情况的发展,它可能会威胁到监管监督对来自 Google、Amazon 和 Netflix 等公司的机器学习推荐系统研究所给予的相对 ‘豁免’。
到目前为止,欧盟的 新提案 为人工智能立法预计会对推荐系统进行更严格的审查。虽然不清楚该草案中关于 ‘超出个人意识的潜意识技术以扭曲个人行为’ 的规定是否适用于推荐系统,但预计广告商和推荐系统研究人员将游说要求特殊待遇。
但如果 ‘围墙花园’ 方法成为新的行业标准,而曾经主持这一机器学习研究领域的悠闲学术圈成为大规模商业化的第一方行为研究开发的热点,那么为推荐系统研究辩护可能会很困难。
对第一方数据工作流的重大投资可能是重现与剑桥分析公司时代相同的高效 ‘心灵’ 广告和政治宣传的唯一希望;但对于监管机构来说,第三方 cookie 的消亡可能只是将 ‘不光彩’ 的做法从街头转移到了封闭的场所。如果这些活动的外部影响再次引起公众的愤怒,那么这可能不会提供太多的庇护。












