监控
通过机器学习估计全球贫困的真实状况

加州大学伯克利分校、斯坦福大学和 Facebook 合作,通过机器学习,更深入、更细致地了解各国内部和跨国的实际贫困状况。
这个 研究,有权 所有低收入和中等收入国家财富的微观估计,伴随着 测试版网站 这使得用户能够交互式地探索低收入和中等收入国家细粒度地区和贫困地区的绝对和相对经济状况。
该框架整合了来自卫星图像、地形图、移动电话网络和 Facebook 的匿名汇总数据,并根据广泛的面对面调查进行了验证,目的是报告一个地区的相对贫富差距,而不是收入的绝对估计。

全球贫困地图,重点关注受影响最严重的地区。 南非和莱索托的扩大(b); 开普敦附近的 Khayelitsa 镇周围 12 平方公里的区域。 资料来源:https://arxiv.org/ftp/arxiv/papers/2104/2104.07761.pdf
该系统已经 采用 尼日利亚政府将其作为管理社会保护计划的基础,并与世界银行现有框架、国家社会安全网项目(NASSP)。 今年 5000 月,该计划的第一批受益人获得了 XNUMX 尼日利亚奈拉的现金转账,福利期限为六个月,直至达到 XNUMX 万奈拉的门槛。
该论文断言 数据匮乏 在数据收集资源最少或基础设施有限的国家中,对错误分配援助做出了显着贡献,并且出于政治动机的误报(这是一个问题) 不限 低收入国家)也是这方面的一个因素。
登记“未报告贫困人口”
研究人员对数据的模拟表明,根据现有的援助资源分配规定,基于该系统的分配增加了对最需要援助者的支付,并减少了对现有高收入受助者的支付。 该文件还指出,由于缺乏全面或详细的数据,社会保障计划管理者在 COVID-19 危机爆发之初分配援助资源时面临困难。 例如,在尼日利亚,最新的调查数据仅覆盖尼日利亚所有地区 13.8% 的家庭,而新计划提供的覆盖率为 100%。
此前人工智能辅助贫困估算的工作主要集中在卫星获取的数据(见下文),但研究人员断言,来自移动连接的数据可以更准确、更细致地洞察不同地区的财富差距,而这一信息流提供了一半的数据。该项目的所有贡献数据。
从机器学习数据泛化的角度来看,研究人员观察到,在一个国家训练的模型可以成为覆盖邻近国家的模型的有益且准确的模板。 他们还指出,新框架不仅能够区分城市和农村地区,而且能够提供城市化地区内的差异图,这超出了该领域许多近期研究举措的范围。
贫困分析中的卫星图像
基于卫星的贫困分析背后的原理是这样的假设:穷人没有钱在黑暗的时候开电灯,或者可能根本没有电灯设施。 在通过其他方式(例如移动连接数据)确定的情况下,如果没有精确灯光可以与人员的存在相关联,则可以生成剥夺指数。
该技术于 2016 年在 早期斯坦福论文 来自另一个研究小组。该论文详细介绍的方法开创了使用美国空军国防气象卫星计划 (DMSP) 通过国家海洋和大气管理局 (NOAA-NGDC) 提供的夜间卫星覆盖的先河。

四个卷积滤波器从左到右识别与城市地区、农村地区、水和道路相关的特征。 顶行显示来自 Google 地图的源图像,中间显示来自机器学习分析的过滤器激活图,底行显示原始地图图像上的激活图叠加。 资料来源:https://science.sciencemag.org/content/sci/353/6301/790.full.pdf
斯坦福大学的项目将卫星监视中经过过滤的夜间灯光证据与国土安全部自己的调查数据库(该调查和卫星结果汇总当年)进行了关联。 有必要 建立 作为某些经济指标代理的夜光值总和的平均值。
全球贫困统计的基本事实
对于斯坦福大学的新项目,研究人员决定从现有的人口统计和健康调查中得出数据框架(美国国土安全部)计划,尽管正如他们承认的那样,这有效地复制了数据集中的 DHS 模式。 研究人员观察到: “我们选择专门根据国土安全部的数据来训练我们的模型,因为它是公开的、国际标准化的财富数据中最全面的单一来源,可以提供带有次区域地理标记的家庭层面的财富估计。”
然而,该项目的运行分辨率远高于国土安全部,并且使用现有框架作为基本事实有两个好处:首先,国土安全部的数据不依赖于正式的收入报告,而在受疫情影响最严重的国家,收入报告是一个不可靠的指标。贫困,黑市经济盛行; 其次,数据以标准化方式收集并采用国际模板,使研究人员的框架能够涵盖采用这种测量方法的其他国家,而不是在竞争框架之间建立等效性。
移动连接作为经济指标
对于生活在经济困难地区的人们来说,移动连接在过去二十年中已成为技术生命线,因为移动电话是在这种情况下可以依赖的最低可用技术平台。 手机也成为了 事实上的 为缺乏银行账户或其他传统收款方式的援助接受者提供的支付平台。
然而,正如已经 之前观察,使用移动网络指标作为机器学习系统的经济指标有一些潜在的缺点:受影响地区的一些人非常贫穷,甚至没有手机,而这些人正是该系统最旨在帮助的人; 在手机成为公民唯一 ID 哈希值代理的情况下,拥有多部手机的用户可能会利用该系统; 如果地方或国家政府对项目保留一定的监督权,那么创建这种身份识别系统就会涉及到隐私问题。