人工智能

谷歌的“虚拟卫星”AlphaEarth 如何重新定义全球地球映射

mm

准确的地球映射对于理解气候变化、城市增长和资源管理至关重要。传统的基于卫星的方法通常难以应对数据缺口和缓慢的处理。为了解决这些挑战,谷歌DeepMind开发了AlphaEarth Foundations,一种基于AI的“虚拟卫星”,它可以为甚至卫星数据有限或噪声的区域创建详细和一致的映射。本文解释了AlphaEarth的工作原理、其主要优点和实际影响。

了解AlphaEarth

AlphaEarth Foundations不是一个物理卫星,它围绕地球运行。相反,它是一个高级的AI系统,处理和融合大量的地球观测数据。该系统作为一个“虚拟卫星”运行,因为它可以生成地球观测数据随时间的总结。传统的地球观测依赖于只在特定时间通过某些区域的卫星。因此,收集的数据通常是不完整的,并且随着时间的推移存在缺口。AI模型通过学习填充缺失的数据并生成连续的记录来解决这个问题,即使卫星信息有限或不可用。

AlphaEarth整合了来自广泛来源的数据,包括光学卫星图像(例如Sentinel-2Landsat)、雷达数据、3D激光测绘(LiDAR)、数字高程模型、环境数据集、地理标记文本和其他上下文数据。AI将这些不同的数据源组合起来,创建一个统一的数字摘要,称为嵌入。AlphaEarth为地球上每个10×10米的区域创建这些嵌入,包括所有陆地和沿海水域。这些嵌入是紧凑、信息丰富的向量,捕捉足够的细节以跨不同数据源跟踪随时间的变化,例如植被周期和城市发展模式。

这种虚拟卫星方法克服了传统方法的关键局限性。与物理卫星不同,AlphaEarth Foundations不受卫星轨道的限制,也不受云层天气的影响。它可以在需要时生成最新、可用的地图,甚至对于偏远或经常被云层遮挡的地区。该系统通过智能地整合和协调来自不同地球观测平台的数据来运行,类似于一个元卫星。结果是一个单一的、不断更新的、详细的地球视图,简化了该过程,消除了管理多个卫星系统的需要。

AlphaEarth Foundations背后的AI技术

在其核心,AlphaEarth建立在一个基础的地理空间嵌入模型上。基础模型是大型AI系统,训练在大量、多样化的数据集上,以识别广泛的模式和结构。这种一般性理解使它们能够适应许多专门的任务,只需相对较少的额外训练。

AlphaEarth Foundations使用了一种名为“空间时间精度”(STP)的新型架构,旨在跨空间和时间捕捉细节和趋势。该模型同时处理空间、时间和分辨率细节。这种方法确保保留局部信息,同时也捕捉更大的模式和趋势随时间的变化。网络中的附加路径集成外部细节,例如地理标记文本,以确保系统的输出与现实世界背景相关联。

该模型使用自监督和对比学习方法,允许它重建和预测缺失的数据点。这使得它在处理不完整或噪声数据时非常强大。其双模型训练方法,使用“教师”和“学生”模型,进一步确保即使一些输入源缺失,也能可靠地执行。

该模型的一个关键特征是其高效的数据处理。它将观测结果压缩为64维向量,减少了16倍的存储需求,相比之前的系统。这种效率使得行星规模的分析更加实用和经济。

AlphaEarth如何设定新的映射标准

AlphaEarth Foundations通过提供更高的细节、一致性和准确性来改进现有的方法,从而在地球映射方面取得了显著的进步。该系统不仅提供更高的分辨率,还解释和组合数据以揭示传统映射技术和人类眼睛经常忽略的微妙模式。

AlphaEarth的一个关键优势是其能够在具有挑战性的条件下产生可靠的高分辨率地图。通过整合雷达数据,该系统可以“穿透”持续的天气并提供诸如农业田地和南极洲等地区的准确地图,在这些地区,光学成像通常受到限制。

AlphaEarth的创新“连续时间”功能允许它跟踪随时间的变化。与依赖不频繁的卫星传递不同,该模型可以插值或外推缺失的数据,创建任何日期范围的详细地图。这种功能使AlphaEarth能够跟踪随时间的变化,填补历史记录中的空白,并提供一致的最新信息,这对于对环境事件的及时响应至关重要。

性能评估表明,AlphaEarth Foundations具有很高的准确性。平均而言,它比领先的替代方案具有24%较低的错误率。它还在“低样本”场景中表现出色,即只有很少的标记示例可用。它在广泛的映射任务和时期中匹配或超越了专门的、专家调整的模型,从土地利用分类和作物类型识别到森林监测和表面属性估计。

最重要的是,AlphaEarth在数据匮乏环境中的强大性能对于全球监测工作至关重要。地球的许多地区都缺乏地面测量或卫星覆盖,使得传统的映射方法不可靠。AlphaEarth可以通过使用其全面、多源训练来生成这些数据匮乏环境中的准确地图,确保地球上任何地方都能获得精确、最新的见解。

提高地理空间访问

AlphaEarth的一个关键优势是它对所有人都开放。基于AlphaEarth Foundations的年度“卫星嵌入数据集”可在Google Earth Engine上使用。这意味着用户无需自己管理复杂的AI模型或处理密集的计算。通过使高质量的地理空间数据易于访问,AlphaEarth使得各个规模的组织(包括发展中国家、地方政府和学术团体)能够使用先进的地球观测工具。只需几行代码,用户就可以访问和分析以前对大多数人来说不可及的全球地理空间数据。AlphaEarth Foundation还与其他Google Cloud解决方案(如BigQueryVertex AI)集成。这种集成使公共和私营部门的用户能够访问详细的气候洞察和先进的土地管理工具。

现实世界应用

在其公开发布之前,AlphaEarth已被全球50多个组织测试。反馈非常积极,特别是在地图创建的速度和质量方面。例如,巴西的环境监测组织MapBiomas使用AlphaEarth跟踪亚马逊雨林的土地利用和森林砍伐。该模型使他们能够更快地检测到非法清理活动,并制定更好的土地管理策略。

另一个应用是全球生态系统地图集,一个旨在绘制地球上所有生态系统(包括以前代表性不足的生态系统)的项目。AlphaEarth帮助对具有挑战性的地区(如偏远的沙漠和沿海地区)进行分类,向科学家提供更好的信息以指导保护工作。

联合国粮食及农业组织这样的国际组织使用AlphaEarth进行农业监测。大学和研究机构也从其即时可用的数据中受益,使他们能够专注于分析而不是数据准备。因此,之前需要数周或数月才能完成的任务现在可以在几天甚至几小时内完成。

挑战和考虑

尽管AlphaEarth具有先进的功能,但它有一些局限性,用户应该意识到这些局限性。该模型需要大量的计算资源用于训练和推理,因此主要通过基于云的平台提供,而不是本地安装。这种对外部基础设施的依赖可能会限制其在特定地区或用例中的采用。

结果的准确性在很大程度上取决于输入卫星数据的质量和覆盖范围。虽然该模型可以估计缺失的信息,但卫星覆盖率一致较差的地区可能会降低准确性。用户在解释结果用于关键应用时需要了解这些局限性。

数据隐私和主权也是在使用全球AI系统进行本地环境监测时需要考虑的重要问题。国家和组织需要意识到他们的地理信息如何在使用这些地球观测工具时被处理和存储。

结论

AlphaEarth Foundations正在为全球地球映射设定新的标准。通过使用先进的AI,它提供了详细和可靠的地图,即使对于卫星数据有限或缺失的区域也是如此。这为组织、研究人员和政策制定者提供了更快、更准确的信息,以便就气候、土地利用和资源管理做出关键决策。虽然AlphaEarth依赖于云平台和输入数据的质量,但它使先进的地球观测工具更加实用和易于全球用户使用。

Dr. Tehseen Zia 是 COMSATS University Islamabad 的终身副教授,拥有来自奥地利维也纳科技大学的人工智能博士学位。专攻人工智能、机器学习、数据科学和计算机视觉,他在著名的科学期刊上发表了重要贡献。 Dr. Tehseen 还作为首席调查员领导了各种工业项目,并担任人工智能顾问。