Connect with us

人工智能

Google Maps 获得 Gemini 升级:对话式导航的黎明

mm

Google 刚刚推出了过去几年中对 Google Maps 最重要的更新之一。在今天发布的一篇 博客文章 中,公司宣布其导航应用程序将从 Gemini 中获得强大的 AI 提升,Gemini 是 Google 的下一代多模态模型。结果是一个更自然、对话式和上下文感知的驾驶体验,感觉不像是在遵循方向,而更像是在与一位知识渊博的同伴一起旅行。

此更新引入了四项主要增强功能:由 Gemini 提供支持的无手导航、基于地标的方向、主动交通警报和升级的 Lens 功能,允许您仅通过将相机指向周围环境来探索世界。它们共同标志着朝着 Google 所说的 “由于 Gemini 能力和我们可靠的现实世界信息,使出行变得更容易” 的重要一步。

每次旅程的对话式副驾驶

此版本的核心是 Gemini 导航,它将 Maps 转变为您可以在驾驶时自然对话的全功能 AI 助手。用户不再需要点击屏幕或输入地址,现在可以提出复杂的、多部分的问题,如:

“沿我的路线,有没有一家预算友好的餐厅提供纯素食选项,距离在几英里之内?”

Gemini 即时解释请求,分析实时交通、位置数据和 Google 的庞大地点数据库以提供相关选项。驾驶员可以继续问:“停车情况如何?”或“可以在明天 5 点添加一个日历事件吗?”——Gemini 将处理它,如果授予权限,会自动与日历同步。

集成还扩展到实时道路报告。驾驶员可以说:“我看到一场事故”,或“前面有洪水”,以便在不用离开方向盘的情况下立即标记问题。这是一种自然的对话方式,可以让道路更安全,旅程更顺畅。

此无手导航体验将在未来几周内在 Android 和 iOS 上推出,Gemini 可用,Android Auto 支持 将稍后到来。

通过地标导航,而不仅仅是街标

如果您曾经被告知“500 英尺后右转”,并想知道那到底在哪里,Google 的第二个升级适合您。 基于地标的导航 通过引用可见的、可识别的地方为方向添加了现实世界的上下文。

现在,Maps 不再使用数值距离来指导您,而是使用诸如“在泰国餐厅 Siam 右转”的提示,并在您的路线上突出显示餐厅。这种人性化的方向系统使用 Gemini 分析 Google Maps 上的超过 2.5 亿个地点,并将其与 Street View 图像 进行交叉引用,以确保地标相关且从道路上可见。

通过将环境提示融入驾驶体验中,Maps 感觉不再那么机器化,而更具直观性——更接近人们在对话中自然给出的方向。该功能已经开始在美国的 Android 和 iOS 用户中推出,计划更广泛地扩展。

主动交通警报:在您询问之前提供帮助

第三个增强功能专注于开始驾驶之前的意识。通过 主动交通警报,Maps 现在会在不需要主动导航模式的情况下通知用户有关事故、道路封闭或突然减速等中断。

如果您经常在某条高速公路上通勤,并且有重大延迟,Maps 将在您的设备上发送通知,以便您可以更早离开或选择另一条路线。该功能在后台无缝运行,展示了 Gemini 的预测能力和 Google 向 预测性辅助 的转变。

这些警报目前正在美国的 Android 用户中推出,iOS 支持即将推出。

搭载 Gemini 的 Lens:一种新的探索方式

导航并不在您到达目的地时结束——搭载 Gemini 的 Lens,Google 正在将 AI 的力量扩展到发现领域。

通过点击 Maps 搜索栏中的相机图标,您可以简单地将手机举起来识别周围环境——餐厅、咖啡馆、商店或著名地标,并提出诸如以下的问题:

“这里有什么流行菜肴?”
“里面是什么氛围?”
“这是什么地方,为什么它很受欢迎?”

Gemini 结合视觉理解和对话式 AI 提供答案,答案来自评论、照片和 Maps 的广泛位置数据。这是一个全新的上下文层, 将观光变成一种交互式体验。

此功能将于本月晚些时候在美国的 Android 和 iOS 用户中推出,代表了我们迄今为止最清晰的视角之一,展示了 Google 的 AI 将如何连接物理和数字世界。

迈向环境智能

这一版本最引人注目的方面不是单个功能,而是它们如何协同工作。随着 Gemini 现在嵌入到 Maps 中,应用程序从导航工具演变为真正的 环境智能系统,即一种在后台默默运行的 AI,预测需求并自然地响应上下文。

您不再需要在应用程序之间切换或发出僵硬的命令。无论您是在寻找一家餐厅、检查停车情况还是了解新社区,交互都感觉自然和无缝。Gemini 理解意图,适应语气,并在不中断流程的情况下将您的偏好连接到 Google 服务——从日历到搜索。

这是近二十年来 Google 地图工作和最近在生成式 AI 中取得的突破的结晶。

对导航未来的影响

将 Gemini 集成到 Google Maps 中不仅使导航变得更智能——它重新定义了人类与周围世界的交互方式。其影响远远超出了逐步导航:

  1. 导航变得对话式
    不久,出行将不再依赖于固定的命令或菜单选择。您将用平白话描述您想要的内容——“沿着风景优美的路线行驶,并在途中停靠一家咖啡店”——Maps 将相应地规划路线。导航变得个人化、流畅和上下文驱动。
  2. 移动设备上语义搜索的崛起
    用户不再需要输入“附近的纯素食餐厅”,而是可以提出细致入微的、多变量的查询:“找到一家安静、价格合理、晚上 9 点后仍开放的晚餐地点”。Gemini 对意图的理解将赋予移动设备新的发现能力。
  3. 视觉发现作为未来的界面
    搭载 Gemini 的 Lens 指向了一个城市将成为活的搜索引擎的世界。您不需要查找信息——您只需要 一看。将您的手机指向一栋建筑,Gemini 将告诉您它是什么、人们为什么喜欢它,甚至内部是否有排队。
  4. 更安全、更智能、更包容的移动
    无手控制和自然语言处理使 Maps 对驾驶员(尤其是行动不便或无法安全交互的驾驶员)更方便、更安全。
  5. 通往自动驾驶汽车的桥梁
    最有远见的影响可能是这种对话框架如何塑造未来汽车接口。随着自动驾驶汽车成为主流,Gemini 之类的系统可能会成为人机对话的基础——允许乘客简单地 告诉 汽车下一步要做什么。

前路

通过集成 Gemini,Google Maps 不仅改进了导航——它重新定义了导航。这一更新反映了 Google 对 AI 的更深层次的愿景,即 AI 作为一种无形的伴侣,通过意识、对话和适应性提高日常生活的便利性。

今天,Gemini 帮助您找到一家餐厅或报告一场事故。明天,它可能会帮助协调差事、管理日程并根据您的习惯和偏好个性化路线。助手和导航器之间的界限正在变得模糊,而有了 Gemini 的驾驶,出行可能很快会感觉像是一场对话。

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。