人工智能

谷歌地图升级Gemini:对话式导航的黎明

mm

谷歌刚刚推出了谷歌地图几年来最重要的更新之一。在今天发布的博客文章中,公司宣布其导航应用程序将从Gemini获得强大的AI增强,Gemini是谷歌的下一代多模态模型。结果是一个更自然、对话式和上下文感知的驾驶体验,感觉不像在遵循方向,而更像在与一个知识渊博的同伴一起旅行。

该更新引入了四个主要增强功能:由Gemini提供支持的无手语音导航、基于地标的方向、主动交通警报和升级的Lens功能,允许您仅通过将相机指向周围环境来探索世界。它们共同标志着谷歌所谓的“由于Gemini的能力和我们可靠的现实世界信息而使出行变得更加容易”的重要一步。

每次旅程的对话式副驾驶

该版本的核心是导航中的Gemini,它将地图转变为一个全功能的AI助手,您可以在驾驶时与其自然对话。用户不再需要点击屏幕或输入地址,而可以问复杂、多部分的问题,如:

“沿我的路线,有没有一家预算友好的餐厅,有素食选项,在几英里范围内?”

Gemini立即解释该请求,分析实时交通、位置数据和谷歌庞大的地点数据库,以提供相关选项。驾驶员可以跟进说,“停车情况如何?”或“可以在明天5点钟添加一个日历事件用于足球练习吗?”——Gemini将处理它,如果授予许可,则会自动与日历同步。

该集成还扩展到实时道路报告。驾驶员可以说,“我看到一场事故”,或“前面有洪水”——Gemini会立即标记问题,而无需将双手从方向盘上移开。这是一种自然、对话式的方式,保持道路安全和旅程顺畅。

这种无手导航体验将在未来几周内在Android和iOS上推出,Gemini可用,而Android Auto支持稍后将推出。

通过地标导航,而不仅仅是街标

如果您曾经被告知“在500英尺处右转”,并想知道那到底在哪里,谷歌的第二项更新就是为您准备的。基于地标的导航为方向添加了现实世界的背景,引用可见、可识别的地点。

现在,地图不再使用数字距离来引导您,而是使用类似“在泰国西安餐厅右转”的提示,并在您的路线上突出显示该餐厅。这种人类式的方向系统使用Gemini来分析谷歌地图上的超过2.5亿个地点,并将其与街景图像进行交叉引用,以确保地标不仅相关,而且实际上可以从道路上看到。

通过将环境提示纳入驾驶体验中,地图感觉不再那么机械,而更具直觉——与人们自然给出方向的方式更为接近。该功能已经开始向美国的Android和iOS用户推出,计划更广泛地推广。

主动交通警报:在您询问之前提供帮助

第三项增强功能专注于开始驾驶之前的意识。通过主动交通警报,地图现在在不需要主动导航模式的情况下通知用户有关事故、道路封闭或突然减速等中断。

如果您经常在某条高速公路上通勤,并且有一个主要延迟,地图将在您的设备上发送通知,以便您可以更早离开或选择另一条路线。该功能在后台无缝工作,展示了Gemini的预测能力和谷歌向预测性辅助的转变。

这些警报目前正在向美国的Android用户推出,iOS支持即将推出。

搭载Gemini的Lens:一种新的探索方式

导航并不在到达目的地时结束——搭载Gemini的Lens,谷歌正在将AI的力量扩展到发现领域。

通过点击地图搜索栏中的相机图标,您可以简单地将手机举起来识别周围的环境——餐厅、咖啡馆、商店或著名地标,并提出问题,如:

“这里有什么流行菜肴?”
“里面是什么氛围?”
“这是什么地方,为什么它这么受欢迎?”

Gemini将视觉理解与对话式AI相结合,根据评论、照片和地图的广泛位置数据提供答案。这是一个全新的背景层,它将观光变成一种交互式体验。

该功能将在本月晚些时候开始向美国的Android和iOS用户推出,代表了谷歌的AI如何连接物理和数字世界的一个最清晰的例子。

迈向环境智能

这次发布之所以引人注目,不仅仅是因为这些单独的功能——而是它们如何协同工作。随着Gemini现在嵌入到地图中,该应用程序从导航工具演变为真正的环境智能系统,一种在后台默默运行、预测需求并自然响应上下文的AI。

您不再需要在应用程序之间切换或发出僵硬的命令。不论您是在寻找一家餐厅、检查停车情况还是了解一个新社区,交互感觉都很自然、无缝。Gemini理解意图,适应语气,并在不中断流程的情况下将您的偏好连接到谷歌服务中——从日历到搜索。

这是谷歌近二十年来地图工作的结晶,以及其最近在生成式AI方面的突破。

这对导航的未来意味着什么

Gemini集成到谷歌地图中,不仅使旅行变得更聪明——它重新定义了人类与周围世界的交互方式。其影响远远超出了逐步导航:

  1. 导航变得对话式
    不久,出行不再依赖于固定的命令或菜单选择。您将以自然语言描述所需的内容——“沿着风景优美的路线行驶,并在途中停靠一家咖啡店”——地图将相应地规划路线。导航变得个人化、流畅和上下文驱动。
  2. 移动设备上的语义搜索的崛起
    用户不再需要输入“附近的素食餐厅”,而可以提出细致入微、多变量的查询:“找到一家安静、价格合理、晚上9点后仍然开放的晚餐地点。”Gemini的意图理解将赋予移动设备新的发现能力。
  3. 视觉发现作为未来的界面
    搭载Gemini的Lens指向了一个城市变成活的搜索引擎的世界。您不需要查找信息——您只需要它。将您的手机指向一栋建筑,Gemini将告诉您它是什么、为什么它受欢迎,甚至是否有排队。
  4. 更安全、更智能、更包容的移动
    无手控制和自然语言处理使地图对驾驶员更方便,尤其是对于行动不便或无法安全与屏幕交互的人。它不仅提高了便利性,也提高了安全性。
  5. 通往自动驾驶汽车的桥梁
    也许最深远的影响是,这种对话框架如何塑造汽车界面的未来。随着自动驾驶汽车变得主流,像Gemini这样的系统可能会成为人机对话的基础——允许乘客简单地告诉汽车下一步要做什么。

前方的道路

通过集成Gemini,谷歌地图不仅改进了导航——它重新定义了导航。这次更新反映了一个更深层次的AI愿景,即AI作为一种无形的伴侣,通过意识、对话和适应性来增强日常生活。

今天,Gemini帮助您找到一家餐厅或报告一场事故。明天,它可以帮助协调差事、管理日程并根据您的习惯和偏好个性化路线。助手和导航器之间的界限正在变得模糊,而Gemini在驾驶座上,出行可能很快会像交谈一样自然。

安托万是一位具有远见的领导者和Unite.AI的联合创始人,他对塑造和推广人工智能和机器人技术的未来充满热情。作为一位连续创业者,他相信人工智能将对社会产生电力的影响一样的颠覆性影响,并经常被发现对颠覆性技术和通用人工智能的潜力大肆赞扬。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他还是Securities.io的创始人,这是一个专注于投资尖端技术的平台,这些技术正在重新定义未来并重塑整个行业。