Collov Labs 获得 2300 万美元 A 轮融资，押注视觉 AI 成为下一代界面

Published April 21, 2026

Updated April 25, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Collov Labs 已获得 2300 万美元 A 轮融资，并推出了一个新研究实验室，旨在推进视觉 AI 系统的发展，这标志着人工智能可能会从基于文本的交互向更广泛的领域转变。

本轮融资由 Brightway Future Capital、Taihill Venture 和 Mindworks Capital 支持，将用于开发能够解释图像和摄像头输入的系统，目标是使 AI 能够理解和对物理世界做出反应。

从聊天式 AI 向视觉 AI 转变

如今的大多数 AI 采用都集中在聊天界面上。Collov Labs 正在构建一个不同的前提：视觉输入将成为人们与 AI 交互的主要方式。

与其使用文本提示系统，公司专注于使用户能够将摄像头指向一个场景，并让 AI 解释上下文，推理所看到的内容，并协助进行现实世界的操作。这反映了整个行业向多模态 AI 的转变，系统将视觉、语言和推理结合成一个统一的体验。

这个想法并非完全新颖，但最近在计算、模型和设备处理方面的进步使其变得越来越实用。

Collov Labs 正在开发结合扩散模型、空间推理和代理工作流的系统。目标是超越静态图像识别，开发出能够理解场景内关系并执行多步骤操作的系统。

这部分内容与推动 AI 系统与物理环境交互的趋势一致，尤其是在硬件演进以支持实时处理和持续上下文的同时。

公司的背景反映了这一重点。其团队在多模态 AI、large-scale 推荐系统和学术界及行业中的应用机器学习方面都有经验。

Collov 现有的产品，包括其 AI 驱动的设计工具，为我们提供了这些系统在实践中的工作方式的示例。公司最初在室内设计和视觉内容生成等领域获得了关注，在这些领域，AI 可以解释空间布局并生成现实输出。

业务的早期版本专注于 AI 驱动的设计平台和自动化工具，这种方法已经在房地产、零售和电子商务等用例中获得了商业上的成功。

这些产品现在作为一个反馈循环，提供现实世界的数据，以帮助改进公司的模型并完善其对视觉环境的理解。

Collov Labs 策略背后的一个基本假设是，基于文本的界面具有有限的范围。虽然聊天机器人已经推动了人们的认识，但全球大多数人口尚未真正参与 AI 工具。

视觉界面相比之下，天生更直观。这种转变反映了计算领域的早期转变，在那里，图形界面使系统对更广泛的受众（包括非技术用户）变得可访问。

如果成功，这种方法可能会降低 AI 采用的门槛，并将其应用扩展到视觉背景至关重要的行业，包括零售、设计、物流和现场操作。

硬件的进步是视觉 AI崛起的关键因素。随着智能手机、可穿戴设备和专用芯片上的处理能力改进，更多用于解释图像和视频的工作可以在本地实时完成。这减少了延迟，并使系统能够立即响应用户所看到的内容，而不是完全依赖云处理。

这种转变还改变了 AI 的交付方式。视觉智能不再仅仅作为独立应用存在，而可以嵌入设备本身，在后台持续运行。这为更上下文感知的交互打开了大门，但也引发了关于准确性、可靠性以及这些系统在不可预测的现实世界环境中的行为的实际问题。

向视觉 AI 的转变表明，人机交互正在逐渐转变。能够解释场景和空间关系的系统可能会减少对结构化输入的需求，使 AI 对于那些不擅长使用基于文本的工具的用户更易于使用。

同时，现实世界环境的复杂性带来了新的挑战。误解一个场景或忽略关键上下文可能会导致错误的输出，而随着 AI 越来越接近决策，错误的后果变得更加严重。

视觉 AI 不太可能取代现有的界面，而是会与它们一起演化，添加另一个交互层。随着时间的推移，这可能会导致一个更集成的体验，其中 AI 对上下文做出反应，就像它对明确的指令做出反应一样。

Antoine Tardif, CEO & Founder of Unite.AI

安托万是一位具有远见的领导者和Unite.AI的创始合伙人，他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者，他相信AI将对社会产生与电力一样的颠覆性影响，他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家，他致力于探索这些创新将如何塑造我们的世界。另外，他也是Securities.io的创始人，这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。