融资
Collov Labs 获得 2300 万美元 A 轮融资,押注视觉 AI 成为下一代界面

Collov Labs 已获得 2300 万美元 A 轮融资,并推出了一个新研究实验室,旨在推进视觉 AI 系统的发展,这标志着人工智能可能会从基于文本的交互向更广泛的领域转变。
本轮融资由 Brightway Future Capital、Taihill Venture 和 Mindworks Capital 支持,将用于开发能够解释图像和摄像头输入的系统,目标是使 AI 能够理解和对物理世界做出反应。
从聊天式 AI 向视觉 AI 转变
如今的大多数 AI 采用 都集中在聊天界面上。Collov Labs 正在构建一个不同的前提:视觉输入将成为人们与 AI 交互的主要方式。
与其使用文本提示系统,公司专注于使用户能够将摄像头指向一个场景,并让 AI 解释上下文,推理所看到的内容,并协助进行现实世界的操作。这反映了整个行业向多模态 AI 的转变,系统将视觉、语言和推理结合成一个统一的体验。
这个想法并非完全新颖,但最近在计算、模型和设备处理方面的进步使其变得越来越实用。
构建面向现实世界的 AI 交互
Collov Labs 正在开发结合扩散模型、空间推理和代理工作流的系统。目标是超越静态图像识别,开发出能够理解场景内关系并执行多步骤操作的系统。
这部分内容与推动 AI 系统与物理环境交互的趋势一致,尤其是在硬件演进以支持实时处理和持续上下文的同时。
公司的背景反映了这一重点。其团队在多模态 AI、large-scale 推荐系统和学术界及行业中的应用机器学习方面都有经验。
从设计工具到更广泛的 AI 层
Collov 现有的产品,包括其 AI 驱动的设计工具,为我们提供了这些系统在实践中的工作方式的示例。公司最初在室内设计和视觉内容生成等领域获得了关注,在这些领域,AI 可以解释空间布局并生成现实输出。
业务的早期版本专注于 AI 驱动的设计平台和自动化工具,这种方法已经在房地产、零售和电子商务等用例中获得了商业上的成功。
这些产品现在作为一个反馈循环,提供现实世界的数据,以帮助改进公司的模型并完善其对视觉环境的理解。
视觉 AI 为什么可能扩大采用范围
Collov Labs 策略背后的一个基本假设是,基于文本的界面具有有限的范围。虽然聊天机器人已经推动了人们的认识,但全球大多数人口尚未真正参与 AI 工具。
视觉界面相比之下,天生更直观。这种转变反映了计算领域的早期转变,在那里,图形界面使系统对更广泛的受众(包括非技术用户)变得可访问。
如果成功,这种方法可能会降低 AI 采用的门槛,并将其应用扩展到视觉背景至关重要的行业,包括零售、设计、物流和现场操作。
硬件和设备 AI 的崛起
硬件的进步是视觉 AI崛起的关键因素。随着智能手机、可穿戴设备和专用芯片上的处理能力改进,更多用于解释图像和视频的工作可以在本地实时完成。这减少了延迟,并使系统能够立即响应用户所看到的内容,而不是完全依赖云处理。
这种转变还改变了 AI 的交付方式。视觉智能不再仅仅作为独立应用存在,而可以嵌入设备本身,在后台持续运行。这为更上下文感知的交互打开了大门,但也引发了关于准确性、可靠性以及这些系统在不可预测的现实世界环境中的行为的实际问题。
对 AI 交互的更广泛影响
向视觉 AI 的转变表明,人机交互正在逐渐转变。能够解释场景和空间关系的系统可能会减少对结构化输入的需求,使 AI 对于那些不擅长使用基于文本的工具的用户更易于使用。
同时,现实世界环境的复杂性带来了新的挑战。误解一个场景或忽略关键上下文可能会导致错误的输出,而随着 AI 越来越接近决策,错误的后果变得更加严重。
视觉 AI 不太可能取代现有的界面,而是会与它们一起演化,添加另一个交互层。随着时间的推移,这可能会导致一个更集成的体验,其中 AI 对上下文做出反应,就像它对明确的指令做出反应一样。










