融资
盛树科技完成A+轮融资,超86亿人民币,推动多模态AI边界

盛树科技 已完成 A+轮融资,金额超过600亿元人民币(约86亿美元),这是公司在扩大多模态基础模型以应用于数字和物理世界的重要里程碑。 本轮融资由 中关村科技城 和 LINK-X CAPITAL 共同领投,万兴科技、视觉中国集团和TRS 等战略投资者也参与了本轮融资。 同时,多位现有投资者增加了投资额度,表明了对盛树科技技术方向和商业进展的持续信心。
新资金的到来正值多模态AI系统从实验工具转向支撑实际生产的基础设施的时期。 盛树科技的发展轨迹反映了这一转变,其研究突破不断转化为在各个行业中部署的产品。
从早期研究到商业级模型
盛树科技是全球最早专注于多模态生成算法的核心研究方向的团队之一。 2022年,公司推出了U-ViT架构,有助于为能够跨文本、图像和视频进行推理的模型建立技术基础。 这一研究优先的方法为2024年中期推出Vidu奠定了基础。
Vidu 以一种超越传统文本到视频或图像到视频生成的“引用到视频”功能进入市场。 与其将每一帧视为独立输出,系统被设计为在场景中保留多实体一致性,从而解决商业视频生成中的一个长期挑战。 自推出以来,盛树科技迅速迭代,发布了连续的版本以提高语义理解、运动稳定性、视觉连贯性和推理速度。
最近的版本Vidu Q3反映出对讲故事的刻意关注。 该模型支持最长16秒的同步音视频生成,原生1080p输出,精确的镜头转换,多语言文本渲染和多语言输出。 这些能力使系统更接近生产工作流程,而不是短期实验片。
性能、速度和开放创新
除了输出质量,盛树科技还强调了效率作为竞争差异。 2025年末,公司开源了其 TurboDiffusion框架,这一举动大大降低了视频生成的延迟。 使用此框架,5秒的视频可以在单个高端GPU上在不到2秒内生成,相比早期方法,这代表了数量级的提高。
这种对速度的关注不仅仅是一个技术基准。 更低的延迟和计算要求直接影响到大规模部署多模态模型的可行性,尤其是在交互式应用和实时创意工具中。 通过降低生成高质量视频所需的时间和成本,盛树科技正在将多模态AI推向在专业环境中的日常使用。
扩大创意和企业市场的采用
盛树科技围绕Vidu建立了广泛的产品生态系统,涵盖托管服务、SaaS产品、应用程序和代理工具。 这些产品目前服务于200多个国家和地区的创作者、工作室和企业。 2025年,公司报告了用户和收入超过十倍的增长,表明采用率正在加速。
在电影和娱乐领域,Vidu被应用于动画、短片制作和特征工作流程,内容所有者、工具提供者和制作工作室都有参与。 同时,互联网平台和智能硬件公司也将这一技术应用于营销资产创建、交互内容和产品创新。
广告和游戏也已成为增长的领域。 品牌和代理商使用Vidu来扩大视频制作以适应活动,而游戏开发者则将其用于广告内容和场景生成。 在国际上,该平台在创意工具开发者和企业用户中获得了关注,其应用领域扩展到教育、广播和文化旅游。
多模态AI的更广泛影响
多模态基础模型的进展对视频创作以外的领域也有着重要影响。 通过将文本、图像、音频和运动整合到统一的系统中,这些模型使得机器能够以更接近人类感知的方式解释上下文。 对于各个行业来说,这意味着更快的生产周期、进入高质量内容的门槛降低以及人类和软件之间的新型交互形式。
同时,多模态AI的成熟也带来了关于真实性、知识产权和负责任部署的重要问题。 随着生成视频变得越来越逼真,技术保障和治理框架将成为维持数字媒体信任的必备条件。
展望未来,多模态模型很可能在数字工作流程中发挥作用,并且在物理世界的系统中,从机器人和模拟到智能环境中也将发挥作用。 盛树科技 的最新一轮融资使其能够参与这一转变,因为多模态AI从创意新颖转变为下一代生产力的基础层。












