资金

圣书科技完成A+轮融资，筹集超过86万美元，旨在拓展多模态人工智能的边界。

发布时间 2026 年 2 月 5 日

安托万·塔迪夫， Unite.AI首席执行官兼创始人

盛舒科技完成了一个 A+轮融资超过人民币600亿元（约合86万美元）这标志着该公司在扩展其多模式基础模型以支持数字和物理世界应用方面迈出了重要一步。本轮融资由以下机构共同领投：中关村科学城 LINK-X CAPITAL 领衔投资，Wondershare、Visual China Group 和 TRS 也参与了战略投资。此外，多位现有投资者也增加了投资额，这体现了他们对盛舒技术方向和商业发展的持续信心。

新资本的到来正值多模态人工智能系统从实验性工具向支撑实际生产的基础设施转变之际。圣书的发展轨迹也体现了这一转变，其研究突破正日益转化为各行业广泛应用的成熟产品。

从早期研究到商业级模型

圣书科技是全球最早将多模态生成算法作为核心研究方向的团队之一。2022年，公司推出了U-ViT架构，为能够跨文本、图像和视频进行推理的模型奠定了技术基础。这种以研究为先的策略为Vidu在2024年中期的发布铺平了道路。

维杜盛舒凭借其超越传统文本转视频或图像转视频功能的参考视频生成能力进入市场。该系统并非将每一帧视为孤立的输出，而是旨在保持场景间多实体的一致性，从而解决了商业视频生成领域长期存在的难题。自发布以来，盛舒持续快速迭代，不断推出新版本，持续提升语义理解能力、运动稳定性、视觉连贯性和推理速度。

最新发布的 Vidu Q3 体现了其对故事叙述的专注。该型号支持长达 16 秒的音视频同步生成、原生 1080p 输出、精准的镜头切换、多语言文本渲染和多语言输出。这些功能使该系统更贴近制作流程，而非仅限于短片实验。

绩效、速度和开放式创新

除了产品质量，圣书还强调效率是其竞争优势。2025年底，该公司将其技术开源。 TurboDiffusion框架此举显著降低了视频生成延迟。借助该框架，在单个高端GPU上，五秒钟的视频可以在两秒内生成，与之前的方法相比，性能提升了几个数量级。

对速度的关注并非仅仅体现在技术层面。更低的延迟和计算需求直接影响着多模态模型大规模部署的可行性，尤其是在交互式应用和实时创意工具领域。通过降低生成高质量视频所需的成本和时间，盛舒正推动多模态人工智能更接近专业环境中的日常应用。

扩大在创意和企业市场的应用

盛舒围绕Vidu构建了涵盖托管服务、SaaS产品、应用程序和代理工具的广泛产品生态系统。这些产品目前服务于遍布200多个国家和地区的创作者、工作室和企业。该公司预计，到2025年，用户和收入将增长十倍以上，表明其应用正在加速普及。

在电影和娱乐领域，Vidu 被广泛应用于动画、短片制作和长片制作的各个工作流程中，内容所有者、工具提供商和制作公司均参与其中。与此同时，互联网平台和智能硬件公司也在将这项技术应用于营销素材创建、互动内容和产品创新。

广告和游戏已成为Vidu的新兴增长点。品牌和代理商利用Vidu扩展视频制作规模，用于广告宣传活动；游戏开发商则将其应用于广告内容和场景生成。在国际上，Vidu平台正受到创意工具开发商和企业用户的青睐，其应用范围已扩展至教育、广播和文化旅游等领域。

多模态人工智能的更广泛影响

多模态基础模型的进步意义远不止于视频创作。通过将文本、图像、音频和动态信息整合到统一的系统中，这些模型使机器能够以更接近人类感知的方式解读上下文。对于各行各业而言，这意味着更快的生产周期、更低的高质量内容准入门槛，以及人机交互的全新形式。

与此同时，多模态人工智能的成熟也引发了关于真实性、知识产权和负责任部署等重要问题。随着生成的视频越来越逼真，技术保障措施和治理框架对于维护公众对数字媒体的信任至关重要。

展望未来，多模态模型不仅可能在数字工作流程中发挥作用，而且可能在物理世界系统中发挥作用，从机器人和仿真到智能环境。盛舒科技的最新一轮融资使该公司能够参与这一转型，因为多模态人工智能正从一种创造性的新奇事物转变为下一代生产力的基础层。

联合人工智能

圣书科技完成A+轮融资，筹集超过86万美元，旨在拓展多模态人工智能的边界。

从早期研究到商业级模型

绩效、速度和开放式创新

扩大在创意和企业市场的应用

多模态人工智能的更广泛影响

你可能会喜欢