Connect with us

AI 工具 101

Sora AI 评论:AI 是否会永远取代摄影师?

mm

Unite.AI is committed to rigorous editorial standards. We may receive compensation when you click on links to products we review. Please view our affiliate disclosure.

Sora AI review.

您是否曾经想从仅仅文字中创建高质量的视频?

2024 年 2 月,OpenAI 推出了 Sora,一种能够从文本提示(最长可达 20 秒)创建逼真视频的 AI 系统。自 2024 年 12 月以来,该工具已对具有 Plus 或 Pro 订阅的付费 ChatGPT 用户开放。

我尝试了很多不同的 AI 视频生成器,我必须说,没有一个能与 Sora AI 提供的质量和电影感相比。

以下是我使用 Sora AI 生成的 5 秒视频,使用的文本提示是:“显示一个霓虹丛林,发光的藤蔓缠绕着古代废墟,机器鸟在上空滑翔,人们都惊叹不已”:

它只需要几秒钟就生成了!我对准确性和质量真的很佩服。

从那里开始,Sora 还带有易于使用的 AI 编辑功能:

  • 故事板:在时间线上组织和编辑视频序列。
  • 混音:替换、删除或重新想象视频中的元素。
  • 重新剪辑:修剪和延长片段以获得更好的流畅度。
  • 混合:将两个视频合并成一个无缝的片段。
  • 循环:通过修剪和循环选定的部分创建无缝的重复视频。

在这篇 Sora AI 评论中,我将讨论优缺点、它是什么、谁是最佳用户以及其主要功能。然后,我将向您展示我如何使用 Sora AI 生成视频,视频中有机器鸟飞过发光的藤蔓,藤蔓缠绕着古代废墟。

我将通过比较 Sora AI 与我最喜欢的三个替代品(PictorySynthesysDeepbrain AI)来结束这篇文章。到最后,您将知道 Sora AI 是否适合您!

结论

Sora AI 可以大规模创建电影般的视频,并包含降低滥用的安全功能。然而,广泛采用可能会削弱品牌的独特性,助长错误信息和隐私问题,威胁视频制作角色,并难以应对复杂的提示。

优缺点

  • 使用 AI 生成高质量、电影般的视频
  • 简化内容创作,实现大规模视频的快速生产
  • 通过创建自定义内容提高参与度
  • 安全功能包括水印 AI 生成的视频,并与专家合作以减轻潜在的滥用
  • 广泛采用可能会限制品牌在营销中的差异化和独特性
  • 这些超现实的视频可能会助长错误信息和隐私问题
  • Sora 威胁到视频创作和设计的角色
  • Sora 可能难以应对复杂的提示,例如在整个视频中保持对象的恒久性和一致的物理规律
  • Plus 计划可能有限,而 Pro 计划则明显更贵

什么是 Sora AI?

Sora AI feed 中包含可以使用 Sora AI 生成的视频示例。

Sora 是由 OpenAI 开发的 AI 文本到视频生成器,可以从文本提示(最长可达 20 秒)创建逼真视频。但这不仅仅是一个普通的 AI 视频生成器!

Sora 通过以下几个独特的功能脱颖而出:

  • 先进的自然语言处理理解语义背景。
  • 生成具有多个角色的复杂场景。
  • 从文本、图像和现有视频提示创建视频。
  • 支持多种长宽比(16:9、1:1、9:16)。

我发现 Sora 与其他 AI 视频工具的不同之处在于,它可以仅从文本描述中创建极其逼真的视频。生成的视频令人震惊地逼真!我们说的是具有连贯的照明和摄像机运动的完整场景,这些运动实际上是有意义的!

技术架构和底层技术

以下是 Sora 的技术方面的内容。

与其他 文本到视频模型 不同,Sora 使用所谓的“扩散变换器”架构。该模型将视频生成分解为微小的步骤,以确保整个剪辑的一致性!

使用 Sora AI,您可以生成自然场景,如“一只小狗在雪中玩耍”,或更复杂的序列,如“摄像机围绕一个详细的陶瓷花瓶旋转,当清晨的阳光照射进来时”。

当我将 Sora 与以前的文本到视频模型(如 Meta 的 Make-A-VideoGoogle 的 Imagen Video)进行比较时,差异是显著的。这些早期模型通常会生成较短的片段(最多几秒钟),并且通常难以处理复杂的运动或保持一致性。Sora 代表了 AI 视频生成领域的巨大飞跃!

我担心的是 Sora AI 对创意产业的影响,这可能是巨大的。从电影制作中的快速原型设计到创建教育内容,Sora 可能会改变我们对视频创作的方法。

这个领域正在非常快速地发展。就在去年,根据文本生成逼真的视频似乎像科幻小说一样。想到我们一年后会取得什么样的进步既令人兴奋又有点可怕!

Sora AI 的工作原理:技术深度

以下是对 Sora 的技术架构的更深入的了解。

了解扩散模型方法

在其核心,Sora 使用了 扩散变换器模型。可以把它看作是一个超级先进的 图像生成 模型,但它理解事物如何随时间移动和变化。真正让我惊讶的是它如何同时处理空间和时间信息。

Sora 的令人印象深刻的能力背后的秘密在于其训练方法。例如,当 Sora 生成一段猫跳跃的视频时,它将整个运动视为一个连续的事件,并在帧级和跨帧处理信息。

让我来分解使其成为可能的技术组件:

  1. 首先,有扩散过程本身。Sora 从纯噪音开始,并通过成千上万个微小的步骤将其细化为一个连贯的视频。
  2. 每个步骤都从文本提示和其对物体运动和交互的学习理解中获得指导。
  3. 变换器架构(类似于驱动 ChatGPT 的架构,但适用于视频)有助于在整个序列中保持一致性。

空间和时间一致性机制

空间-时间一致性机制特别巧妙。Sora 使用所谓的“基于补丁的处理”,它同时分析和生成视频的空间和时间的小块。这种方法有助于防止您可能在较旧的 AI 视频中看到的奇怪故障,例如物体突然改变形状或颜色。

关于 Sora 的架构,我印象最深的一点是它的注意力机制。它可以在物体暂时不在视野中时保持对其的感知,这是之前的模型所难以做到的。这对于生成较长的视频(物体可能会进出画面)至关重要。

训练数据和模型架构

Sora 的训练数据要求绝对巨大。我们说的是一个巨大的视频数据集,帮助模型学习从基本物理到复杂的人类运动等一切内容。

处理能力和要求

Sora 的处理能力特别有趣:它可以在不同的分辨率和帧率下生成视频,同时保持质量。该模型似乎对运动有着基本的“理解”,可以很好地扩展到不同的输出规格。

Sora 的技术成就的影响是深远的。它不仅仅是一个渐进式的改进。它代表了 AI 理解和生成动态视觉内容的根本飞跃。跨空间和时间保持一致性,同时遵循复杂提示的能力,开启了我们刚刚开始探索的可能性!

谁是 Sora AI 的最佳用户?

Sora AI 适合广泛的用户群体,特别是那些从事内容创作和营销的人。然而,以下是最能从使用 Sora AI 中受益的主要用户类型:

  • 电影制作人和动画师可以使用 Sora AI 根据文本提示快速生成场景,以帮助概念化和分镜过程。
  • 社交媒体影响者 可以使用 Sora AI 为 Instagram、TikTok 和 YouTube 创建吸引人的视频内容。快速生成视频的能力有助于跟上社交媒体趋势的快速节奏。
  • 数字营销人员可以使用 Sora AI 为特定人群创建视频,以提高参与度。它允许快速测试不同故事和视觉效果,以改善他们的活动结果。
  • 品牌设计师 可以使用 Sora AI 通过视频创建引人入胜的品牌叙事,以与消费者建立更情感化的联系。
  • 教育工作者可以使用 Sora AI 创建吸引学生注意力的动态教学材料。从简单的文本提示生成教育视频通常可以使复杂的话题更容易理解。
  • 小型企业可以使用 Sora AI 创建宣传视频,而无需进行大量的制作。这样,较小的实体可以在内容质量方面与较大的公司竞争。
  • 艺术家可以使用 Sora AI 探索新的风格或概念,通过 AI 生成的视觉效果。
  • 作家 可以使用 Sora AI 生成吸引人的字幕或博客文章。

总体而言,Sora AI 面向任何希望简化视频生产过程的人,从个人创作者到大型营销团队。其从文本提示生成高质量视频内容的多功能性使其成为数字媒体和创意产业发展领域的宝贵工具。

Sora AI 的主要功能

Sora AI 附带了一些革命性的功能,正在改变创作者编辑和生成高质量视频的方式。

故事板

故事板功能对内容创作者来说真的很改变游戏规则。与其生成单个视频,Sora 可以将完整的故事大纲转化为一系列相连的场景。

以下是如何在 Sora AI 中使用故事板功能:

  1. 在作曲家中点击“故事板”按钮。
  2. 描述您想要在每个字幕卡(场景)中发生的设置、角色和动作。
  3. 通过点击字幕卡下面的时间轴将字幕卡(场景)按照您想要的顺序排列。将卡片放在彼此足够接近但又不太远的位置,以便 Sora 能够制作出您满意的剪辑(不太突然但又不太详细)。
  4. 查看字幕卡下面的设置,然后点击“创建”以生成您的视频序列。

重新剪辑

重新剪辑是展示 Sora 了解摄影的功能之一。它基本上允许您修剪视频以保留您喜欢的部分,并无缝地扩展它。

以下是如何使用它:

  1. 从编辑工具中选择“重新剪辑”工具。Sora 将您的现有剪辑转换为故事板。
  2. 通过点击并拖动剪辑两端来修剪您喜欢的部分。
  3. 点击“创建”以让 Sora 无缝地扩展您感兴趣的剪辑。

混音

混音功能让我在第一次了解到它时非常兴奋。该功能允许您获取 Sora 生成的现有视频,并在其他内容保持不变的情况下修改特定元素。

例如,如果您喜欢视频的所有内容,但不喜欢天气,可以要求 Sora 将其与“雨天条件”而不是晴天重新混音,并且它将保持场景的所有其他方面。

  1. 从编辑工具中选择“混音”。
  2. 在空白文本字段中描述您想在视频中看到的更改。
  3. 根据您想要看到的更改的重要性,选择合适的混音强度:
    1. 自定义:设置自定义混音强度。
    2. 细微:对视频进行微小的更改(例如,移除一栋建筑上的窗户)。
    3. 温和:对原始视频进行明显的更改(例如,移除一些树木)。
    4. 强烈:对原始视频进行重大更改(例如,替换整个建筑)。
  4. 点击“混音”以让 Sora 实现您对视频的请求更改。

混合

混合是事情变得非常有趣的地方!此功能允许您合并不同视频的元素。看到的结果令人惊讶地无缝和创意!

以下是如何使用 Sora 进行混合:

  1. 从编辑工具中选择“混合”。
  2. 选择“上传视频”以上传您要与生成的视频混合的视频。如果您已经上传了视频到 Sora 或使用 Sora 生成了视频,您可以通过选择“从库中选择”来访问它们。
  3. 上传后,您将被带到“混合编辑器”。在中间有一个曲线,您可以调整它来控制每个图像在特定时间点的影响力。曲线越高,顶部图像的影响力越大。曲线越低,底部图像的影响力越大。
  4. 点击“混合”以将图像合并为一个视频。

循环

循环功能允许您无缝地重复任何视频。

以下是如何使用 Sora 循环视频:

  1. 从编辑工具中选择“循环”。
  2. 点击并拖动视频两端的句柄来修剪您要循环的部分。
  3. 根据视频的开始和结束部分的相似程度,选择循环类型:
    1. 短:添加 2 秒以完成循环。
    2. 正常:添加 4 秒以完成循环。
    3. 长:添加 6 秒以完成循环。
  4. 点击“循环”以生成。Sora 将创建一个无缝循环的视频!

让我印象最深的是它如何处理视频的技术挑战,使视频的结尾完美地过渡到开始。它不仅仅是一个简单的剪切和粘贴循环。AI 实际上理解如何创建自然的循环运动和照明变化!

如何使用 Sora AI

以下是我使用 Sora AI 生成视频的方法,视频中有机器鸟飞过发光的藤蔓,藤蔓缠绕着古代废墟。我将逐步分解一切,以便您可以跟随!

  1. 前往 Sora.com
  2. 选择计划
  3. 浏览 Feed 以获取灵感
  4. 添加文本提示
  5. 查看视频设置和生成
  6. 编辑您的视频
  7. 访问快速操作

步骤 1:前往 Sora.com

告诉 Sora AI 我的生日。

我首先前往 sora.com 并告诉 Sora 我的生日。

步骤 2:选择计划

选择 ChatGPT 计划以开始使用 Sora AI。

要开始使用 Sora AI 创建视频,我需要选择两个计划之一:

  • ChatGPT Plus 计划(20 美元/月)
    • 允许每月生成最多 50 个视频
    • 视频限制为 720p 分辨率,最大时长为 5 秒
    • 视频将带有水印
  • ChatGPT Pro 计划(200 美元/月)
    • 允许每月生成最多 500 个视频
    • 支持更高的分辨率(最高 1080p)和更长的视频(最高 20 秒)
    • 无水印

我选择了 ChatGPT Plus。要生成更多视频且无水印,请升级到 ChatGPT Pro!

步骤 3:浏览 Feed 以获取灵感

Sora AI feed 中包含可以使用 Sora AI 生成的视频示例。

选择计划和用户名后,我被带到了我的 feed!那里有一些非常有灵感的视频示例,展示了我可以使用 Sora 创建的内容类型。

屏幕底部是我的“作曲家”。这是我可以描述想要 Sora 为我制作的视频的地方。

步骤 4:添加文本提示

向 Sora AI 添加文本提示。

我想生成一些有趣且复杂的东西来测试 Sora,因此我插入了以下文本提示:

“显示一个霓虹丛林,发光的藤蔓缠绕着古代废墟,机器鸟在上空滑翔,人们都惊叹不已。”

步骤 5:查看视频设置和生成

选择设置以使用 Sora AI 生成视频。

从那里,我查看了我的设置,以确保我要生成的视频看起来像我想要的那样。

以下是从左到右的选项:

  • 添加样式预设(气球世界、定格动画、档案、黑色电影、纸板和纸浆)。我将其保留为默认(无)以获得最逼真的外观。
  • 更改长宽比(16:9、1:1 或 9:16)。我将其保留为默认(16:9)。
  • 增加分辨率(480p、720p 或 1080p)。我选择 720p 作为 ChatGPT Plus 计划上的最高分辨率。升级到 ChatGPT Pro 以访问更高的分辨率!
  • 增加持续时间(5、10、15 或 20 秒)。我将其保留为 5 秒,因为这是 ChatGPT Plus 计划上的最长持续时间。升级到 ChatGPT Pro 以访问更长的持续时间!
  • 从提示中选择生成的视频数量(1、2 或 4)。我只能从此文本提示中生成一个视频,使用 ChatGPT Plus 计划。升级到 ChatGPT Pro 以从每个文本提示中生成更多视频!

将鼠标悬停在帮助(问号)图标上会告诉我使用这些设置创建视频将消耗多少积分。

一旦我对我的设置感到满意,我就点击箭头开始创建我的视频!

立即,视频开始生成。几秒钟后,我的视频就完成了。

以下是它的成果:

总体来说,我对视频的质量印象深刻!Sora AI 准确地生成了我描述的内容,而且只需几秒钟。

步骤 6:编辑您的视频

Sora AI 生成视频的编辑工具栏。

但这还不是全部。选择我刚刚使用 Sora AI 生成的视频会在屏幕底部打开编辑工具栏。

有几种方法可以编辑我的剪辑:

  • 编辑提示:修改提示并创建新视频(“E”)
  • 查看故事:查看和编辑此视频的故事板(“V”)
  • 重新剪辑:在新故事板中修剪和延长此视频(“C”)
  • 混音:描述更改并根据此视频创建新视频(“R”)
  • 混合:在此视频和另一段视频之间进行过渡
  • 循环:创建此视频的无缝循环(“L”)

步骤 7:访问快速操作

Sora AI 上的快速操作。

右上角有几个快速操作:

  • 收藏
  • 共享选项(复制链接或取消发布)
  • 下载

这就是使用 Sora AI 生成视频的全部内容!总体来说,我对 Sora AI 如何快速准确地生成我的视频以及质量有多高感到印象深刻。

9 个撰写有效 Sora 提示的技巧

  1. 在提示中要非常具体。可以把它想象成给一个非常有才华的电影制作人指示,每一个细节都必须详细说明。我发现,模糊的提示(如“显示一个美丽的日落”)不如具体的提示(如“以 4K 分辨率和广角镜头拍摄的太平洋上金色日落的电影般的宽屏镜头,波浪轻轻拍打着沙滩,带有反光镜头光晕”)有效。
  2. 考虑从摄像机角度和运动开始。类似“平滑的跟踪镜头从左到右移动”的东西为 Sora 提供了明确的电影指导。该模型对电影语言理解得非常好,所以不要害怕使用诸如“手持镜头”或“空中镜头”之类的术语。
  3. 描述照明条件。无论您是想要“中午的强烈阳光投下尖锐的阴影”还是“柔软、漫射的金色日出光”,对光线的具体描述都有助于 Sora 创建更逼真和更具氛围的视频。
  4. 要具体描述运动。不要只是说“一只奔跑的马”,尝试“一匹栗色种马在薄雾笼罩的草原上慢动作奔跑,马鬃在风中飘动”。
  5. Sora 可以处理一些相当先进的电影概念。想要深度?提到“浅景深和背景虚化”。正在寻找特定的色彩分级?尝试“柔和、去饱和的色调,强调蓝色和绿色”。
  6. 描述时间和天气条件也会产生巨大的差异。我已经看到,当指定诸如“清晨的雾气正在滚滚而来”或“暴风雨云正在聚集,偶尔伴有闪电”之类的东西时,会产生惊人的效果。这些环境细节有助于创建更具沉浸感和更逼真的场景。
  7. 指定持续时间和节奏。Sora 可以生成长达 20 秒的视频,但您需要考虑如何使用该时间。类似“20 秒的连续镜头,逐渐从白天过渡到夜晚”之类的东西为 AI 提供了明确的指导。
  8. 要具体描述您的角色和物体。不要只是说“一个人走路”,尝试“一位中年女性穿着红色大衣,坚定地走在拥挤的城市街道上”。
  9. 虽然 Sora 非常强大,但它并非魔术。我已经学会避免不可能的复杂场景或物理上不可能的摄像机运动。保持事情在可以实际拍摄的范围内往往会产生更好的结果。

请查看 OpenAI 的最新文档,以获取最新的提示工程指南和最佳实践。

但最重要的是,不要害怕尝试!我看到的一些最令人印象深刻的 Sora 视频来自创造性的提示和跳出思维定势的思考。只要记得在您的说明中要详细、具体和清晰。

顶级 Sora AI 替代品

以下是我尝试过的并且推荐的 Sora AI 的最佳替代品。

Pictory

我推荐的第一个 Sora AI 替代品是 Pictory。我已经尝试过两者,我最喜欢 Pictory 的是,它大大减少了我的制作时间,这样我就可以专注于创造力!

Pictory 和 Sora AI 都可以快速将文本转换为引人入胜的视频。然而,Pictory 在提取现有长视频的亮点方面更为出色。

如果您想创建适合社交媒体的现有长内容的精彩片段,请选择 Pictory。如果您想创建 AI 能够制作的最具电影感的视觉效果,请选择 Sora AI!

阅读我的 Pictory 评论 或访问 Pictory

Synthesys

我推荐的下一个 Sora AI 替代品是 Synthesys。我最喜欢 Synthesys 的是,它非常容易创建专业的内容,而无需任何花哨的设备!

两个平台都使用 AI 将文本转换为引人入胜的视频。它们都热衷于高质量的输出和快速的内容生成。然而,每个平台都有自己独特的创意故事方法。

一方面,Synthesys 以其全面的 AI 内容套件而脱颖而出。它在一个平台中处理语音、视频创建和图像生成!

另一方面,Sora AI 专注于将文本转换为高度逼真的视频。另外,其混音、混合和分镜功能使其非常适合富有想象力的故事讲述。

如果您正在寻找一个简单的多功能 AI 工作室来满足所有内容需求,请选择 Synthesys。对于史诗般的文本到视频魔法,请选择 Sora AI!

阅读我的 Synthesys 评论 或访问 Synthesys

Deepbrain AI

我推荐的最后一个 Sora AI 替代品是 Deepbrain。这是一个全面的视频创建平台,处理从将逼真的 AI 化身融入您的视频到高级编辑等一切内容。

两个工具都允许您轻松生成视频,但每个平台的重点不同。一方面,Sora 快速生成电影般的视频。另一方面,Deepbrain 提供协作功能、庞大的化身库和品牌一致性工具。

如果您想生成电影般的、高质量的视频,请选择 Sora。如果您优先考虑视频创建中的无缝协作和品牌,请选择 Deepbrain!

阅读我的 Deepbrain AI 评论 或访问 Deepbrain AI

Sora AI 评论:适合您吗?

在亲自尝试 Sora AI 后,我对其功能非常印象深刻。我已经尝试了很多不同的 AI 视频生成器,没有一个能与 Sora AI 的视频质量相比。

AI 编辑工具也非常有用且易于使用,让我可以轻松地微调视频!对于电影制作人、营销人员和创意人士来说,这绝对值得一试。我很期待看到 Sora AI 在未来会如何改进,以及它将如何影响这些创意产业。

如果您正在寻找 Sora AI 的最佳替代品,我建议您查看以下选项:

  • Pictory 最适合快速将长内容重用为社交媒体的精彩视频。这些视频非常适合社交媒体。
  • Synthesys 最适合作为一个全面的内容套件,提供 AI 化身、语音和图像生成。
  • Deepbrain AI 最适合那些优先考虑视频创建中的协作、化身自定义和一致的品牌指南的人。

感谢您阅读我的 Sora AI 评论!我希望它能让您充分了解其功能。

不幸的是,Sora 不是免费的。但如果您已经使用 ChatGPT,那么为什么不升级到 Plus 或 Pro 计划并尝试 Sora 呢?看看您可以创造什么!

访问 Sora

常见问题

Janine Heinrichs 是一位内容创作者和设计师,帮助创意人士通过最佳的设计工具、资源和灵感来简化工作流程。您可以在 janinedesignsdaily.com 找到她。