Refresh

This website www.unite.ai/zh-CN/mastering-ai-art-a-concise-guide-to-midjourney-and-prompt-engineering/ is currently offline. Cloudflare's Always Online™ shows a snapshot of this web page from the Internet Archive's Wayback Machine. To check for the live version, click Refresh.

存根 掌握 AI 艺术:中途和即时工程简明指南 - Unite.AI
关注我们.

即时工程

掌握人工智能艺术:中途和即时工程简明指南

mm

发布时间

 on

中途生成UNITE AI LOGO

MidJourney 人工智能生成艺术简介

人工智能正在迅速突破不可能的障碍,最近还侵入了艺术领域,彻底改变了它。 现在,您无需成为美术大师或 Photoshop 专家即可将您的想象变为现实。 一个简单、清晰的提示就是您所需要的,这要归功于 中途.

这一切都始于 2022 年 DALL-E、Midjourney 和 StableDiffusion 等突破性技术的推出。虽然这些创新中的每一项都为生成人工智能的画布带来了独特的触感,但 Midjourney 继续了其引人入胜的旅程,使得值得注意的进步。

Midjourney 是目前市场上领先的高分辨率文本到图像 AI 生成器,它以其独特的文本到图像生成、媒体编辑和升级以及活跃的艺术社区访问融合而脱颖而出,所有这些起价为每个 10 美元月。 这套全面的功能为艺术家、技术爱好者和人工智能专业人士提供了令人兴奋的画布,构建了一个创造力和创新的环境。

艺术界当然已经注意到了,艺术市场中的生成式人工智能预计将出现惊人的增长 40.5%的复合年增长率。 Midjourney 在利用人工智能打造最真实、最优质的视觉效果方面无与伦比。

有效的即时工程不仅仅是创造; 它包含最佳实践。 提示应该清晰、简洁,同时为人工智能提供足够的指导,而不需要过多的规定。 此外,在设计过程中还必须考虑目标受众,考虑年龄、性别、文化背景等变量。

中途旅程如何运作?

中途之旅利用了两本小说 机器学习 技术——大语言和扩散模型。 该语言模型类似于 ChatGPT 等人工智能聊天机器人,可帮助 Mid-Journey 解释提示的含义并将其转换为向量。 然后这个向量引导扩散过程。

Midjourney 的内部运作基本上没有公开。 尽管如此,很明显它使用了两种相对新颖的机器学习技术的文本到图像生成:大型语言模型和扩散模型。 前者可能是 ChatGPT 等人工智能平台的用户所熟悉的,而后者是人工智能艺术生成领域的一个有前途的补充。 整个系统依赖于 CLIP 用于训练的数据集,可以在 OpenAI 的研究页面上找到。

尽管信息有限,但还是可以勾勒出中途旅程的大致轮廓。 扩散模型,恰当地命名为“稳定扩散”。 从本质上讲,Stable Diffusion 是一个开源模型,可以巧妙地将文本提示转换为不同风格和内容的图像。 这个复杂的过程是通过扩散模型实现的,扩散模型是一种连接文本输入和图像输出之间依赖关系的生成模型。

扩散模型建立在去噪扩散方法的基础上,这是一种受非平衡热力学影响的方法。 该方法系统地拆解数据结构,然后将其恢复。 Ho 等人采用了这种方法来生成图像。 2020 年,导致了我们今天看到的扩散模型的诞生。

训练扩散模型涉及两个主要阶段。 最初,前向或扩散过程涉及向输入图像增量添加随机噪声,直到其完全变成噪声。 这个过程由固定的马尔可夫链控制,该链在几个连续的步骤中持续添加高斯噪声。

中途工作演示

随后,在反向或重建阶段,模型从扩散过程中实现的噪声主导状态恢复原始数据。 该过程由具有学习高斯转换的马尔可夫链驱动,这意味着任何给定时间的概率密度的预测仅依赖于前一个时间步骤中获得的状态。 由于潜在的“x1,...,xT”与数据具有相同的维度,因此扩散模型分类为潜在变量模型。

中途费用和订阅

虽然 ChatGPT 和 Bing Chat 等许多聊天机器人提供几乎无限制的免费使用,但 Mid-Journey 等图像生成器的情况有所不同。 由于需要大量的计算能力,特别是去噪过程所需的图形处理单元 (GPU) 和视频内存使用量,Mid-Journey 的服务附带了 价格标签.

基本计划从每月 10 美元起,提供约 3.3 小时的 GPU 时间,足以生成约 200 个图像。 然而,有一些更高端的计划在轻松模式下提供无限的图像,尽管等待时间更长。

设置您的中途旅程

  1. 从...开始 中途 包括在他们的官方网站上注册、订阅计划,然后重定向到 Discord。
  2. 一旦您找到中途频道 Discord,导航至左侧的新人群组。 从那里,您可以观察其他用户创建提示,了解中间旅程的机制,并在繁忙的环境中进行交互。
  3. 熟悉环境后,邀请机器人到您的私人服务器不受干扰地创建图像。 该机器人会根据您的提示生成四个预览图像,使您可以选择最符合您最初想法的图像并进一步细化图像。

中途的提示结构

  1. 中途频道内的不和谐频道中的 /imagine 命令会根据简短的文本描述(提示)生成独特的图像。
  2. 要在各种图像中重新创建特定样式,只需在文本提示旁边输入图像 URL 即可。 新的、一致的输出将合并您选择的图像和文本中的元素。
    /imagine http://link-to-your-image –参数1 –参数2
    您可以通过将图像上传到 Discord 频道来生成图像的链接。 上传后,右键单击图像并选择“复制链接”。
    这里 http://link-to-your-image 和参数是可选的。
  3. 接下来,机器人开始处理您的图像,大约需要一分钟时间来提供四种替代方案。 此过程涉及使用强大的图形处理单元 (GPU) 来处理和解释每个提示。
  4. 使用 /info 命令跟踪 GPU 使用情况。 它允许您检查“剩余快速时间”并监控订阅的 GPU 时间。

/info 中途提示

图像放大和更改

要获得更精致的图像,请使用图像下方的“U”按钮来升级您的首选选择。 您还可以使用“V”按钮对特定图像进行调整。 要对放大图像进行进一步更改,请使用“制作变体”、“轻度放大重做”和“测试版放大重做”选项。 “Web”按钮允许您在单独的窗口中查看更大尺寸的图像。

Midjourney 允许通过其 beta 升级重做功能将图像分辨率升级至 2048×2048(方形)和 2720×1530(宽屏)分辨率,默认生成网格尺寸为 1024×1024(方形)和 1456×816(宽屏)。 每个图像都可以通过“U”高档选项进一步增强,从而改善图像的特定部分。

看看这个提示,它可以使用 Midjourney 的 V5.2 版本生成精美的艺术作品。

/imagine 艺术品描绘了星空下的一棵孤独的树,一个孩子在树下读书,以宁静的蓝色和温暖的橙色为色调,灵感来自法国印象派、波斯细密画、包豪斯简约的笔触,让人想起经典的儿童童话插图,实现不对称的和谐,以迷人的民间/天真的方式表达: –ar 15:19 –upbeta –q 2

中途提示指南示例

创建你的第一个中途人工智能艺术

  1. 制定基本蓝图:将自己视为一名艺术家。 首先对您渴望实现的形象进行简单、生动的描述。 概述主题、氛围,甚至是您想要嵌入的细节。 使用逗号、方括号和连字符等标点符号来组织您的想法。 为了获得更好的结果,请明确设计的背景和细节。 主题(例如,龙、老爷车、亚伯拉罕·林肯)、媒介(例如,数字艺术、铅笔素描)、环境(例如,外太空、水下、繁华的城市)、照明(例如,柔和、霓虹灯、背光)等元素、色彩(例如,大地色调、充满活力、柔和)、情绪(例如,忧郁、异想天开、平和)和构图(例如,风景、特写、广角)可能很关键。 例子:
    • 沐浴在阳光下的田园森林,蜿蜒延伸至远方的小径
    • 一座不夜城,霓虹灯反射在人行道上,形形色色的人群在周围闲逛
  2. 注入风格和关键词:Midjourney 的 AI 能够以抽象、超现实或现实等多种风格来说明图像。 通过整合风格或相关关键词,您可以引导人工智能创建反映您视觉的图像。 尝试各种风格和关键词来发现完美的融合。 例子:
    • 这是一幅描绘黎明沙漠的风景画,反映了乔治亚·欧姬芙的风格,以柔和的色调和有机的形式为特色。
    • 受皮特·蒙德里安 (Piet Mondrian) 作品启发,对宁静森林的抽象渲染,以几何图案形成树木和树叶。
  3. 利用高级设置:将 Midjourney 视为您的创意工具箱,其中充满了高级设置,可让您微调生成的图像。 这就像挥舞魔杖一样,使您能够实现随机性、风格化和图像变化的理想平衡。 通过修改这些设置来释放您的创造力,直到找到与您的愿景产生共鸣的完美组合。 例子:
    • 宁静的日式花园,池塘倒映着樱花树 –seed 22 –s 150 –c 40
    • 霓虹灯照亮的反乌托邦赛博朋克城市 –seed 88 –s 600 –c 60
  4. 用权重突出显示元素:将您的图像可视化为一首交响乐,每个元素都为宏伟的整体做出贡献。 使用“::”符号,您可以指定图像中各种元素的重要性,从而控制聚光灯。 例子:
    • [优雅的孔雀]::3 栖息在[紫藤树]::1 绽放着生机勃勃的花朵
    • [一头雄伟的大象]::2 沐浴在[落日]::1 大草原的光芒中
  5. 旅程中是一个反复试验的过程:尝试不同的元素和功能是必要的。 每次迭代都会让您更接近您想象的生动形象。

中途参数

Midjourney 模型使用可调节参数来控制图像生成过程的结果。 这些参数允许用户调整和定制他们生成的艺术作品,微调模型以创建完全适合他们目标的输出。

让我们深入研究基本参数和高级参数、它们的功能以及如何使用它们来充分利用 Midjourney 的功能:

  • 宽高比(–aspect 或 –ar):此参数控制生成图像的宽度和高度之间的比率。 例如,16:9 的比例非常适合 YouTube 缩略图,而 1:1 则可以生成适合 Instagram 的方形图像。
  • Chaos (–chaos):此参数调整初始图像网格的多样性,范围从 0 到 100。较高的混沌值将为您提供不可预测且独特的结果,而较低的值将确保更一致的结果。
  • 否 (–no):此参数可帮助您从生成的图像中消除特定元素或特征。 例如,如果你想要一张没有红色的图片,你可以使用“--no red”。
  • 质量(–quality 或 –q):此设置调整生成图像所需的时间。 更高的质量需要更多的处理时间,但会产生复杂的细节。 该参数的值可以为 25、5、1 或 2。
  • 种子 (–seed):此参数确定起始视觉噪声,充当生成图像的基线。 在相同的提示下使用相同的种子数将给出相似的输出。 它接受 0–4294967295 之间的整数值。
  • 停止 (–stop):使用此参数,您可以提前终止作业,产生不太详细但可能有趣的输出。 范围是 10-100。 例如,如果您指定“–stop 50”,图像生成过程将在完成 50% 时停止,从而生成不太详细、可能抽象的图像。
  • 风格化(–stylize 或 –s):这控制生成图像的艺术应用程度。 较低的风格化值会产生更接近初始提示的结果,而较高的值会产生更抽象和艺术的解释。 在 v5 中,默认值为 100,但您可以将其设置为 0-1000 之间的任意值。
  • 模型版本:您可以使用 –version 或 –v 参数从 Midjourney 模型的各种版本中进行选择。
  • Niji:专门从事动漫风格图像的模特。 可以使用 –niji 参数访问它。
  • Highmi 定义:对于抽象和风景图像,-hd 参数会激活早期模型版本,该版本会生成更大、不太一致的图像。
  • 测试模型:Midjourney 为特定用例提供特殊模型。 –test 和 –testp 分别激活标准测试模型和以摄影为中心的测试模型。
  • Upscaler:Midjourney 算法从低分辨率图像网格开始。 它提供了多种放大模型来增强图像尺寸和细节。
    • Uplight:另一种光放大器(–uplight)提供细节较少但更平滑的放大图像。
    • Upbeta:–upbeta 参数导致图像的附加细节明显减少,更接近原始网格图像。
    • Upanime:–upanime 升级器专为与 –niji Midjourney 模型配合使用而设计。
  • 图像权重:使用 –iw 调整相对于文本权重的图像提示权重。 默认值为 0.25。
  • Sameseed:–sameseed 参数确保初始网格中的所有图像都使用相同的起始噪声,从而创建非常相似的生成图像。
  • 视频:Midjourney 可以使用 –video 参数保存初始图像网格生成过程的进度视频。
  • Creative:使用 –creative 参数,test 和 testp 模型输出更加多样化和创造性的图像。

Midjourney 不断推出更新以增强用户体验,最新版本为 5.2,于 2023 年 5.2 月推出。通过将 –v 5.2 附加到提示符或通过 /settings 命令选择它,用户可以访问此高级模型。 XNUMX 版提供卓越的图像细节,更直观地理解提示,带来更明亮的色彩和改进的构图。

了解人工智能生成的艺术品的版权

人工智能与版权法相结合的中途形象

2023年XNUMX月,美国版权局澄清了对以下内容版权的立场: 人工智能生成的作品。 该政策规定,虽然人工智能创作中的人造元素(如文字或独特的设计)可以受到保护,但人工智能产生的图像不符合版权保护的条件,这符合只有人类创作才有资格获得版权保护的全球规范。

在人工智能艺术的背景下,版权并不简单。 虽然数字艺术有人类艺术家的输入,但人工智能生成的艺术是在没有直接人类干预的情况下创作的,这使得作者身份和所有权问题变得复杂。 根据美国版权局的规定,最初的所有权授予作品的作者——人类创作者。 然而,由于人工智能不能被视为作者,人工智能生成的艺术缺乏明确的所有权。

美国版权局的最新指导意见仅在人工智能艺术包含足够的人类作者时才允许对其进行版权保护。 “足够的人类作者”的水平仍然没有定义,取决于人类参与创作人工智能艺术品的程度。

有趣的是,基于人工智能的图像创作平台Midjourney制定了自己的使用权政策。 免费试用用户可以根据 Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0) 将图像用于非商业目的,并适当注明 Midjourney 的版权。 但是,付费订阅者可以根据一般商业条款将图像用于任何目的,包括商业目的。 版权领域的这种发展呈现出人工智能和人类创造力之间有趣的动态。

利用 Midjourney 进行动态 UI 设计和创意徽标生成

从为网站或移动应用程序设计直观的 UI 到制作独特的徽标和横幅,Midjourney 通过在几秒钟内生成一系列设计替代方案来为内容创建者提供支持。

这是它的工作原理。 每个设计都以提示开始,作为人工智能遵循的蓝图。 假设您正在为在线辅导平台应用程序设计 UI。 典型的提示可能是:“/想象在线辅导平台用户界面,Dribbble,高分辨率,4K,如可汗学院”。

最初的结果可能并不完美。 例如,将“Adobe XD”添加到组合中可能有助于 Midjourney 调整其设计,使其与 Adob​​e XD 更加兼容。 优化的提示将是:

/imagine 在线辅导平台,用户界面,Adobe XD,Dribbble,高分辨率,4K,简约设计

桌面应用程序 UI/UX 设计的中间图像

 

使用 Midjourney 的文本启发徽标或横幅

让我们探索如何为 UNITE AI 创建带有徽标的横幅。

首先,您需要有一个要显示的文本的简单图像。 您可以使用任何图形设计工具或文本编辑器创建此内容并将其上传到您的 Discord 频道。

UNITE 徽标的示例文本
用于创建 UNITE 徽标的简单文本图像

创建横幅的提示是:

/想象字母: UNITE 采用受 AI 启发的未来派字体徽标,带有字母 UNITE –v 5 –ar 16:9

中途提示指南功能屏幕

查看这些示例提示以获得更多想法:

/想象一位孤独的音乐家在黄昏时分在一座漂浮的城市上演奏宁静的旋律,新艺术风格

中途提示指南:印度艺术形象

 

/想象一个未来人在未来派办公桌上工作的图像,周围环绕着全息屏幕和先进技术。 此人穿着时尚的银色连身裤,戴着虚拟现实护目镜。 环境充满了霓虹灯和漂浮的全息图。 气氛充满未来感和高科技,充满兴奋和创新感。 该相机是高分辨率数码相机,精确捕捉每一个细节。 艺术风格融合了赛博朋克和极简主义,注重简洁的线条和大胆的色彩。 在这个独特的并置中合作的导演、电影摄影师、摄影师、时装设计师、漫画家和艺术家包括克里斯托弗·诺兰、罗杰·迪金斯、安妮·莱博维茨、维吉尔·阿布洛、宫崎骏和考斯。

为未来工作人员提供的中途提示

/想象 1940 年代 – 将芭比娃娃塑造成战时护士,在老式陆军医院的环境中照顾受伤的士兵,采用经典美泰插图的风格,带有二战摄影的棕褐色调氛围 8k –v 5 –ar 16 :9

中途提示指南:独特场景中的芭比娃娃形象

/想象一个女人靠在赛博朋克、悬浮自行车、日本动漫、广阔的城市景观、32k、复杂的太空港、转瞬即逝、摩天大楼全景、时尚的框架

赛博朋克风格女孩中途形象

 

最后的想法:通过 Midjourney 探索人工智能艺术世界

请记住,“一张图片胜过一千个文字”。 详细、生动的描述可以创造奇迹。 是的,Midjourney 不是免费使用的。 然而,它正在通过最先进的文本到图像人工智能技术彻底改变艺术世界并扩大我们的创作可能性。 它能够将简单的文本提示转换为高分辨率图像,该工具不仅为艺术家,而且为 UI/UX 设计师、技术爱好者和 AI 专业人士带来了无限的机会。

当您开始中途冒险时,请记住以下一些重要要点:

  • 了解中途提示的基础知识:使用清晰、简洁和全面的描述来概括您的愿景,以有效地指导人工智能。 请记住考虑您的受众,并毫不犹豫地尝试各种风格、情绪和环境。
  • 利用参数:利用 Midjourney 提供的多种高级设置来增强您的创意体验。 从控制纵横比到调整混沌参数以获得独特的结果,每个细节都可以根据您的喜好进行定制。
  • 拥抱迭代过程:您的第一个人工智能生成的艺术作品可能并不完美。 接受这个迭代过程并学习完善和优化您的提示以获得更好的结果。
  • 了解版权影响:虽然人工智能生成的艺术品本身没有资格获得版权,但其中的人造成分可以受到保护。

从本质上讲,人工智能与艺术的融合使创造力民主化,并模糊了人类和机器创作杰作之间的界限。 当我们继续见证生成式人工智能在艺术市场的显着增长时,不可否认的是,由 Midjourney 等平台引领的人工智能艺术革命才刚刚开始。

在过去的五年里,我一直沉浸在机器学习和深度学习的迷人世界中。 我的热情和专业知识使我为 50 多个不同的软件工程项目做出了贡献,特别关注人工智能/机器学习。 我持续的好奇心也吸引了我对自然语言处理的兴趣,这是我渴望进一步探索的领域。