自小红书上的Midjourney教程更新以来,陆续收到很多朋友的咨询,发现大部分人的问题主要集中在2点:首先是不知道调用什么样的指令和参数来解决问题,其次是不懂如何精确控制想要生成的图像。
本文结合我个人的使用经验,给大家带来Midjourney指令和常用参数的详细文字版教程【基础篇】,本期内容干货满满,在此前图文的基础上增加了许多近期刚更新的功能。
相关文章:Midjourney学习指南【入门篇】
我们在看各种相关教程文章或者视频的时候,经常会看到指令(Command)、提示词(Prompt)和参数(Parameter)这几个词,如果不理解它们的概念在操作Midjourney的时候就很容易犯迷糊。因此在介绍具体内容前,有必要先给大家科普下它们之间的区别。
指令指的是Discord的输入框中通过斜杠【/】唤起的命令,它的作用是指定Midjourney机器人需要执行的操作,常见的操作项如生成图像、展开设置项、查看个人信息、切换作图模式等。
当然不只是Midjourney,其他搭载在Discord上的机器人Bot也是通过同样的方式来唤起操作,比如此前给大家分享过的换脸机器人InsightFaceSwap和ChatGPT机器人同样是使用指令来唤起操作,当然不同机器人Bot的Command指令也会有所区别。
大家如果有关注AI领域应该会经常看到Prompt这个词,它的意思可以翻译成提示词、关键词等。不仅限于Midjourney,像ChatGPT等其他AI工具也都是通过prompt来和算法模型发生交互的。因为自然语言的复杂性很高,即使是同一个意思也可以有很多种方式来表达,而目前市面上的模型还无法做到像人类一样准确理解日常对话的语气、语法和上下文,这就需要我们设计好提示词来辅助机器理解我们输入的信息。
正如现实生活中人与人的互动需要一定的沟通技巧,我们可以将提示词看作人和机器的沟通技巧,能不能利用好AI工具,很大程度上都取决于提示词的质量,提示词描述的内容越精确,最后输出的内容也会越符合我们的预期。
在Midjourney中,我们是通过调用imagine
指令来唤起提示词prompt的输入入口,从而与Midjourney的机器人来发生互动。在 Midjourney 的官方介绍文档里介绍了 Prompt 的输入结构,分为三部分:图片提示(Image Prompts)、文本提示(Text Prompt)和参数(Parameters)。
图片提示(Image Prompts)是通过提供图片的URL地址来进行调用,需要放置在提示词的最前面。Midjourney会分析图片中的内容信息,将其结合到生成的图像中。
需要注意的是 Midjourney 跟平时我们使用的AI聊天工具不一样,它无法像ChatGPT直接理解对话,因此文本提示更像是提供一段完整的指令。而且 Midjourney 有违禁词的限制,像苹果输入法中🍑桃子等emoji 就没法输入,因此可能会有部分歧义。
下面我们正式开始Midjourney指令部分的介绍。
唤起指令的方法为输入斜杠【/】+【指令名称】,使用前记得切换到英文输入法。以下是我整理的目前Midjourney所有指令的简介和功能说明汇总表,方便大家快速查阅。
下面针对平时使用较多的常见指令项进行详细说明。
imagine
指令是Midjourney使用最频繁的指令了,毕竟是用于生成图片。在提示框中输入描述文本后回车,等待片刻后即可生成图片。
用于展开设置项,关于设置项的内容我在【入门篇】中做过介绍,这里需要注意的是最后一行的设置项,这几项既除了可以在设置中选择,也可以通过调用指令来进行修改。
该指令用于查看个人信息,比如当前排队和正在运行的作业数、账号订阅的会员类型、续订日期等信息。
describe
是Midjourney近期刚更新的功能,中文翻译是【描述】,实际效果就是通过分析图片内容反向推导出描述的文本提示。
describe
反向推导的关键词可能都不相同。
blend
也被叫做融图,该指令的效果是一次性上传 2-5 张图片,提取图像中关键元素后融合成新的图片。该功能的设计初衷是为了方便移动端用户上传图片,原理和前面提到的调用图片链接URL相同,但缺点是blend
无法添加文本提示内容进行修饰。
设置默认添加到提示末尾的后缀参数。设置成功后,每次生成图像时会自动在提示内容后面加上后缀。如果想清空此前设置的后缀参数,在内容为空时保存即可。
创建自定义变量,使用变量来代替预设的参数后缀,最多可以设置 20 个自定义变量。同样如果要删除变量,在【value】中留空然后保存即可。
查看当前所有的预设变量及其对应的参数后缀。
DM指 Direct Messages 直接消息,该功能用于切换消息通知的状态,开启后允许其他服务器的成员直接发送消息。
获取会员订阅页面的跳转链接,这里的链接只限个人使用。
显示帮助页面,包括新手引导、跳转链接等内容
生成邀请链接,可以发送好友试用
该功能需要配合任务ID来使用。通过调用目前已生成图片的任务ID,可以将绘图任务迁移至其他服务器。
网络上获取:在会员的公共图库中,可以找到自己此前图像的任务ID
图像文件名中获取:下载图片后,文件名的后缀可以看到任务ID
和Discord表情互动获取:发送表情符号 ✉️ 与机器人互动,之后点击信封可以收到Bot机器人回复的任务ID
类似客服机器人,如果有不了解的问题可以直接在这里发起提问,会收到相应的解决方案。
以上就是Midjourney目前全部的指令内容了,随着版本更新,后续肯定还会有新的指令功能不断更新进来。如果想查看最新版教程内容,欢迎加入我的交流群免费获取最新的教程链接,文章底部有进群方式。
介绍完Midjourney的指令,下面就到了最关键的参数部分了。Midjourney中的参数对绘图结果有着至关重要的影响,可以说学会使用参数是使用Midjourney绘图的必经之路。
随着版本迭代,目前Midjourney中预设的参数已有20多种,目前Midjourney中的参数可以分为基本参数和模型参数,当然还有一些像uplight
、width
等适用于早期模型的参数,如今随着版本更新已经被淘汰或直接集成到其他参数中使用,此处不再赘述。
参数通常是作为后缀添加在提示词的末尾,各个参数可以叠加或重复使用,但是靠前的参数优先级更高,会覆盖后面的参数和设置项。随着Midjourney模型的不断更新,不同版本下支持的参数和数值范围也有很大差异,以下是常见参数在各版本模型下的兼容性:
官方用户手册中的信息还是旧版本没有更新,以上参数兼容性经过实测,都是当前的最新数据。目前Midjourney的版本变动频繁,建议加入粉丝群公告有获取最新的教程链接。文章结尾左下角点击阅读原文进群方式。
宽高比用于更改生成图像的宽高比,通常表示为用冒号分隔的两个数字,例如 7:4 或 4:3。
使用方法:--aspect
/ --ar
+空格
+ 宽长比
- 默认比例是 1:1。
- 数值必须是整数,比如使用 139:100 而不是 1.39:1
- 长宽比会影响生成图像的形状和构图,当放大图片时,有些长宽比可能会发生轻微的改变。比如 --ar 16:9(1.75) 最终生成的图片可能是 7:4(1.74)。
- 5:4 多用于传统打印
- 3:2 多用于摄影照片
- 7:4 比例接近于高清电视屏幕和智能手机的比例
--stylize
和--style
2个参数放在一起介绍。前者用于控制图像的风格化程度,后者用于选择版本迭代下的子模型。
stylize
控制生成图像的风格化程度。该参数数值越低,生成图像会越接近提示词,而数值越高则图像艺术表现力越强,和提示词的关联性越低。
使用方法:--stylize
/ --s
+空格
+数值
- V5模型下默认值为100,数值范围 0~1000
- 设置中 Low、Med、High、Very high 分别对应数值50、100、250、750
用于切换版本模型下的各种模式。以V4模型举例,在第四代版本模型迭代过程中产生了4a、4b、4c三种风格稍有差异的子模型/模式,使用style
可以选择其中任意一种来使用。
使用方法:--版本模型
+空格
+ --style
+空格
+ --模式
目前支持模式选择的模型有以下几种:
- V4模型,模式可选择:
4a
、4b
、4c
- V5模型,模式可选择:
raw
- Niji模型,模式可选择:
expressive
、cute
、scenic
相较于上面的模式选择,模型参数用于选择生成图像的版本算法模型,这里主要介绍下模型的使用方法,关于模型间的具体差异后面会单独说明。
使用方法:--v 4
/--v 5
/ --niji
- 虽然越新的模型在性能上提升越大,但并非所有情况下都是模型越新越好,模型选择要根据图像的内容而定,比如Niji模型更适合生成二次元图像
test
、testp
用于测试新算法模型的效果,不是成熟的商业模型,日常基本不会使用
质量参数用于控制图像的细节精细度。其原理是控制图像生成的时间,一般做图消耗的时间越长,生成图像的细节也就会越多,但同时对应的也会消耗更多的GPU资源。
使用方法:--quality
/ --q
+空格
+数值
- V5版本下默认值为1
- 在设置中的 Half、Base、High 分别对应数值 0.5、1、2
- 质量参数并非数值越高越好,具体可以根据图像的内容而定,通常对于抽象艺术的图像建议用较低的数值,而对于细节要求高的图像建议使用较高数值
iw是 Image Weight 图像权重的缩写,其功能是调整图像提示和文本提示之间的权重比例,数值越大则参考图对绘图结果影响越大,反之则影响越小。
使用方法:--iw
+空格
+数值
- 默认数值为100,即100%的完成进度
- V5模型下支持 0.5~2 的数值范围
- 分隔信息源:功能和逗号类似,可以将一个单词拆解成2段来理解。
- 分配信息权重:通过
::
的数值来控制文本的权重比例,数值越大,前面的元素会更加突出展示
使用方法:元素1
+::
+数值(可选)
+空格
+元素2
- 注意和
iw
参数做区别:iw
控制图片和文本权重,而::
控制文本和文本之间权重 - 在具体数值上没有范围限制,其权重分布依据的是比值。如
2:1
和100:50
的效果是完全一样的,且V4版本前只支持整数比值。 - 数值还可以设置为负值-0.5,该情况下的效果等同于
no
参数,都是移除图像中不希望出现的元素
该参数可以设定特定的元素,后续在生成图像时算法会自动规避掉相关元素的出现。比如不希望图像中有水相关元素,就在关键词结尾加上--no water
使用方法:在关键词后加空格,然后带上你不想 AI 生成的内容--no
+元素名称
- 除了实体内容外,该参数还支持颜色、形状等元素
用于控制模型的随机性,数值越高则越可能生成意想不到的结果。如果想让 AI 帮你做一些探索性的事情,建议初期可以将数值调高一点,结果会更加发散。
使用方法:--chaos
/ --c
+空格
+数值
- 默认值为 0,支持数值范围为 0~100 的整数
Midjourney在每次生成图像时后台算法会随机分配一个编码,即seed种子值。目前seed值已支持到42亿,即每次生成图像时有42亿种结果可能,这也是为什么即使是完全相同的提示词,生成的图也会出现差异的原因,而如果直接调用相同seed值即可生成十分相似的图片。所以该参数的作用是调用原有图像的算法来进行绘图。
使用方法:--seed
+空格
+ seed值
- seed值只支持四格图时获取,如果是通过【U按钮】放大后的图,点击【✉️信封】会没有反应
- 注意和任务ID做区分,任务ID是调用生成图像的本次任务本身,因此所有内容会和之前完全一致,而种子seed是调用算法编码,绘图结果还是会有细微差别
该参数用于生成可重复拼贴的图案,如壁纸图案、纹理等。
使用方法:提示词
+空格
+--tile
- 该参数实际只会生成用于重复的单元图
- 如果想预览图像效果,可以用这个网站模拟贴图效果:Seamless Texture Checker
Midjourney生成图像的过程是采用降噪模型,因此会由模糊图像逐渐过渡成最终的清晰图像,而该参数正是用于暂停图片的生成进度,数值上体现为百分比进度。
使用方法:--stop
+空格
+进度值
- 默认数值为100,即100%的完成进度
- 支持10~100的数值范围
使用重复参数可以一次发送多次的重复绘图命令,而无需挨个绘图。使用该参数可以快速获取大量的图像效果,可以理解成将原先的四格图拓展成了8、12、16、20、24…张图。
使用方法:--repeat
/ --r
+空格
+进度值
- 该参数只限标准版和专业版会员用户使用,且必须在快速模式下
- 标准版支持重复次数最多为10次
- 专业版支持重复次数最多为40次
排列提示允许使用快速生成提示的变体。通过在提示中的大括号 {} 内包含以逗号 , 分隔的选项列表,可以使用这些选项的不同组合创建多个版本的提示。
使用方法:{a,b,c}
+{x,y,z}
- 该功能只限专业版会员使用,且必须在快速模式下
- 如果创建的绘图指令超过5条会收到确认提示
- 最多可一次性创建40条绘图任务
Midjourney更新速度比较频繁,后续有其他更新内容我都会实时同步在群文档中,点击底部的阅读原文可获取交流群链接,还有关键词、AI工具等其他福利资源哦~
探索AIGC领域的体验设计师
关注我👀 学习更多AI设计知识~
那就点个在看吧~
⬇️ ⬇️ ⬇️