Midjourney AI V6版本详解

在我写完 Vercel V0这篇文章的时候，MJ发布了V6版本，来的是如此之快，又如此的之慢，等待了这么久，要好好测评一番，发现各位大佬更新的是如此之快，只有我比较慢。

评测标准

根据之前提起的融合污染有没有解决，文字是否能完整的展示在图片上，以及语句是否再次简化，V6的模型在各种风格上和V5.2做对比（文字超了）。

那么要想从这几个方面评测，需要先看一下官方放出的V6版本公告都写了什么，以及为什么这么写。

官方更新说明

要启用它，请在/settings下拉菜单中选择V6，或在提示后键入--v 6。

V6基础模型有什么新功能？

1.更准确的提示跟随和更长的提示

2.提高了一致性和模型知识

3.改进了图像提示和混合

4.微小的文本绘制能力（您必须在“引号”中写入文本，--style raw 或较低的 --stylize 值可能会有帮助）/imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6

5.改进的升频器，具有“微妙”和“创造性”模式（将分辨率提高2倍）
（在点击U1/U2/U3/U4后，您将看到这些按钮在图像下）

在启动时支持以下功能 /参数：--ar，--chaos，--weird，--tile，--stylize，--style raw，Vary（微妙），Vary（强烈），Remix，/blend，/describe（只是v5版本）

这些功能目前尚不支持，但应在接下来的一个月内推出：Pan，Zoom，Vary（region），/tune，/describe（新的v6版本）

V6 的样式和提示
与 V5 相比：使用 V6 提示方式有很大不同。您需要“重新学习”如何提示。V6 对您的提示更加敏感。避免“award winning, photorealistic, 4k, 8k/获奖，照片般逼真，4K，8K”等“垃圾”内容明确表达您的要求。可能不那么时尚，但如果您表达明确，它现在会更好地理解您。如果您想要更具照片感/更少见解/更字面的东西，您可能应该使用 --style raw
--stylize 的较低值（默认为100）可能具有更好的提示理解，而较高值（最高为1000）可能具有更好的美感请在⁠ #prompt-chat 中互相交流，以弄清如何使用v6。

请注意：这是一个 Alpha测试版本。事物将频繁更改，不会另行通知。不要依赖将来会提供此精确模型。随着我们将V6推向完整发布，它将发生显著变化。速度，图像质量，一致性，提示跟随和文本准确性应在未来几周内得到改善
V6相对于V5而言更慢/更昂贵，但随着我们的优化，速度将变得更快。支持Relax模式！（每分钟大约1个gpu/imagine和每分钟2个gpu/upscale）

社区标准：该模型可以生成比我们之前发布的任何东西都更真实的图像。我们已经提高了审查系统，并将以更严格和严密的方式执行我们的社区标准。不要做恶作剧或创造引起争端的图像。

关于V6的更多信息：V6是我们在AI超级集群上从头开始培训的第三个模型。它已经在进行了9个月。V6并不是最终步骤，但我们希望大家感受到某种深刻地与我们集体想象力的力量紧密交织在一起的东西的进步。

在⁠ #v6-showcase 中展示您的图像，或在 #⁠ideas-and-features 中告诉我们您的想法。

官方#Prompt-chat频道说明

V6版本为什么要“重新学习”做出了解答，以前的公式停留在V5.2版本以前了。

我们先点开第二条，不要问为什么，先看。

多主题语句公式

这是一个在 V6 中适用于多个主题的起始公式。

如果你愿意，你可以将 V6 看作有四个可选的部分。这完全取决于你的提示以及作为艺术家对你来说什么是有意义的。

[原型场景] + [回调细节] + [设置细节] + [氛围或审美]

[原型场景] -描述主要提示

对于有意义的提示，使用原型场景在第一语句中以通用术语设定场景。在这里有一个具体性的提示，不需要太长。

好的提示词：Three friends sitting on a park bench/三个朋友坐在公园的长凳上。

更好的提示词：Three different friends sitting on a park bench/三个不同的朋友坐在公园的长凳上。(没有"different/不同"，Midjourney会决定他们的一般外貌，他们可能看起来相似。)

最好的提示词，变得更具体：Three different best friendssitting close together on a park bench/三个不同的最好朋友紧挨着坐在公园的长凳上。（没有“best friends/最好的朋友”和“/sitting close together/紧挨着坐”，我们得到一个更通用的氛围。）

[回调细节] - 语意

对于有意义的提示，使用回调到在场景设置中使用的相同词汇来添加细节。这意味着字面上重复这些词，以在第一语句中设置的内容和您现在编写的细节之间创建联系。

不好的提示词，它没有使用回调：Jennifer is in the middle, a blonde Caucasian woman wearing jeans and a tank-top/詹妮弗站在中间，是一位金发的高加索女性，穿着牛仔裤和吊带背心。

不好的提示词，它没有使用简单的句子：In the middle, wearing jeans and a green tank-top, is the Caucasian friend/站在中间，穿着牛仔裤和绿色吊带背心的是高加索朋友。

更好的提示词，它使用了简单的句子和“the friend/朋友”的回调：The friend in the middle is a cheerful blonde Caucasian woman wearing jeans and a green tank-top/站在中间的朋友是一位快乐的金发高加索女性，穿着牛仔裤和绿色吊带背心。

[设置细节] -环境/背景/背景的细节

对于有意义的提示，在提示的末尾添加有关环境或背景的细节。

不好的提示词，对于V6来说有点模糊，可能有效：There are live oaks and pigeons/有活橡树和鸽子。

更好的提示词，更加清晰一些：There are some pigeons on the sidewalk. In the background are some live oaks/人行道上有一些鸽子。背景中有一些活橡树。

最好的提示词，更加具体：There are two pigeons on the sidewalk in front of the bench. In the background, the empty park contains some old live oak trees/在长凳前的人行道上有两只鸽子。在背景中，空荡荡的公园里有一些古老的活橡树。

准备好在看到事物变得不一致时将具体信息回退或从提示中删除。

[氛围或审美] - 风格

在提示的末尾添加有关图像的氛围/审美的细节。长度可以随意。请注意，没有太多视觉语义内容的词汇在画布上不会起作用。

摄影类的

不好的提示词：照片/Photo。

更好的提示词：彩色摄影/Color photography。

最好的提示词，命名具体的灵感来源，如摄影师的名字或出版物：受《Southern Living》杂志启发的彩色摄影。

非摄影类的

不好的提示词：艺术/Art。

更好提示词：数字艺术/Digital art。

最好使用形容词并命名具体的灵感来源，如艺术家的名字或艺术的类型/学派/流派/媒介：由 Krenz Cushart 和 Tom Bagshaw 创作的时尚数字艺术。

示例结果

以下是使用该模板的示例结果，如果对您来说探索它有意义的话。由于V6在自然语言方面非常智能，没有强烈的准则，但在编写复杂提示时，有些人可能会喜欢使用模板作为他们自己的发现和探索的起点。

原文提示词：Three different best friends sitting close together on a park bench. The friend in the middle is a cheerful blonde Caucasian woman wearing jeans and a green tank-top. The friend on the right is a serious African American man dressed in a tuxedo. The friend on the left is a laughing Indian woman wearing orange Hindi traditional robes. Stylish digital art by Krenz Cushart and Tom Bagshaw. --v 6.0

翻译提示词：三位不同的最好朋友紧挨着坐在公园的长凳上。中间的朋友是一位快乐的金发高加索女性，穿着牛仔裤和绿色吊带背心。右边的朋友是一位穿着燕尾服的认真的非洲裔美国男士。左边的朋友是一位穿着橙色印度传统长袍的笑着的印度女性。由 Krenz Cushart 和 Tom Bagshaw 创作的时尚数字艺术。--v 6.0

以上解释了为什么要重新学习提示词的原因，以及多个人物和角色提示要怎么写。该公式也必然适合人物少的情况下，看似没有融合污染，语句反而没有得到简化。

我们按照这个语句公式测试一下，看看多个动漫人物角色是否有融合污染。

提示词：Two different best friends stood apart on the towering mountains on either side. The friend on the left is an angry blond Saiyan male wearing jeans and a tank top. The friend on the right is a serious Saiyan man in a tuxedo. Fashion digital art created by Dragon Ball and Akira Toriyama.--v6

翻译词：两位不同的最好朋友分开站在两边高耸的山上。左面的朋友是一位生气的金发赛亚人男性，穿着牛仔裤和背心。右面的朋友是一位穿着燕尾服的认真的赛亚人男士。由七龙珠和鸟山明创作的时尚数字艺术。

看来我对MJ期待过高了，融合污染还是有，人家都在搞视频了，你们在搞什么，更新了这么久，都V6版本了，融合污染还没解决，你看那人物的脸...等等，我指定这两位名字看看效果。

提示词：Two different best friends stood apart on the towering mountains on either side. The friend on the left is an angry blond Saiya Vegeta male wearing jeans and a tank top. The friend on the right is a serious Saiyan man named Kakarot in a tuxedo. Fashion digital art created by Dragon Ball and Akira Toriyama.--v6

翻译词：两位不同的最好朋友分开站在两边高耸的山上。左面的朋友是一位生气的金发赛亚人贝吉塔男性，穿着牛仔裤和背心。右面的朋友是一位穿着燕尾服的认真的赛亚人卡卡罗特男士。由七龙珠和鸟山明创作的时尚数字艺术。

指定的动漫人物融合污染还是有，没有根本解决，有可能这次V6测试版的原因吧...我们继续回到第二条界面看看说了什么...

V6是Midjourney提示的一场革命

V6基于语义和自然语言，每个 /imagine 相比之前的版本都有大量的内存，这意味着提示可以又长又详细。您可以控制构图，拥有多个主题，并添加文本。

要激活V6，请键入/settings并从版本下拉菜单中选择它。

1.提示有效长度现在为350+字符

画布上的一致性与提示使用的可用内存有关。在V5中，仅前15-20个单词在我们耗尽内存之前对画布产生了强烈的影响，然后我们看到单词的影响减弱。

在V6中，我们获得了更多的内存，因此可以说我们有350到500个字符，也许更多。提示使用的可用内存似乎与单词的语义内容相关。

例如：这个15个字的短语 - "the the the the the an an an an an this this this this this" - 没有特定的语义内容，似乎使用了我们的可用内存很少。但是用来生动描述三个牛仔的相同 15个词 将意味着由于我们剩余的内存，第四个牛仔将很难呈现。

因此，V6 没有一个提示长度，而是一个“语义上限”，对每个提示都会有不同的影响。

2.您可以指定颜色和其他细节

在V5中，我们倾向于原型。我们让 Midjourney 选择如何渲染图像，因为它自己的决策会更一致，而我们对控制的尝试将被忽略。

在V6中，我们仍然给 Midjourney 一个原型，但现在我们努力用自然语言表达的细节来控制 Midjourny 的渲染。（详情看上方多主题语句公式）

3.您可以使用语言控制构图，在画布上放置物体

在V5中，介词短语经常无法理解。在V6中，它们几乎总是被理解。这真是令人惊叹。现在我们有可靠的介词短语，很容易将事物相对放置，并控制相机。

我们如何控制构图？探索吧！但这里有一个起点：用简短的短语描述一个通用的图像更可靠，然后从画布的焦点开始填充细节。确定焦点后，填写周围的细节。

原文词：There are three baskets full of fruit on a kitchen table. The basket in the middle contains green apples. The basket on the left is filled with strawberries. The basket on the right is full of blueberries. In the background, there is a blank teal wall with a circular window.

翻译词：在厨房桌上有三个装满水果的篮子。中间的篮子里装满了青苹果。左边的篮子里装满了草莓。右边的篮子里满是蓝莓。在背景中，有一面空白的青绿色墙，上面有一个圆形窗户。

4.您可以向图像添加文字

这真是令人难以置信的酷。要将文本添加到图像中，请将要打印的文字放在“引号”中，并确保您的提示包含一个在语义上合理的位置来打印文本。

You can also print text on things, such as:speech bubble, post-it note, book cover, poster, sign, t-shirt, mug, billboard, newspaper, magazine, greeting card, envelope, license plate, calendar, ticket, product packaging, business card,etc.

使用短语如：说，印在，题为，铭刻有，标有，品牌为，用浮雕，用雕刻，用邮票，点缀有，用字母书写，等等。您还可以在事物上印刷文本，比如：对话框，便利贴，书皮，海报，标牌，T恤，马克杯，广告牌，报纸，杂志，贺卡，信封，车牌，日历，门票，产品包装，名片等。

要使文本或字母单独出现，有时在提示中添加短语 “typography design” 会有所帮助。

如果您希望画布其他地方为空白，您可以尝试使用在白色背景上孤立的短语。

原文词："Hello World!" written with a marker on a sticky note

翻译词："Hello World!" 用记号笔写在便签上。

我们继续测试一下，看看是否在图片上表达出准确的文字

提示词："Pork Belly" is written on the license plate.-v6

翻译词：“五花肉”写在车牌上。

注意：汉字是不可以的，只能是英文，4张里面有一张是能用的，其他的文字如图2，少字母。

5.您可以为多个主题提出提示

在V5中，一个主题可以被漂亮地渲染，但两个主题会混合在一起...而对于大多数人来说，三个主题是无法实现的。

但在V6中，既可以漂亮地渲染一个主题，也可以漂亮地渲染两个主题，三个主题开始混合但可以进行控制 (听听得了，不要信，根据上面的测试，官方说的是在没有固定角色的情况下可以实现，没有融合污染)。

6.如果细节在整个图像上泄漏，我该怎么办？

在V6中，泄漏不会像在V5中那么容易发生，但仍有可能发生。

在提示的前端建立的图像比在提示的末尾建立的图像更容易融入提示的其余部分。

例如：在提示的前端建立的一位穿着传统服装的印度女性的图像可能会将印度珠宝和其他细节添加到其他主题中。

如果您观察到这种混合效果，可以启动一个新的 /imagine，并将容易混合的图像移动到提示的末尾。

处理混合的第二种方法是替换细节。如果看到出现不良细节，请指定应该出现的内容。您的细节将覆盖由于混合而出现的细节。

但是，在对混合感到沮丧之前，请仔细查看您的网格。请记住，在网格中有1或2个可用图像意味着您有一个好的提示！

7.如果我的图像看起来模糊或不清晰，我该怎么办？

在 V6 alpha 版本中，如果您的提示非常复杂，可能会注意到模糊或不一致的细节。

以下是探讨解决一致性或清晰度问题的三种策略。在对一致性感到绝望之前，请检查您的网格以获取成功的结果。请记住，在网格中有1或2个可用图像意味着您有一个好的提示！

最可靠的方法是删除细节。一致性问题有时与提示的内存耗尽相关。因此，浏览提示并重写以删除不必要的细节。

有时，添加关键细节。有时，增加具体性有助于提高一致性。给模糊的手和手臂一些事情可做，比如双手叉腰，或双手拿着咖啡杯。给模糊的面部一个情感，比如笑或看起来宁静。同时进行A和B是更强大的方法。

如果您有GPU分钟，追求一致性。找到网格中最一致的图像，将其升频多次，直到找到具有所需一致性的图像。同时进行A + B + C是最强大的方法。

8.如果画布上没有显示出东西，我该怎么办？

在V6中，细节更难消失，但在提示非常复杂的情况下可能会发生。有三种策略可以探索解决缺失细节的问题。在对Midjourney的不服从感到绝望之前，请检查您的网格以获取成功的结果。请记住，在网格中有1或2个可用图像意味着您有一个好的提示！

最可靠的方法是删除其他细节以腾出空间。有时，缺失细节与提示的内存耗尽有关。因此，浏览提示并重写以删除不必要的细节。

有时，将缺失的部分移动到提示的前端会奏效。将缺失的图像移到上面。从提示的前端到末尾，存在一个逐渐减小的影响坡度，因此将事物移到提示的前端可能有助于给它一个微妙的影响提升。

有时，使用另一种措辞会奏效。尝试用不同的短语替换短语可能有帮助。例如，如果“两只鸽子”不起作用，请尝试“一对鸽子”。这对每个提示都有不同的效果。

有时，降低样式化会奏效。降低样式化的风险是失去一致性，但对于具有自己氛围/审美内容的提示来说，这是值得探索的。

注意

重复的单词和短语可能不会产生预期的效果。

在V5中，我们依赖于重复的单词和短语，以确保它们在画布上产生一些影响。但在V6中，重复不总是会产生相同的效果。作为一个社区，我们可以探讨这如何发挥作用。

在V6中，使用小权重来强调短语是无效的。

在V5中，将一个单词或短语添加到多提示中，并为其分配一个小权重以突出显示是促使缺失细节出现在画布上的好方法。但是这种技术在V6中不起作用。作为一个社区，我们可以探讨多提示的新用途。

总结

多个动漫角色融合污染依然存在，英文字母能在图片上展示，V5.2版本公式依旧可以用，但不适用V6版本，没有做版本对比，有两个原因，1现在是测试版，2文字内容超标，且各位大佬都测过了，等版本稳定了我在测试，有小伙伴问我为啥第一时间没发表，因为公众号每天只能发表一篇...

福利

上期结尾有写，语雀里面整理了211篇文档，共有 402731 字有关AIGC的相关文章，MJ手册的规范使用说明，文章包含了很多大厂经验总结。无偿且标注了文章来源，希望对大家有所帮助，请多多转发！！

地址：https://www.yuque.com/frannnk7/aidesign?# 《AIGC Design 手册》

历史文章

MJ插件

有意向或者感兴趣的小伙伴欢迎加入AI学习交流群。

‍

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

{{userData.name}}已认证

国风·孤城黄沙

🎄圣诞 🦌

Stable Diffusion 从0-1学习指南！5步拆解关键词权重及高阶用法

公主👑

美学孤诣每日AI提示词02

清晨见金龙鳞-好事发生（AI造字流程）

6000字超详细复盘！《AI你·南京》AIGC城市宣传MV全流程制作解析

Stable Diffusion | 13款卡通动漫模型出图测试

BLUE周刊-Vol.096

不同文化中颜色的含义有何不同

Pika: 将创意想象转化为现实的AI视频生成工具

MuseTalk：腾讯的实时音频驱动唇部同步技术，创新视频制作

UIED-用户体验学习平台

支持与服务

关注我们

设计文章

关注交流

{{userData.name}}已认证

Midjourney AI V6版本详解

国风·孤城黄沙

🎄圣诞 🦌

Stable Diffusion 从0-1学习指南！5步拆解关键词权重及高阶用法

公主👑

美学孤诣 每日AI提示词02

清晨见金龙鳞-好事发生（AI造字流程）

6000字超详细复盘！《AI你·南京》AIGC城市宣传MV全流程制作解析

Stable Diffusion | 13款卡通动漫模型出图测试

BLUE周刊-Vol.096

不同文化中颜色的含义有何不同

Pika: 将创意想象转化为现实的AI视频生成工具

MuseTalk：腾讯的实时音频驱动唇部同步技术，创新视频制作

美学孤诣每日AI提示词02