AI绘画工具Midjourney新功能Style Tuner的测试与使用

midjourney2024-01-17 08:09:20561

差不多在一周前,AI绘画工具Midjourney发布了新功能Style Tuner(风格调整器)。本文简要介绍了什么是Style Tuner,如何使用,以及一些使用经验。

(1)什么是Style Tuner

什么是Style Tuner?这个功能有什么用?

简单地说,Style Tuner让用户可以自定义一种风格。

用户可以把任意一段提示词定义为一种“风格”,然后把这种自己创作的“风格”快速复用到后续的绘画中。

用户也可以通过Style Tuner,对某一种众所周知的风格进行自定义,使之更加符合自己的要求。

举个例子,当我们在Prompt中写下“in the style of hard sci-fi”这段提示词的时候,表面上我们要求AI画一幅“硬科幻”风格的作品,但是仔细想想,我们所谓的“硬科幻”是一回事吗?当我们在说“硬科幻”的时候,我们到底在说什么?它是2D,还是3D?会具有赛博朋克(cyberpunk)元素吗?还是会更靠近某一部作品的风格呢?

Style Tuner让我们对某一种风格进行自定义成为可能。

(2)如何使用Style Tuner

在Midjourney的对话框中输入/tune,就可以触发Style Tuner功能。

例如,我输入了“low contrast, low saturation, Morandi color scheme”(低对比度、低饱和度、莫兰迪色系),Midjourney会弹出两个设置参数:

  • 16/32/64/128 Style DIrections

  • Default/Raw mode


第一个参数选择的是可供选择的“风格方向”数量。

如果选择32,那么Midjouney就会生成64幅图片,每2幅图片一组,每一组图片都代表一种“风格方向”。用户需要在每一组图片的两幅中,选择自己喜欢的那一幅,也可以都不选。最终,用户的选择会融合在一起,定义这种“风格”的样子。

风格方向的数量越多,用户消耗的“快速生成”(Fast Generation)时间就越多。如图所示,如果我们选择32 Style Directions,就会消耗0.3小时。如果选择64,就会消耗0.6小时,选择128会消耗1.2小时。Midjourney的标准月费30美元,每个月一共只有15小时的快速生成时间。所以Style Tuner是一个需要合理规划使用的功能。

第二个参数选择的是“风格方向”的模式,默认或者Raw。

单词raw翻译过来的意思是原生的、未经处理的。

在摄影领域也有raw的概念,全称是Raw Image Format,即未经加工的图像格式,可以简单理解为相机由光信号转化为数字信号时的最原始图像数据,未经曝光、白平衡等处理。

Raw模式可以理解为算法模型的原生图像模式,该模式下模型不会根据自主观点改变图像内容和风格,内容更加接近提示词所描述的内容。

在选择了32“风格方向”后,Midjourney很快生成了32组图片。生成结果是一个链接,用户可以在网页上对风格进行编辑。

进入页面后,我们就可以看到想定义的提示词、基本规则的说明、以及两种选择模式。

如果是默认的“Compare two styles at a time”,就如图中的“第1组”图片所示,每一组有4张,用户可以选择左边的风格方向,也可以选择右边的风格方向。至于剩下31组图片就通过滚动条往下拉吧。

如果选择“网格”模式,每一组只有1张,用户同样可以在每一组的左右两张之间选择。

用户不需要把32组图片都选完。并不是越多就越好,并不是越多就越接近自己想要的理想结果。官方推荐5-10种比较好。

在网页的底部有一个code,这个code可以被用在Prompt里面,把定义后的“风格”应用在绘画中。

每当用户改变32组图片中任意一项选择,这个code都会改变。

当自己在某一组“风格方向”中,改变左右的选择,或者干脆不做选择,用户几乎不可能知道这会对最终的结果产生怎样的影响。

事实上,这不是一个1+1=2的游戏,而更像是一个1+1约等于2的猜想。

我们只能通过选择去接近自己想要的风格表达。

用于编辑风格的网页链接不是一次性的,所以用户可以维护一个自定义风格的网页列表。

这些风格code也可以分享给其他人使用,现在确实也已经出现了一些分享风格code的网站。

(3)风格code的格式

Code在Prompt中的编写格式就跟Midjourney之前其它一些参数的格式是一样的。比如定义比例的--ar,可以作为后缀写在Prompt后面,如果写“--ar 21:9”,那么生成的图片比例都会是21:9。

以本文中的code为例:
a young astronaut, low contrast, low saturation, Morandi color scheme, --style kONYfPicnE7tJZT1

当然,我们也可以直接使用code,生成的结果往往会跟配合Prompt一起使用有所区别:
a young astronaut, --style kONYfPicnE7tJZT1

多个code也可以连在一起使用,以“--style code1-code2-code3…”这种格式。

用户还可以用“--stylize”来调整风格强弱,默认值为100。加入风格强弱参数后的提示词:

a young astronaut, low contrast, low saturation, Morandi color scheme, --style kONYfPicnE7tJZT1 --stylize 250

(4)风格code的测试和使用

一种对Style Tuner的使用方法,是把多段提示词作为一个整体进行定义。

比如在上文中,我们就把【low contrast, low saturation, Morandi color】这三个效果作为一个整体合在了一起。

提示词:

a young astronaut, in the style of sci-fi, low contrast, low saturation, morandi color --style kONYfPicnE7tJZT1 --ar 21:9 

如果使用Raw模式,我们也可以比较一下差别。

提示词:

a young astronaut, in the style of sci-fi, low contrast, low saturation, morandi color --style raw-kONYfPicnE7tJZT1 --ar 21:9

另一种对Style Tuner的使用方法,是把提示词片段分别进行定义,然后通过后缀的--style code1-code2-code3…这种格式,把更加可控的效果叠加,输出更加稳定的结果。

比如下面这个例子,我们就做了一个【low contrast, low saturation】+【Blue in Morandi color】,由于单独对“莫兰迪蓝色”做了定义,所以可以看到明显差别。

下面是另一个例子,我们对三个提示词分别做了定义,做了一个【low saturation】+【Morandi Blue】+【sci-fi style】

网上也可以看到很多人分享的code,但是需要注意一点,这些code往往需要跟特定的提示词一起使用,才可以得到作者分享的样图效果。

比如下面这个由作者Tatiana Tsiguleva分享的一个叫做“Clean Universe and Science Fiction”的style code "2dQJV5KAaXqo"。它其实是配合前面的“Black and White Photography”等提示词一起使用的。

如果单独复制粘贴code,那得到的结果就会跟样图完全不同。

总的来说,Style Tuner是一个很好用的新功能,蕴含着无限可能,通过Style Tuner功能,我们可以对各种提示词的最终效果进行一定程度的自定义,对“炼丹”最终效果的稳定性施加影响。

如果把这些提示词比作“基因”,那么我们就可以直接对这些“基因”进行编辑,对这些“基因”中的一些“片段”进行选择,从而实现我们想要的表达。

Enjoy and have fun~ :)

本文链接:https://mid-journey.vip/midjourney_96.html

相关文章

网友评论