差不多在一周前,AI绘画工具Midjourney发布了新功能Style Tuner(风格调整器)。本文简要介绍了什么是Style Tuner,如何使用,以及一些使用经验。
(1)什么是Style Tuner
什么是Style Tuner?这个功能有什么用?
简单地说,Style Tuner让用户可以自定义一种风格。
用户可以把任意一段提示词定义为一种“风格”,然后把这种自己创作的“风格”快速复用到后续的绘画中。
用户也可以通过Style Tuner,对某一种众所周知的风格进行自定义,使之更加符合自己的要求。
举个例子,当我们在Prompt中写下“in the style of hard sci-fi”这段提示词的时候,表面上我们要求AI画一幅“硬科幻”风格的作品,但是仔细想想,我们所谓的“硬科幻”是一回事吗?当我们在说“硬科幻”的时候,我们到底在说什么?它是2D,还是3D?会具有赛博朋克(cyberpunk)元素吗?还是会更靠近某一部作品的风格呢?
Style Tuner让我们对某一种风格进行自定义成为可能。
(2)如何使用Style Tuner
在Midjourney的对话框中输入/tune,就可以触发Style Tuner功能。
例如,我输入了“low contrast, low saturation, Morandi color scheme”(低对比度、低饱和度、莫兰迪色系),Midjourney会弹出两个设置参数:
16/32/64/128 Style DIrections
Default/Raw mode
第一个参数选择的是可供选择的“风格方向”数量。
如果选择32,那么Midjouney就会生成64幅图片,每2幅图片一组,每一组图片都代表一种“风格方向”。用户需要在每一组图片的两幅中,选择自己喜欢的那一幅,也可以都不选。最终,用户的选择会融合在一起,定义这种“风格”的样子。
风格方向的数量越多,用户消耗的“快速生成”(Fast Generation)时间就越多。如图所示,如果我们选择32 Style Directions,就会消耗0.3小时。如果选择64,就会消耗0.6小时,选择128会消耗1.2小时。Midjourney的标准月费30美元,每个月一共只有15小时的快速生成时间。所以Style Tuner是一个需要合理规划使用的功能。
第二个参数选择的是“风格方向”的模式,默认或者Raw。
单词raw翻译过来的意思是原生的、未经处理的。
在摄影领域也有raw的概念,全称是Raw Image Format,即未经加工的图像格式,可以简单理解为相机由光信号转化为数字信号时的最原始图像数据,未经曝光、白平衡等处理。
Raw模式可以理解为算法模型的原生图像模式,该模式下模型不会根据自主观点改变图像内容和风格,内容更加接近提示词所描述的内容。
在选择了32“风格方向”后,Midjourney很快生成了32组图片。生成结果是一个链接,用户可以在网页上对风格进行编辑。
进入页面后,我们就可以看到想定义的提示词、基本规则的说明、以及两种选择模式。
如果是默认的“Compare two styles at a time”,就如图中的“第1组”图片所示,每一组有4张,用户可以选择左边的风格方向,也可以选择右边的风格方向。至于剩下31组图片就通过滚动条往下拉吧。
如果选择“网格”模式,每一组只有1张,用户同样可以在每一组的左右两张之间选择。
用户不需要把32组图片都选完。并不是越多就越好,并不是越多就越接近自己想要的理想结果。官方推荐5-10种比较好。
在网页的底部有一个code,这个code可以被用在Prompt里面,把定义后的“风格”应用在绘画中。
每当用户改变32组图片中任意一项选择,这个code都会改变。
当自己在某一组“风格方向”中,改变左右的选择,或者干脆不做选择,用户几乎不可能知道这会对最终的结果产生怎样的影响。
事实上,这不是一个1+1=2的游戏,而更像是一个1+1约等于2的猜想。
我们只能通过选择去接近自己想要的风格表达。
用于编辑风格的网页链接不是一次性的,所以用户可以维护一个自定义风格的网页列表。
这些风格code也可以分享给其他人使用,现在确实也已经出现了一些分享风格code的网站。
(3)风格code的格式
Code在Prompt中的编写格式就跟Midjourney之前其它一些参数的格式是一样的。比如定义比例的--ar,可以作为后缀写在Prompt后面,如果写“--ar 21:9”,那么生成的图片比例都会是21:9。
多个code也可以连在一起使用,以“--style code1-code2-code3…”这种格式。
a young astronaut, low contrast, low saturation, Morandi color scheme, --style kONYfPicnE7tJZT1 --stylize 250
(4)风格code的测试和使用
一种对Style Tuner的使用方法,是把多段提示词作为一个整体进行定义。
比如在上文中,我们就把【low contrast, low saturation, Morandi color】这三个效果作为一个整体合在了一起。
a young astronaut, in the style of sci-fi, low contrast, low saturation, morandi color --style kONYfPicnE7tJZT1 --ar 21:9
如果使用Raw模式,我们也可以比较一下差别。
a young astronaut, in the style of sci-fi, low contrast, low saturation, morandi color --style raw-kONYfPicnE7tJZT1 --ar 21:9
另一种对Style Tuner的使用方法,是把提示词片段分别进行定义,然后通过后缀的--style code1-code2-code3…这种格式,把更加可控的效果叠加,输出更加稳定的结果。
比如下面这个例子,我们就做了一个【low contrast, low saturation】+【Blue in Morandi color】,由于单独对“莫兰迪蓝色”做了定义,所以可以看到明显差别。
下面是另一个例子,我们对三个提示词分别做了定义,做了一个【low saturation】+【Morandi Blue】+【sci-fi style】
网上也可以看到很多人分享的code,但是需要注意一点,这些code往往需要跟特定的提示词一起使用,才可以得到作者分享的样图效果。
比如下面这个由作者Tatiana Tsiguleva分享的一个叫做“Clean Universe and Science Fiction”的style code "2dQJV5KAaXqo"。它其实是配合前面的“Black and White Photography”等提示词一起使用的。
如果单独复制粘贴code,那得到的结果就会跟样图完全不同。
总的来说,Style Tuner是一个很好用的新功能,蕴含着无限可能,通过Style Tuner功能,我们可以对各种提示词的最终效果进行一定程度的自定义,对“炼丹”最终效果的稳定性施加影响。
如果把这些提示词比作“基因”,那么我们就可以直接对这些“基因”进行编辑,对这些“基因”中的一些“片段”进行选择,从而实现我们想要的表达。
Enjoy and have fun~ :)
网友评论