关于Stable Diffusion中的负面提示,大家都把它当作秘籍一样谈论——直到它要么彻底摧毁你的图像,要么根本不起作用。实际上,负面提示更像是蜿蜒道路上的护栏:当模型漂移时很有用,当汽车对齐良好时则不必要,过度使用时则很危险。但当然,让我们继续假装解决“奇怪的手”的方案是更大声地喊“不要奇怪的手”。
事实是:负面提示会有所帮助。它们也会悄悄地破坏你的结果,减少多样性,或使你陷入迷信式的提示工程。关键在于(如果我们可以这样称呼的话)知道它们何时起到了有用的约束作用,何时只是扼杀了模型给你带来惊喜的能力。
以下是对Stable Diffusion中负面提示的怀疑和实用性探讨:它们实际上是如何工作的,何时使用它们,何时停止使用,以及如何像成年人一样思考它们。我还会指出一些真正值得你关注的东西,比如一个理智的演练,它不会假装提示巫术是真正的魔法。
H2: 什么是(以及不是)负面提示
负面提示是你提供给Stable Diffusion(或你的UI)的文本条件,告诉它要避免什么:模糊、多余的手指、水印、文本、低分辨率、畸形的肢体——你已经见过这个列表。从概念上讲,它们是“不包括”条款,强化了你意图的反面。实际上,它们就像权重一样,将模型从某些特征或美学拉开。
它们不是“修复手”的按钮。它们不会在模型薄弱的地方创造解剖学专业知识。它们不能保证细节的提炼。而且它们绝对不能替代良好的正面提示、合理的CFG比例,或对你的采样器和模型的真正理解。
H2: 行业最喜欢的逃避方式:“只需添加更多负面提示”
人们粘贴相同的负面提示清单,就像在驱赶恶魔一样:畸形、奇怪的手、绘制粗糙、不良解剖结构、多余的肢体、水印、jpeg伪影、低分辨率、糟糕的眼睛、丑陋。读起来像是一次恐慌症发作。有时它会有所帮助。有时它只是告诉模型,“变得无聊”。如果这就是目标——安全且千篇一律——恭喜,你找到了。
但这里有一个转折:许多好的图像来自于允许模型有一定的自由来解释风格和构图。用负面提示夹得太紧,你会得到无菌的输出。一些艺术家坚持使用几乎空白的负面提示是有原因的:当模型不断被告知“不”时,多样性会受到影响,而且是连续50项的“不”。
H2: 负面提示发挥作用的时候:实用案例
- 避免技术垃圾:如果你一直得到压缩模糊、水印片段、随机文本或“签名”涂抹,一个最小的负面提示可以干净地引导模型。
- 微调解剖结构:“多余的手指”、“多余的肢体”、“畸形”可以在某些模型和采样器中减少最糟糕的情况——但它们不会改善基本原理。将这视为缓解症状,而不是治疗。
- 引导风格漂移:如果模型坚持你不需要的特定美学——过度光滑的皮肤、卡通般的眼睛、过度饱和的背景——负面提示可以帮助锚定它。
关键词是最小化。像用盐一样使用负面提示,而不是像用酱汁一样。
H2: 负面提示悄悄地使事情变得更糟的时候
- 过度约束多样性:你禁止的越多,可能的输出空间就越扁平。如果你想要一致性,这很好,但如果你想要范围,那就不太好了。
- 冲突的指令:告诉模型“电影般的戏剧性光线”,同时禁止与对比度相关的术语或风格组成部分,可能会产生平淡的泥浆。“没有阴影”与“电影照明”是一种纯粹感觉上的矛盾。
- 掩盖上游错误:糟糕的CFG比例、错误的采样器、过多的步骤或次优的检查点——负面提示无法拯救有问题的设置。
H2: 极简主义者的规则:从空白开始,只添加图像需要的
我倾向于厨房规则:先品尝,后调味。从没有负面提示开始。如果特定的伪影不断出现——文本、水印、多余的数字——添加一个外科手术式的负面提示:“文本、水印”或“多余的手指”。就是这样。如果问题仍然存在,请调查更大的旋钮:模型选择、采样器、步骤、CFG比例或构图(种子和提示措辞)。对于保持多样性来说,“空白负面提示”方法具有真正的智慧。
H2: 常见的嫌疑犯:一个明智的简短列表
如果你需要一个基线,试试一个精简的集合:
- text, watermark, signature
- extra fingers, extra limbs
- deformed, poorly drawn hands
但要保持简短和响应性。如果模型在处理手方面做得很好,不要先发制人地削弱它。是的,很多人都维护着特定模型或美学的负面提示短语列表——有些甚至是众包的。将它们视为菜单,而不是处方。
H2: 你的UI没有告诉你(但应该告诉你)的事情
Stable Diffusion UIs通常鼓励这样一种迷信,即更多的单词等于更多的控制。这就是为什么你会最终得到贴在所有东西上的百科全书式的负面提示,而不管主题是什么。更好的方法是工作流程素养:了解你的设置和模型是如何交互的,然后使用负面提示作为一种轻微的触动。实际上有一些明智的指南解释了这一点,而没有陷入伪神秘主义或20页的提示咒语。
H3: 采样器、CFG和步骤:更重要的无聊的东西
- 采样器选择:不同的采样器对约束的反应不同。如果你的负面提示看起来被忽略或过于霸道,尝试切换采样器并减少步数。
- CFG比例:高CFG可能会过度拟合你的正面和负面提示。如果你的图像看起来“被扼杀”,首先降低CFG。
- 步骤计数:在某个时候,额外的步骤只会抛光相同的错误想法。如果在一个常见的采样器上,一个负面提示在30-40步内没有帮助,更多的步骤也无法拯救它。
H2: 构图胜过否定
如果你的主题不断崩溃——手、眼睛、背景中的文本——尝试为成功而构图,而不是禁止失败。减少手的突出程度。使用避免奇怪手指爆炸的姿势。使主体占据画面的主导地位,这样模型就不“需要”发明带有乱码文本的遥远标牌。你为模型擅长的东西设计的提示越多,你就越不需要用否定来唠叨它。
H2: 风格包和检查点:不要与房屋风格作斗争
许多检查点都有内置的倾向。试图用一堵负面提示墙将检查点从其房屋风格中赶出来,就像告诉爵士三重奏在小节之间大喊“没有摇摆”来减少摇摆一样。选择一个符合你意图的模型。一个为照片写实主义而调整的模型将需要更少的负面因素来保持清洁。一个风格化的模型可能会与你抗争——因为它应该是这样。
H2: 通用负面提示的神话
没有一个。充其量,有一些“常见的垃圾过滤器”可以跨模型提供帮助:文本、水印、低分辨率。除此之外,普遍性只是一厢情愿的想法。那些分享200字负面提示字符串的人通常是在修复错误的东西或优化单一的外观。如果这就是你的目标——品牌一致性、风格可重复性——那很好。但这不是艺术指导。这是模板强制执行。
H2: 案例研究思维,没有案例研究演示文稿
想象一下一个肖像简报。你想要一个自然的外观,浅景深,眼睛聚焦,手轻轻地在框架中。最小的负面提示:“文本、水印”。运行几个种子。如果你看到一次多余的数字,忽略它——不要过度拟合到侥幸。如果你反复看到它,那么添加“多余的手指”。如果皮肤变成塑料,检查你的检查点或添加“过度光滑的皮肤”,如果你的模型尊重风格负面因素。但要注意顺序:首先通过模型和设置进行修复,其次是负面提示。
H2: 违反直觉的胜利:有时删除负面提示
如果你的输出开始看起来不带感情色彩,删除一些负面因素。多样性回归。你甚至可能会得到更好的手——因为模型没有被从建立解剖结构之前所需的那些特征中拉开。过度约束可能会中断模型获得良好解决方案的路径。
H2: Sider.AI题外话
有一个人类可读的指南,它将Stable Diffusion视为一种工具,而不是一种宗教。它明智地涵盖了正面和负面提示——对于那些喜欢结果而不是仪式的人来说很有用。如果你厌倦了规定性列表,并且想要一个清晰的演练,那么该指南不会浪费你的时间。Sider.AI通常在坚持实践时发挥其最佳水平:如何做这件事,而不是如何扮演提示萨满。 H2: 实用手册:不会吸走空气的负面提示
- 诊断模式。仅为重复的违规者添加负面因素:文本、水印、多余的手指。
- 首先调整设置。降低CFG,尝试另一个采样器,调整步骤大小。
- 保持列表精简。最多3-6项。不要仅仅因为它看起来“专业”就导入一个100项的黑名单。
- 用新的种子重新测试。不要根据一个幸运或不幸的样本来判断。
- 撤销没有帮助的负面因素。如果一个术语没有改善跨种子的结果,就删除它。
- 更聪明地构图。限制手的突出程度,避免繁忙的背景,简化。
H2: 常见的负面提示神话,被刺穿
- “更多的负面提示等于更干净的图像。” 有时。通常它等于更平坦的图像。
- “有一个通用的负面提示。” 不。有一些常见的垃圾要避免,还有特定于模型的怪癖。
- “负面因素修复解剖结构。” 它们抑制了可见的失败。掌握来自于模型和你的构图。
- “如果在列表中,它一定会有所帮助。” 列表是起点,而不是经文。
H2: 关于伦理和品味的说明
负面提示可用于避免某些内容类别。这是你的选择。但不要将道德过滤与审美控制混淆。如果你正在推动模型去做它没有被构建去做的事情——比如,框架中复杂的清晰文本——问题不在于你的负面提示纪律。这是因为你要求小提琴演奏鼓。
H2: 少说一点的安静力量
我越老,我就越欣赏让模型呼吸的默认设置。良好的正面提示、适当的模型和合理的设置可以让你完成大部分工作。负面提示用于修剪树篱,而不是彻底砍伐森林。
H2: 最后10%(每个人浪费90%时间的地方)
如果你想要最后一点润色,你最好进行轻微的修复、升级或使用了解剖结构的模型的有针对性的处理,而不是构建负面提示词库。“魔法列表”是一个海市蜃楼。真正的工作是迭代的:诊断、调整、再生,以及——这部分是不流行的——在足够好的时候停止。
H2: 临别一击
Stable Diffusion中的负面提示就像写作中的括号:很多人过度使用它们来听起来更聪明,而通过编写更好的句子,他们会得到更干净的结果。从简单开始。有目的地添加约束。当它们碍事时,删除它们。如果有人给你一个150字的负面提示作为通用修复方案,微笑、点头,然后做有能力的人所做的事情:测试它、修剪它或扔掉它。
参考文献
- 一个对人类友好的Stable Diffusion Web UI指南,以实践的清晰度涵盖了正面和负面提示。
- 社区的观点,主张使用空白的负面提示来保持多样性——有争议,但值得在你自己的工作流程中进行测试。
- 一个众包的负面提示模式集合——可用作菜单,而不是强制要求。
常见问题解答
Q1:Stable Diffusion中的负面提示真的能提高图像质量吗?
有时。负面提示可以删除重复出现的垃圾,如水印片段或模糊文本,但过度使用它们会使多样性扁平化,并使图像看起来不带感情色彩。从空白或最小的负面提示开始,仅在相同的缺陷不断出现时添加。
Q2:Stable Diffusion手中最好的负面提示是什么?
没有通用的修复方法。尝试“多余的手指”或“绘制粗糙的手”等最小的短语,但优先考虑正确的检查点、合理的CFG和不将手指放在最前面的构图。负面因素抑制症状;它们不教授解剖结构。
Q3:我应该复制流行的负面提示列表吗?
将它们用作菜单,而不是强制要求。大量的列表通常会减少多样性并与你的意图冲突。测试一些有针对性的负面因素,保留那些可以衡量地帮助的,并抛弃其余的。
Q4:最好从空白的负面提示开始吗?
通常,是的。空白的负面提示保留了创造性的范围,并让你诊断出实际需要抑制的东西。仅为重复的违规者添加特定的负面因素,如文本、水印或多余的肢体。
Q5:负面提示如何与采样器和CFG设置交互?
较高的CFG会放大正面和负面的约束;如果你的图像感觉受到束缚,在堆积更多负面因素之前,先调低CFG。不同的采样器反应不同,因此快速的采样器切换可能比再添加五个被禁止的术语更重要。