我的机器人画了一只猫狗…以及为什么你的提示语很重要
有没有遇到过这种情况:让AI画一只猫,结果出来的东西看起来像一只浣熊在试镜洗发水广告?是的,我经历过。 的图像生成可以非常出色——甚至可以达到海报级别——但前提是你像一个真正知道自己想要什么的导演那样和它说话。魔法不仅仅在于模型,而在于你的提示语。今天,我们将修复你的提示语,让 不再生成毕加索土豆,而是开始提供画廊级别的视觉效果。
请注意:这是一份实用的、动手操作的指南,包含真实的提示语公式、示例和常见陷阱。到最后,你将知道如何使用 的图像生成,为视觉效果制作有效的提示语,并真正获得你想要的图像,而不是你的机器人表亲误听到的图像。
图像生成 101:它是什么,不是什么,以及为什么它有时会画出太多的手指
的图像生成就像一个非常认真倾听的工作室助手,如果你留出太多的空间,它就会疯狂地即兴发挥。它通过匹配它学到的模式将你的文本描述转换成图片。想想:“描述场景、风格、氛围和技术细节”,然后 构建像素。
重要的现实检验:
如果你想要一张专辑封面,不要说“专辑封面”,而要说:“大胆、高对比度的专辑封面构图,居中的主体,颗粒状的胶片纹理,戏剧性的逆光,顶部的标题文字区域”。看到区别了吗?你是导演。 是剧组。
公式:如何编写真正有效的 提示语
这是一个简单的提示语公式,可以将混乱变成艺术:
场景 + 主体 + 风格 + 构图 + 光线 + 颜色 + 相机 + 情绪 + 质量 + 约束
让我们分解一下—— 友好的风格。
- 场景:我们在哪里?室内、室外、在火星上、在一个小小的纽约厨房里?
- 主体:谁/什么?要具体。“一辆红色的老式 踏板车”胜过“一辆踏板车”。
- 风格:插画、照片写实主义、水彩、吉卜力工作室风格(如果不行,避免按名称复制艺术家)、赛博朋克、极简主义。
- 构图:特写、中景、广角;居中、三分法;用于文字的负空间。
- 相机:35mm 镜头、微距、航拍、低角度、f/1.8 焦外成像。
专业提示:不要写小说。写场景描述。目标是 1-3 句话加上一些结构化的参数。
提示语改造:从模糊到时尚
糟糕的提示语:“一只猫。”
更好的提示语:“橘色虎斑猫懒洋洋地躺在窗台上,照片写实主义,柔和的晨光,浅景深,50mm 镜头,温暖的粉彩调色板,平静的情绪,高细节,单一主体,3:2。”
糟糕的提示语:“夜晚的城市。”
更好的提示语:“夜晚的赛博朋克东京街道,潮湿路面上的霓虹灯反射,超广角,高对比度,电影照明,深蓝色和洋红色,熙熙攘攘的人群运动模糊,高细节,16:9。”
糟糕的提示语:“制作一个标志。”
更好的提示语:“远足应用程序的极简主义矢量风格标志,带有小径的程式化山脉轮廓,平面设计,双色调色板(森林绿和奶油色),居中构图,透明背景感觉,无文字,高对比度,正方形。”
看到模式了吗?上下文 + 风格 + 约束。 还不能读懂你的心思。还没。
如何使用 的图像生成:快速分步指南
- 确定你的目标:社交帖子、广告横幅、产品模型、演示文稿封面、情绪板。
- 添加约束:宽高比、单一主体、构图注释,如果你计划稍后添加文字,则不要添加文字。
- 一次审查和迭代一个更改。不要把厨房水槽扔到第二个提示语中。
迭代示例:
- 第一个提示语:“大理石桌上的照片级写实卡布奇诺,自上而下,拿铁艺术心形,柔和的自然光,中性调色板,4K,1:1。”
- 结果太暗?后续:“稍微增加曝光,添加更温暖的亮点。”
- 泡沫看起来很时髦?“更清晰的泡沫纹理,更清晰的拿铁艺术,减少颗粒感。”
把它想象成与一个非常字面的设计实习生的对话,他正在尽力而为。
视觉构建块:风格、光线、镜头和构图
- 很好理解的风格:照片写实主义、水彩、平面矢量、3D 渲染、等距、复古海报、漫画书网点、低多边形。
- 重要的光线提示:黄金时段(温暖的光芒)、柔光箱(均匀的光线)、轮廓光(戏剧性的主体边缘)、霓虹灯(高对比度、饱和的颜色)、明暗对比(喜怒无常、阴影丰富)。
- 镜头和相机语言:24 毫米用于广阔的场景;50 毫米用于自然的视角;85 毫米用于肖像;微距用于细节;f/1.8 用于焦外成像;航拍/无人机用于自上而下。
- 构图指导:三分法用于平衡的镜头;中心对称用于大胆的海报;负空间用于叠加;特写用于产品细节;广角用于环境。
每个提示语添加两到三个。不是全部。你是在做一道菜,而不是香料架爆炸。
你可以窃取的提示语模板(请这样做)
- 产品主角图片:“光滑的不锈钢智能手表在哑光黑色表面上,具有柔和反射的照片级工作室照明,85 毫米镜头,浅景深,居中构图,高细节,顶部有标题空间,4:5。”
- 生活方式照片:“年轻的通勤者在小雨中穿过人行横道,反射路面,运动模糊,坦率的街头摄影风格,柔和的调色板,35 毫米镜头,自然光,三分法,16:9。”
- 插图:“舒适的阅读角插图,温暖的木制书架,植物,一只虎斑猫蜷缩在椅子上,带有纹理颗粒的平面矢量风格,朴实的调色板,柔和的环境光,干净的轮廓,1:1。”
- 社交广告背景:“抽象的渐变波浪图案,双色蓝绿色和紫色,平滑的曲线,最小的视觉噪音,右侧有充足的负空间,清晰,16:9。”
- 演示文稿封面:“现代简约的城市天际线在黎明时分,柔和的粉彩渐变天空,细线艺术风格,宽广的构图,左上角有清晰的标题区域,高分辨率,16:9。”
复制、粘贴、调整。这不是作弊。这是高效。
有效 提示语的剖析(已注释)
提示语:“一位女性马拉松运动员在日出时系鞋带的照片级写实肖像,黄金时段逆光,在凉爽的空气中可见呼吸,85 毫米镜头,浅景深,温暖的亮点,柔和的阴影,高细节,单一主体,左侧有文字的负空间,4:5。”
为什么它有效:
解决四大问题(以及拯救你的提示语)
- 提示:使用中景而不是极端特写。添加“自然的比例,干净的面部对称性,逼真的皮肤纹理”,并使手远离复杂的道具。
- 示例:“中景肖像,自然的比例,逼真的皮肤纹理,裁剪掉手,柔和的主光,中性背景。”
- 提示:说“没有文字,没有水印,干净的背景”。如果你需要文字,稍后在设计工具中添加它。
- 示例:“平面矢量图标集,统一的笔画宽度,没有文字,没有水印,透明外观,正方形布局网格。”
- 提示:限制主体数量。指定“单一主体”或“最小背景”。
- 示例:“光滑石头上的单一盆景树,简约的工作室设置,柔和的顶部照明,浅景深,负空间,3:2。”
- 提示:明确说明十年和风格。说“1970 年代的彩色胶片外观”而不是仅仅说“复古”。
- 示例:“1970 年代的彩色胶片美学,微妙的颗粒感,略微褪色的颜色,柔和的小插曲,坦率的街景,35 毫米镜头。”
宽高比:因为你的 和你的幻灯片不共享裤子
- 纵向 (4:5 或 9:16): 帖子和故事,移动优先广告。
将比率添加到你的提示语中。它可以防止以后出现尴尬的裁剪。
迭代策略:“一次一个旋钮”规则
当 错过目标时,抵制重写一切的冲动。每次迭代更改一件事:
为什么?因为如果你改变了五件事并且图像有所改进,你不会知道哪个调整奏效了。你不仅仅是在制作图像——你还在学习 如何听到你的声音。
创意约束:保持一致性的秘诀
想要在整个广告系列中获得一致的品牌外观?在你的提示语中创建一个迷你风格指南:
- “柔和的泥土色调,柔和的颗粒纹理,柔和的小插曲,居中的构图,主体下方的微妙阴影,左上角的衬线标题空间,4:5。”
然后重复使用并仅交换主体。这就像模板化,但更酷。
提示人物与产品与地点
- 人物:指定年龄范围、服装、姿势、情绪和设置。使用“自然的比例”和“微妙的皮肤纹理”。保持手简单。
- 产品:描述材料、饰面(哑光、光泽)、反射、环境、镜头和干净的表面。工作室照明创造奇迹。
- 地点:定义一天中的时间、天气、活动级别和调色板。添加相机角度和焦距。
快速示例:
- 人物:“一位中年厨师身穿白色外套的肖像,温暖的厨房背景,柔和的主光,85 毫米镜头,自然的表情,浅景深,高细节,3:2。”
- 产品:“混凝土板上的哑光黑色无线耳塞,用于边缘的工作室轮廓光,清晰对焦,最小背景,居中,4K,1:1。”
- 地点:“黎明时分雾蒙蒙的松树林,凉爽的蓝绿色调色板,低角度视角向上看,柔和的体积光,高细节,16:9。”
使用参考资料制作有效的视觉提示(何时添加图像)
如果你可以附加参考图像,请谨慎地执行此操作。一两个参考资料有助于 锁定外观或姿势。添加一个简短的文本指令来决定要遵循的内容:
- “匹配参考 A 中的光线;使用参考 B 中的调色板;保持构图居中;没有文字。”
如果你无法添加参考资料,请使用“类似”提示:“柔和的胶片颗粒感”、“柔和的类似 的调色板”、“等距蓝图风格”。这是文字中的情绪板。
负面提示:告诉 不要做什么
有时会“有帮助地”偷偷添加额外的道具、纹理或文字。用否定词阻止它:
- “没有文字,没有水印,没有额外的肢体,没有繁忙的背景,没有标志,没有边框。”
保持简短和一致。否定词是你提示语的安全带——烦人,直到你需要它们。
十秒提示语检查(在你点击生成之前)
问问自己:
- 我是否避免了诸如“酷”和“好”之类的模糊词语?(你中学时期的读书报告打电话来了。它想要回它的形容词。)
如果回答是肯定的,请生成。
真实世界的用例:常见工作的 提示语
- 营销横幅:“护肤精华液的极简主义产品主角布局,带有磨砂饰面的玻璃瓶在光泽的白色瓷砖上,柔和的漫射工作室光线,微妙的阴影,右侧有标题空间,高细节,16:9,没有文字。”
- 缩略图:“笔记本电脑爆炸出霓虹灯图标的大胆、高对比度照片插图,深色背景,中心主体,戏剧性的轮廓光,干净的构图,用于标题的超大负空间,16:9。”
- 屏幕截图背景:“抽象几何形状,蓝绿色和珊瑚色的柔和渐变,带有阴影的柔和深度,最小的干扰,9:16。”
- 内部报告封面:“数据中心机架的干净等距插图,凉爽的蓝色和灰色,微妙的光晕,细轮廓样式,左上角的标题空间,清晰,4:3。”
- 活动海报艺术:“带有飞行汽车的复古未来主义天际线,日落颜色渐变,清晰的矢量风格,居中的构图,大胆的轮廓形状,3:2。”
何时重新生成与何时改进
- 如果:整个氛围都错过了——错误的风格,错误的主体,错误的时代,则重新生成。
- 如果:骨架很好——保持核心并调整光线、颜色或构图,则改进。
将重新生成视为开始一个新食谱;将改进视为添加更多的盐。或者,对于非厨师来说,从“大声错误”切换到“通过调整是正确的”。
值得注意:使用 Sider.AI 更快地确定提示语
如果你正在测试大量的提示语,并且没有时间成为一名全职的AI低语者,那么 Sider.AI 可以成为擅长文字的有益朋友。粘贴你的粗略提示语,并要求它通过风格约束、否定提示和宽高比来优化 的图像生成。它会比你说“为什么这只猫有五只耳朵?”更快地吐出一个紧凑的、随时可运行的版本。它对于需要在整个广告系列中保持一致品牌提示的团队来说尤其方便。 高级操作:多镜头一致性和系列外观
- 角色一致性:描述可重复的特征和服装,并锁定光线和镜头。示例:“相同的角色:棕色短卷发,圆形眼镜,海军蓝连帽衫;日光窗口光;50 毫米镜头;柔和的颗粒感;中性背景。”在提示语中重复使用。
- 颜色语言:用文字定义十六进制式提示:“深森林绿色、温暖的奶油色、柔和的赤陶色。”
- 纹理连续性:所有图像上的“微妙的纸张颗粒感、浅色小插曲、柔和的阴影”使集合保持凝聚力。
- 构图节奏:交替使用特写、中景和广角镜头,以在一系列中讲述一个故事。
没有表格的故障排除表(因为,设计)
- 太锐利或太塑料:“稍微降低清晰度,添加柔和的颗粒感,更温暖的亮点。”
- 颜色冲突:“使用有限的双色调色板,使背景不饱和。”
- 看起来很便宜:“简化形状,减少混乱,一致的光源,移除渐变。”
- 面部离奇:“自然的比例,微妙的毛孔,中性的表情,中景。”
像调味一样将这些复制到你的后续提示语中。
快速参考:五个即用型 提示语包
- 清洁技术海报
“手持剪贴板的未来但友好的机器人助手,具有柔和工作室照明的照片级真实感,中性灰色背景,微妙的蓝色强调光晕,居中构图,顶部有标题空间,高细节,3:2,没有文字。”
- 舒适的品牌生活方式镜头
“阳光明媚的厨房柜台上放着一个热气腾腾的陶瓷杯和一条折叠的亚麻餐巾,温暖的金色光芒,浅景深,柔和的颗粒感,柔和的泥土色调,平静的心情,右侧的负空间,4:5。”
- B2B 报告封面插图
“具有流动数据线的等距服务器堆栈,凉爽的蓝色渐变,细轮廓样式,最小的干扰,左上角的标题区域,清晰,16:9。”
- 社交轮播背景(3个一组)
“一系列蓝绿色、紫色和珊瑚色的抽象渐变面板,柔和的曲线,微妙的纹理,一致的间距,最小,4:5,没有文字。”
- 产品细节宏
“哑光黑色智能手表表冠的特写微距,受控的工作室光线带有柔和的高光滚降,超详细的纹理,浅深度,高对比度,1:1。”
最后的要点:你是导演; 是摄影组
如果 的图像生成是摄影组,那么你的提示语就是故事板。给它一个场景、一种风格和一些实际的约束,它就会交付。像你描述一个你几乎不记得的梦一样漫无边际,你就会得到梦的逻辑:额外的指头,漂浮的茶杯和想要和你经理谈话的浣熊。
因此,使用公式制作有效的视觉提示,设置宽高比,添加智能否定词,并有目的地进行迭代。是的,你仍然会时不时地得到一只奇怪的猫。但现在你确切地知道该怎么说来解决它。
如果你想在点击“生成”之前让别人帮你检查一下你的文字,可以把它们扔进Sider.AI进行快速润色。你的猫——和你的观众——会感谢你的。 常见问题解答
Q1:开始使用Grok图像生成的最快方法是什么?
使用一个简短的公式:场景、主体、风格、构图、光照和宽高比。从一个干净的提示开始,添加“无文字/无水印”,生成,然后一次调整一个旋钮。
Q2:如何编写有效的视觉提示,而不会得到杂乱的图像?
限制为一个单一的主体,指定一个简单的背景,并定义构图,如三分法或居中。添加否定词,如“无繁忙背景,无标志,无边框”。
Q3:社交媒体、幻灯片或印刷品应该使用哪个宽高比?
对于Instagram Stories,使用9:16;对于横幅广告和幻灯片,使用16:9;对于帖子和产品图块,使用1:1或4:5。在你的提示中包含宽高比,以避免尴尬的裁剪。
Q4:我怎样才能修复Grok图像中奇怪的手或脸?
使用中景镜头,指定“自然的比例”和“逼真的皮肤纹理”,并让手远离复杂的道具。如果仍然不正常,重新生成并简化场景。
Q5:我应该什么时候重新生成,而不是优化我的Grok提示?
当风格或主体完全错误时,重新生成。当基础良好时,进行优化——调整光照、调色板、构图,或添加清晰的否定提示。