如何在 Nano Banana 中提示进行多图像融合,以实现复杂的构图
风格:实用且以解决方案为导向
如果您尝试过将多个参考图像融合到单个连贯的场景中,您就会知道这很困难:既要保留主体细节,又要保持风格一致,还要获得一个真正有效的构图。Nano Banana 的多图像融合可以非常可靠地做到这一点——如果您有明确的提示意图。本指南将带您了解一个经过实地测试的复杂构图工作流程,包括输入格式、图像权重策略、构图规划、负面提示、种子控制和故障排除。
值得注意的是:公开的资料将 Nano Banana 描述为一种最先进的图像模型,具有强大的编辑、一致性和多图像融合能力,并且它被列在模型目录中的生产就绪模型中。社区指南还概述了该模型的提示模式和基于场景的技巧以及实际使用演练,我们在此对其进行了综合。
Nano Banana 中的多图像融合是什么?
- 定义:将两个或多个输入图像(主体、风格、布局)组合成单个输出,同时解决光照、透视、调色板和空间排列中的冲突。
- 重要原因:它允许您构建复杂的合成图像(例如,水彩风景风格的肖像;放置在电影场景中的产品),而无需手动遮罩。
- 核心控制因素:图像权重、文本提示优先级、负面提示、种子控制以及宽高比/尺寸约束。
复杂构图的高级工作流程
- 确定哪个图像提供布局(构图),哪个提供主体身份,以及哪个提供风格。如果您有三个图像,请为每个图像分配一个角色。
- 草拟一个缩略图(在脑海中或快速涂鸦)。注意焦点和深度。
- 首先将其权重保持在中等水平(例如,0.6–0.8)。您稍后会进行调整。
- 给主体参考图像稍高的权重(例如,0.8–1.0),以便身份在构图压力下得以保留。
- 如果来源图像很杂乱,请为身份图像使用紧密的裁剪;这可以提高身份识别率。
- 使用风格图像(调色板/笔触/光照)。从较低的权重(0.3–0.6)开始,以避免压倒身份。
- 如果风格破坏了真实感,请尝试使用文本风格描述来代替(或除了)风格图像。
- 指定场景、镜头、光照和材料属性以对齐不同的参考图像。
- 包括空间角色:“前景中的主体 A”,“来自图像 B 的背景”,“来自图像 C 的风格”。
- 指出瑕疵(“扭曲的手”,“多余的肢体”,“重影”,“logo 渗色”,“不匹配的光照”,“故障”)。
- 如果风格太强,则添加诸如“过度风格化,绘画涂抹”或“粗糙的笔触纹理”(如果不需要)之类的负面提示。
- 一旦全局构图有效,请冻结种子以精确地迭代权重、风格强度和细节。
- 一次更改一个参数(例如,风格权重 +0.1)并进行比较。
顺便说一句,一些公共指南提供了基于场景的提示配方和 A/B 测试,这些配方和测试反映了这种分阶段方法,而端到端的操作指南则分解了参考和负面提示策略。
提示架构:一种可靠的模式
使用您可以快速调整的分层、可读的结构:
- 系统/指令意图(如果支持):“严格遵循参考图像以获取身份,使用文本来细微地表达风格。”
示例结构(伪提示):
图像:
- img_layout: {URL or upload id} weight: 0.7 role: layout
- img_identity: {URL or upload id} weight: 0.9 role: subject identity
- img_style: {URL or upload id} weight: 0.4 role: style/palette
提示:
来自 img_identity 的主体的中景肖像,站在 img_layout 的街道场景中。
保持 img_style 中的调色板和光照氛围:温暖的黄昏,柔和的轮廓光,浅景深。
相机:50mm,f/1.8,肩部高度角度。柔和的散景,逼真的皮肤纹理。
服装:极简主义深色夹克,无 logo。表情:冷静,自信。
负面:
过度风格化的笔触,绘画涂抹,塑料皮肤,多余的手指,扭曲的手,重复的面部特征,
不匹配的透视,海报化的阴影,色度噪点,logo 瑕疵。
控制:
seed: 142375
guidance: 5.5–7.5 (start 6.5)
size: 768x1024 (portrait) or 1024x768 (landscape)
如果您的界面支持图像权重滑块或令牌,请将权重保持在 0.3–1.2 范围内;仅在身份崩溃时才升高。即使在 Nano Banana 之外,从业者也发现较低的权重赋予自由,而较高的权重则强制执行保真度。
图像权重:三个实用的方案
构图控制:透视、深度和光照
- 透视:在文本和图像中对齐镜头等效物(例如,“24mm 广角镜头”用于广阔的场景;“85mm”用于肖像)。如果布局图像为 24mm,但您要求 85mm 的外观,则模型必须调和冲突的几何体。保持它们一致。
- 深度:提及前景/中景/背景角色(“主体前景,天际线中景,山脉背景”)。这减少了对象重叠错误。
- 光照:声明单个主要光源和时间。使用“主光左侧,暖色;填充柔和,冷色;轮廓光微妙。”这有助于融合不匹配的源图像。
真正有帮助的负面提示
- 结构性:“不匹配的透视”,“倾斜的地平线”,“扭曲的解剖结构”,“平坦的深度”。
- 表面/纹理:“塑料光泽”,“浑浊的细节”,“海报化”,“条带化”,“过度锐化的边缘”。
- 风格控制:当以真实感为目标时,“过度风格化”,“粗糙的笔触纹理”,“卡通化”。
- 一致性:如果 logo 或水印侵入,请添加“无水印,无 logo”。
种子和变化策略
- 锁定种子并以小步长迭代权重:±0.1。保留版本日志。
- 如果小细节不断破坏(手、小道具),请保留种子,但将引导/CFG 调整 ±0.5 并调整负面提示。
分辨率、宽高比和放大
- 在接近目标宽高比的情况下生成,以避免在放大过程中出现构图变化。
- 如果您需要超高细节,请在短边以 768–1024 像素生成强大的基础图像,然后使用保留细节的通道进行放大。避免在放大过程中更改宽高比。
故障排除手册
- 在文本中添加明确的身份描述符(发型、面部标记、配饰)。
- 降低风格权重;添加诸如“过度风格化,绘画涂抹”之类的负面提示。
- 提高布局权重,增加文本中的深度提示(“清晰的平面分离”)。
- 在对细节进行小修改后,使用相同的种子重新生成,以保持构图但刷新细节。
真实世界的用例
- 布局:生活方式照片;身份:产品包装图;风格:品牌色调板。
- 提示以获得一致的阴影和反射;负面提示为“漂浮的物体”,“虚假的反射”。
- 布局:工作室姿势参考;身份:人物;风格:绘画或颜色分级参考。
- 在文本中控制饱和度和纹理;保持风格权重适中以保持相似性。
- 布局:环境底板;身份:角色周转;风格:电影摄影画面。
- 指定布局暗示的相机移动(“低矮的移动,轻微的向上倾斜”)。
示例提示(可复制)
图像:
- img_layout: city_street_at_dusk.jpg weight: 0.7 role: layout
- img_identity: subject_headshot.png weight: 1.0 role: identity
提示:
站在人行横道上的身份主体的中景肖像,与 img_layout 相同的透视。
黄金时段的侧光,浅景深,自然的皮肤纹理,柔和的散景。
负面:
塑料皮肤,扭曲的手指,多余的肢体,logo 瑕疵,过度锐化的边缘。
控制:
seed: 88123, guidance: 6.5, size: 896x1152
图像:
- img_layout: forest_path_wide.png weight: 0.8 role: layout
- img_identity: runner_profile.jpg weight: 0.9 role: identity
- img_style: teal_orange_grade.png weight: 0.5 role: style
提示:
在同一条森林小路上奔跑者的全身镜头,动态步幅,清晰的运动,青色-橙色电影分级。
镜头 35mm,低角度,早晨的雾气,来自右侧的定向阳光。
负面:
运动模糊条纹,浑浊的树叶,海报化,不匹配的阴影。
控制:
seed: 44701, guidance: 6.0, size: 1024x768
图像:
- img_layout: studio_three_point_lighting.jpg weight: 0.6 role: layout
- img_identity: model_closeup.png weight: 0.7 role: identity
- img_style: magazine_cover_moodboard.jpg weight: 0.9 role: style
提示:
社论封面肖像,有光泽的亮点,极简的背景,左侧有适合排版的负空间。
镜头 85mm,f/2,中性表情,干净的妆容。
负面:
粗糙的皮肤平滑,过度风格化的笔触,条带化,颜色条纹。
控制:
seed: 99021, guidance: 7.0, size: 1024x1365
对于围绕此模型的更深入的场景设置和提示剖析示例,社区文章很有帮助。独立的汇总也突出了 Nano Banana 优势中的多图像融合。
复杂场景的专业提示
- 保持角色明确:您使用的图像越多,您必须声明谁做什么就越多。
- 使用相机提示优先考虑真实感:镜头、光圈、高度、光照方向。
- 像设计师一样迭代:使用固定种子进行小的、记录的增量。
- 知道何时切换:如果图像不断与目标作斗争(透视冲突),请更换它而不是过度调整。
如果您正在进行提示草拟和迭代比较,那么一个可以保持种子、权重和负面提示版本化的并排工作区很有价值。值得注意的是:您可以使用提示管理工具来模板化多图像角色,存储图像 ID,并快速 A/B 测试权重——在运行数十个小迭代以拨入融合质量时非常方便。
主要要点
参考资料和进一步阅读:Nano Banana 提示概述和社区操作指南;关于其多图像融合能力的评论;模型目录列表。
常见问题解答
Q1:如何在 Nano Banana 中加权多个图像以获得更好的融合?
分配角色(布局、身份、风格),并从 0.7/1.0/0.5 等权重开始。如果相似性漂移,则提高身份权重;如果外观压倒了真实感,则降低风格权重。小的 ±0.1 更改效果最佳。
Q2:哪些负面提示有助于 Nano Banana 中的多图像融合?
使用结构和纹理保护:“扭曲的解剖结构、不匹配的透视、塑料皮肤、海报化、过度锐化的边缘、logo 瑕疵”。当需要真实感时,添加风格控制负面提示,如“过度风格化的笔触”。
Q3:在混合复杂构图时,我应该固定种子吗?
是的。自由探索,直到你喜欢取景,然后锁定种子,以便在权重、风格强度、引导和负面提示上可预测地迭代,而不会失去构图。
Q4:我应该使用什么分辨率和宽高比进行多图像融合?
生成接近目标宽高比(例如,1024×768 或 896×1152)以避免构图变化。之后使用保留细节的通道进行放大,保持宽高比不变。
Q5:我可以将风格图像和文本描述混合在一起吗?
当然可以。从较低的风格图像权重 (0.3–0.5) 开始,并通过文本(光照、颜色分级)来增强外观。如果风格图像与场景冲突,则降低其权重或切换到纯文本造型。