如何在 Nano Banana 中提示以進行多圖像融合,以實現複雜的構圖
風格:實用且以解決方案為導向
如果您曾經嘗試將多個參考圖像混合成一個單一、連貫的場景,您就會知道箇中的困難:保留主體細節,保持風格一致,並且仍然獲得一個實際可行的構圖。Nano Banana 的多圖像融合可以以驚人的可靠性做到這一點——如果您的提示帶有目的性。本指南將引導您完成一個經過實地測試的複雜構圖工作流程,包括輸入格式、圖像權重策略、構圖規劃、負面提示、種子控制和疑難排解。
值得注意的是:公開的文章將 Nano Banana 描述為一種最先進的圖像模型,具有強大的編輯、一致性和多圖像融合能力,並且它被列在模型目錄上的生產就緒模型中。社群指南還概述了該模型的提示模式和基於場景的提示,以及實用用法演練,我們在此進行了整合。
Nano Banana 中的多圖像融合是什麼?
- 定義:將兩個或多個輸入圖像(主體、風格、佈局)組合成一個單一輸出,同時解決光照、透視、調色盤和空間排列上的衝突。
- 重要性:它允許您構建複雜的合成圖像(例如,水彩風景風格的肖像;放置在電影場景中的產品),而無需手動遮罩。
- 核心槓桿:圖像權重、文字提示優先順序、負面提示、種子控制以及長寬比/尺寸限制。
複雜構圖的高階工作流程
- 確定哪個圖像提供佈局(構圖),哪個提供主體身分,以及哪個提供風格。如果您有三個圖像,請為每個圖像分配一個角色。
- 草繪一個縮圖(在腦海中或快速塗鴉)。記下焦點和深度。
- 一開始保持其權重適中(例如,0.6–0.8)。您稍後會進行調整。
- 給予主體參考略高的權重(例如,0.8–1.0),以便身分在構圖壓力下得以保留。
- 如果來源很雜亂,請使用主體圖像的緊密裁剪;它提高了身分識別的準確性。
- 使用風格圖像(調色盤/筆觸/光照)。從較低的權重(0.3–0.6)開始,以避免壓倒主體身分。
- 如果風格崩潰了真實感,請嘗試使用文字風格描述,而不是(或除了)風格圖像。
- 指定場景、鏡頭、光照和材質屬性,以對齊不同的參考。
- 包含空間角色:「主體 A 在前景中」、「圖像 B 的背景」、「圖像 C 的風格」。
- 指出瑕疵(「扭曲的手」、「多餘的肢體」、「雙重眼睛」、「標誌滲色」、「光照不匹配」、「故障」)。
- 如果風格太強烈,請新增一個否定詞,例如「過度風格化、繪畫塗抹」或「粗厚的筆觸紋理」(如果不需要)。
- 一旦整體構圖有效,凍結種子以精確地疊代權重、風格強度和細節。
- 一次更改一個參數(例如,風格權重 +0.1)並進行比較。
順便說一句,一些公開指南提供了基於場景的提示配方和 A/B 測試,這些配方和測試反映了這種分階段方法,而端到端的操作指南則分解了參考和負面提示策略。
提示架構:一種可靠的模式
使用您可以快速調整的分層、可讀的結構:
- 系統/指令意圖(如果支援):「嚴格按照參考圖像來確定身分,使用文字來表現風格的細微差別。」
範例結構(偽提示):
圖像:
- img_layout: {URL or upload id} 權重:0.7 角色:佈局
- img_identity: {URL or upload id} 權重:0.9 角色:主體身分
- img_style: {URL or upload id} 權重:0.4 角色:風格/調色盤
提示:
來自 img_identity 的主體的中景肖像,站在 img_layout 的街道場景中。
保持來自 img_style 的調色盤和光照氛圍:溫暖的黃昏、柔和的輪廓光、淺景深。
相機:50mm,f/1.8,肩部高度角度。柔和的散景,真實的皮膚紋理。
服裝:簡約的深色夾克,沒有標誌。表情:平靜、自信。
否定:
過度風格化的筆觸、繪畫塗抹、塑膠皮膚、多餘的手指、扭曲的手、重複的面部特徵,
不匹配的透視、海報化的陰影、色度噪點、標誌瑕疵。
控制項:
種子:142375
引導:5.5–7.5(從 6.5 開始)
尺寸:768x1024(直式)或 1024x768(橫式)
如果您的介面支援圖像權重滑桿或權杖,請將權重保持在 0.3–1.2 的範圍內;僅在身分崩潰時才提高權重。即使在 Nano Banana 之外,從業者也發現較低的權重賦予自由,而較高的權重則強制執行保真度。
圖像權重:三種實用配方
構圖控制:透視、深度和光照
- 透視:在文字和圖像中對齊鏡頭等效物(例如,「24mm 廣角鏡頭」用於廣闊的場景;「85mm」用於肖像)。如果佈局圖像為 24mm,但您要求 85mm 的外觀,則模型必須調和衝突的幾何形狀。保持它們一致。
- 深度:提及前景/中景/背景角色(「主體前景,天際線中景,山脈背景」)。這減少了物件重疊錯誤。
- 光照:宣告單一的主導光源和一天中的時間。使用「左側主光,暖色;填充柔和,冷色;輪廓光微妙」。這有助於融合不匹配的源圖像。
真正有幫助的負面提示
- 結構性:「透視不匹配」、「傾斜的地平線」、「扭曲的解剖結構」、「平面深度」。
- 表面/紋理:「塑膠光澤」、「泥濘的細節」、「海報化」、「條帶化」、「過度銳化的邊緣」。
- 風格控制:在追求真實感時,「過度風格化」、「粗厚的筆觸紋理」、「卡通化」。
- 一致性:如果標誌或浮水印侵入,請新增「無浮水印,無標誌」。
種子和變化策略
- 鎖定種子並以小步驟疊代權重:±0.1。保留版本日誌。
- 如果小細節不斷崩潰(手、小道具),請保留種子,但將引導/CFG 調整 ±0.5 並調整否定詞。
解析度、長寬比和放大
- 以或接近您的目標長寬比生成,以避免在放大期間發生構圖變化。
- 如果您需要超高細節,請在短邊上以 768–1024 像素產生一個強大的基礎,然後使用保留細節的通道進行放大。避免在放大過程中更改長寬比。
疑難排解手冊
- 在文字中新增明確的身分描述符(髮型、面部標記、配件)。
- 降低風格權重;新增否定詞,例如「過度風格化、繪畫塗抹」。
- 提高佈局權重,增加文字中的深度提示(「清晰的平面分離」)。
- 協調到一天中的一個時間和一個光照方向;明確提及它。
- 在對構圖進行小幅更改後,使用相同的種子重新生成,以保持構圖但刷新細節。
真實世界的用例
- 佈局:生活方式照片;身分:產品包裝照;風格:品牌語氣板。
- 提示一致的陰影和反射;否定詞用於「漂浮物件」、「假反射」。
- 佈局:工作室姿勢參考;身分:人物;風格:繪畫或顏色分級參考。
- 控制文字中的飽和度和紋理;保持適中的風格權重以實現相似性。
- 佈局:環境底板;身分:角色轉身;風格:電影攝影鏡頭。
- 指定佈局暗示的相機移動(「低矮的滑軌,稍微向上傾斜」)。
範例提示(可複製)
圖像:
- img_layout: city_street_at_dusk.jpg 權重:0.7 角色:佈局
- img_identity: subject_headshot.png 權重:1.0 角色:身分
提示:
站在人行橫道上的身分主體的中景肖像,與 img_layout 相同的透視。
黃金時段的側光、淺景深、自然的皮膚紋理、柔和的散景。
否定:
塑膠皮膚、扭曲的手指、多餘的肢體、標誌瑕疵、過度銳化的邊緣。
控制項:
種子:88123,引導:6.5,尺寸:896x1152
圖像:
- img_layout: forest_path_wide.png 權重:0.8 角色:佈局
- img_identity: runner_profile.jpg 權重:0.9 角色:身分
- img_style: teal_orange_grade.png 權重:0.5 角色:風格
提示:
在同一條森林小徑上奔跑者的全身照,動態的步伐,清晰的運動,青色橙色的電影分級。
鏡頭 35mm,低角度,早晨的薄霧,來自右側的定向陽光。
否定:
運動模糊條紋、泥濘的樹葉、海報化、不匹配的陰影。
控制項:
種子:44701,引導:6.0,尺寸:1024x768
圖像:
- img_layout: studio_three_point_lighting.jpg 權重:0.6 角色:佈局
- img_identity: model_closeup.png 權重:0.7 角色:身分
- img_style: magazine_cover_moodboard.jpg 權重:0.9 角色:風格
提示:
社論封面肖像,有光澤的亮點,簡約的背景,左側有適合排版的負空間。
鏡頭 85mm,f/2,中性表情,乾淨的妝容。
否定:
刺眼的皮膚平滑、過度風格化的筆觸、條帶化、色彩邊紋。
控制項:
種子:99021,引導:7.0,尺寸:1024x1365
對於圍繞此模型的更深入的場景設置和提示剖析範例,社群文章很有幫助。獨立的匯總也突顯了 Nano Banana 的多圖像融合優勢。
複雜場景的專業提示
- 保持角色明確:您使用的圖像越多,您就越必須宣告誰做什麼。
- 使用相機提示優先考慮真實感:鏡頭、光圈、高度、光照方向。
- 像設計師一樣疊代:小的、記錄的增量,並具有固定的種子。
- 知道何時切換:如果圖像不斷與目標作鬥爭(衝突的透視),請替換它,而不是過度調整。
如果您正在進行提示草擬和疊代比較,則可以並排的工作空間,該工作空間可以保存種子、權重和負面的版本控制,這是非常有價值的。值得注意的是:您可以使用提示管理工具來模板化多圖像角色、儲存圖像 ID,並快速 A/B 權重——在運行數十個小疊代以調整融合品質時非常方便。
主要要點
參考文獻和延伸閱讀:Nano Banana 提示概述和社群操作指南;關於其多圖像融合能力的評論;模型目錄列表。
常見問題解答
Q1:如何在 Nano Banana 中權衡多個圖像以獲得更好的融合效果?
分配角色(佈局、身分、風格)並從 0.7/1.0/0.5 等權重開始。如果相似性漂移,則提高身分權重;如果外觀壓倒了真實感,則降低風格權重。小的 ±0.1 更改效果最佳。
Q2:哪些負面提示有助於 Nano Banana 中的多圖像融合?
使用結構和紋理防護:「扭曲的解剖結構、不匹配的透視、塑膠皮膚、海報化、過度銳化的邊緣、標誌瑕疵」。在需要真實感時,新增風格控制否定詞,例如「過度風格化的筆觸」。
Q3:在混合複雜的構圖時,我應該固定種子嗎?
是的。自由探索,直到您喜歡取景,然後鎖定種子以可預測地疊代權重、風格強度、引導和否定詞,而不會失去構圖。
Q4:我應該使用什麼解析度和長寬比進行多圖像融合?
生成接近您的目標長寬比(例如,1024×768 或 896×1152),以避免構圖變化。然後使用保留細節的通道進行放大,保持長寬比不變。
Q5:我可以將風格圖像和文字描述混合在一起嗎?
當然可以。從較低的風格圖像權重 (0.3–0.5) 開始,並透過文字(光照、顏色分級)增強外觀。如果風格圖像與場景衝突,請降低其權重或切換到純文字風格。