How do I weight multiple images in Nano Banana for better fusion?

Assign roles (layout, identity, style) and start with weights like 0.7/1.0/0.5. Raise identity weight if likeness drifts; lower style weight if the look overpowers realism. Small ±0.1 changes work best.

What negative prompts help with multi‑image fusion in Nano Banana?

Use structural and texture guards: “warped anatomy, mismatched perspective, plastic skin, posterization, over‑sharpened edges, logo artifacts.” Add style‑control negatives like “over‑stylized brushwork” when realism is required.

Should I fix the seed when blending complex compositions?

Yes. Explore freely until you like the framing, then lock the seed to iterate predictably on weights, style strength, guidance, and negatives without losing composition.

What resolution and aspect ratio should I use for multi‑image fusion?

Generate close to your target aspect ratio (e.g., 1024×768 or 896×1152) to avoid composition shifts. Upscale afterward with a detail‑preserving pass, keeping the aspect constant.

Can I mix a style image and a text description together?

Absolutely. Start with a low style image weight (0.3–0.5) and reinforce the look via text (lighting, color grade). If the style image fights the scene, reduce its weight or switch to text‑only styling.

Jak Promptować dla Fuzji Wielu Obrazów w Nano Banana dla Złożonych Kompozycji

Styl: Praktyczny i zorientowany na rozwiązania

Jeśli kiedykolwiek próbowałeś połączyć wiele obrazów referencyjnych w jedną, spójną scenę, znasz tę trudność: zachować szczegóły obiektu, utrzymać spójność stylu i nadal uzyskać kompozycję, która faktycznie działa. Fuzja wielu obrazów w Nano Banana może to zrobić z zaskakującą niezawodnością – jeśli promptujesz z zamiarem. Ten przewodnik przeprowadzi Cię przez sprawdzony w praktyce przepływ pracy dla złożonych kompozycji, w tym formatowanie wejścia, strategie ważenia obrazów, planowanie kompozycji, negatywne promptowanie, kontrolę seeda i rozwiązywanie problemów.

Warto od razu zauważyć: publiczne opracowania opisują Nano Banana jako najnowocześniejszy model obrazowania z silnymi możliwościami edycji, spójności i fuzji wielu obrazów, i jest on wymieniony wśród modeli gotowych do produkcji w katalogach modeli. Przewodniki społecznościowe przedstawiają również wzorce promptów i oparte na scenariuszach porady dotyczące modelu oraz praktyczne instrukcje użytkowania, które tutaj syntetyzujemy.

Czym jest fuzja wielu obrazów w Nano Banana?

Definicja: Połączenie dwóch lub więcej obrazów wejściowych (obiektów, stylów, układów) w jedno wyjście, przy jednoczesnym rozwiązaniu konfliktów w oświetleniu, perspektywie, paletach kolorów i rozmieszczeniu przestrzennym.

Dlaczego to ma znaczenie: Pozwala budować złożone kompozyty (np. portret w stylu akwarelowego krajobrazu; produkt umieszczony w scenie filmowej) bez ręcznego maskowania.

Kluczowe dźwignie: Wagi obrazów, priorytety promptów tekstowych, negatywne prompty, kontrola seeda i ograniczenia proporcji/rozmiaru.

Ogólny przepływ pracy dla złożonych kompozycji

Zaplanuj kompozycję przed promptowaniem

Zdecyduj, który obraz dostarcza układ (kompozycję), który dostarcza tożsamość obiektu, a który dostarcza styl. Jeśli masz trzy obrazy, przypisz rolę każdemu z nich.

Naszkicuj miniaturkę (w myślach lub szybki szkic). Zwróć uwagę na punkty ogniskowe i głębię.

Zacznij od obrazu bazowego dla układu

Użyj obrazu referencyjnego, którego perspektywa i kadrowanie już pasują do pożądanej sceny.

Na początku utrzymuj jego wagę na umiarkowanym poziomie (np. 0,6–0,8). Dostroisz ją później.

Dodaj obrazy tożsamości obiektu

Nadaj referencji obiektu nieco wyższą wagę (np. 0,8–1,0), aby tożsamość przetrwała presję kompozycji.

Użyj ciasnego kadru dla obrazu tożsamości, jeśli źródło jest zajęte; poprawia to przywoływanie tożsamości.

Nałóż styl

Użyj obrazu stylu (paleta/kreska/oświetlenie). Zacznij od niższej wagi (0,3–0,6), aby uniknąć przytłoczenia tożsamości.

Jeśli styl załamuje realizm, eksperymentuj z tekstowym opisem stylu zamiast (lub oprócz) obrazu stylu.

Napisz prompt, który rozwiązuje konflikty

Określ scenę, obiektyw, oświetlenie i właściwości materiałów, aby wyrównać różne odniesienia.

Dołącz role przestrzenne: „Obiekt A na pierwszym planie”, „Tło z obrazu B”, „Styl z obrazu C”.

Dodaj negatywne prompty, aby chronić kompozycję

Wymień artefakty („zniekształcone dłonie”, „dodatkowe kończyny”, „podwójne oczy”, „przecieki logo”, „niedopasowane oświetlenie”, „usterki”).

Jeśli styl jest zbyt silny, dodaj negatyw, taki jak „przesadnie wystylizowany, malarski rozmaz” lub „gruba faktura pędzla” (jeśli niepożądana).

Zablokuj seed po dobrym szkicu

Gdy globalna kompozycja działa, zamroź seed, aby precyzyjnie iterować na wagach, sile stylu i szczegółach.

Iteruj z małymi deltami

Zmieniaj jeden parametr na raz (np. waga stylu +0,1) i porównuj.

Nawiasem mówiąc, niektóre publiczne przewodniki oferują oparte na scenariuszach przepisy promptowania i A/B, które odzwierciedlają to podejście etapowe, podczas gdy kompleksowe instrukcje rozkładają taktyki odwoływania się i negatywnego promptowania.

Architektura promptu: niezawodny wzorzec

Użyj warstwowej, czytelnej struktury, którą możesz szybko dostosować:

Intencja systemowa/instruktażowa (jeśli obsługiwana): „Ściśle przestrzegaj obrazów referencyjnych dla tożsamości, użyj tekstu dla niuansów stylu”.

Blok obrazów z rolami: układ, tożsamość, styl.

Blok tekstu z kompozycją, kamerą, oświetleniem i materiałami.

Negatywny prompt.

Kontrole: seed, guidance/CFG, rozmiar/proporcje.

Przykładowa struktura (pseudo-prompt):

Obrazy:
- img_layout: <URL or upload id> waga: 0.7 rola: układ
- img_identity: <URL or upload id> waga: 0.9 rola: tożsamość obiektu
- img_style: <URL or upload id> waga: 0.4 rola: styl/paleta
Prompt:
Portret w średnim ujęciu obiektu z img_identity, stojącego na scenie ulicznej z img_layout.
Zachowaj paletę kolorów i nastrój oświetlenia z img_style: ciepły zmierzch, miękkie światło krawędziowe, mała głębia ostrości.
Kamera: 50mm, f/1.8, kąt na wysokości ramion. Miękki bokeh, realistyczna tekstura skóry.
Garderoba: minimalistyczna ciemna kurtka, bez logo. Wyraz twarzy: spokojny, pewny siebie.
Negatywy:
przesadnie wystylizowana kreska, malarski rozmaz, plastikowa skóra, dodatkowe palce, zniekształcone dłonie, zduplikowane rysy twarzy,
niedopasowana perspektywa, spłaszczone cienie, szum chromatyczny, artefakty logo.
Kontrole:
seed: 142375
guidance: 5.5–7.5 (zacznij od 6.5)
rozmiar: 768x1024 (portret) lub 1024x768 (pejzaż)

Jeśli Twój interfejs obsługuje suwaki wagi obrazu lub tokeny, utrzymuj wagi w paśmie 0,3–1,2; idź wyżej tylko wtedy, gdy tożsamość się załamuje. Nawet poza Nano Banana, praktycy odkryli, że niższa waga daje swobodę, a wyższa waga wymusza wierność.

Wagi obrazów: trzy praktyczne przepisy

Portret z naciskiem na tożsamość

układ: 0,5–0,7

tożsamość: 0,9–1,1

styl: 0,3–0,5

Dlaczego: Utrzymuje wierność twarzy, jednocześnie sugerując wygląd.

Redakcja z naciskiem na styl

układ: 0,6–0,8

tożsamość: 0,6–0,8

styl: 0,7–1,0

Dlaczego: Wymusza silny kierunek artystyczny w całej klatce.

Zrównoważone budowanie świata

układ: 0,8–1,0

tożsamość: 0,7–0,9

styl: 0,4–0,7

Dlaczego: Spójność kompozycji ma największe znaczenie; tożsamość jest obecna, ale nie absolutna.

Kontrola kompozycji: perspektywa, głębia i oświetlenie

Perspektywa: Wyrównaj ekwiwalenty obiektywów w tekście i obrazach (np. „szeroki kadr 24 mm” dla rozległych scen; „85 mm” dla portretów). Jeśli obraz układu ma 24 mm, ale prosisz o wygląd 85 mm, model musi pogodzić sprzeczną geometrię. Utrzymuj je w spójności.

Głębia: Wspomnij o rolach pierwszego planu/drugiego planu/tła („obiekt na pierwszym planie, linia horyzontu na drugim planie, góry w tle”). Zmniejsza to błędy nakładania się obiektów.

Oświetlenie: Zadeklaruj jedno dominujące źródło światła i porę dnia. Użyj „światło kluczowe z lewej strony, ciepłe; wypełnienie miękkie, chłodne; światło krawędziowe subtelne”. Pomaga to połączyć niedopasowane obrazy źródłowe.

Negatywne prompty, które faktycznie pomagają

Strukturalne: „niedopasowana perspektywa”, „przechylony horyzont”, „zniekształcona anatomia”, „płaska głębia”.

Powierzchnia/tekstura: „plastikowy połysk”, „zamglone szczegóły”, „posteryzacja”, „pasmowanie”, „przesadnie wyostrzone krawędzie”.

Kontrola stylu: „przesadnie wystylizowane”, „gruba faktura pędzla”, „kreskówkowe”, gdy dążysz do realizmu.

Spójność: Jeśli logo lub znaki wodne przeszkadzają, dodaj „brak znaków wodnych, brak logo”.

Seed i strategia wariacji

Eksploruj z losowym seedem, aż kadrowanie „kliknie”.

Zablokuj seed i iteruj wagi w małych krokach: ±0,1. Prowadź dziennik wersji.

Jeśli drobne szczegóły ciągle się psują (dłonie, małe rekwizyty), zachowaj seed, ale popchnij guidance/CFG o ±0,5 i dostosuj negatywy.

Rozdzielczość, proporcje i upscaling

Generuj w docelowych proporcjach lub blisko nich, aby uniknąć przesunięć kompozycji podczas upscalingu.

Jeśli potrzebujesz bardzo wysokiego poziomu szczegółów, stwórz mocną bazę w rozdzielczości 768–1024 px na krótszym boku, a następnie przeskaluj w górę z zachowaniem szczegółów. Unikaj zmiany proporcji podczas upscalingu.

Instrukcja rozwiązywania problemów

Twarz lub tożsamość się zmieniają

Zwiększ wagę tożsamości o +0,1 do +0,2.

Dodaj wyraźne deskryptory tożsamości w tekście (fryzura, znamiona na twarzy, akcesoria).

Użyj ciaśniejszego kadru tożsamości.

Styl przytłacza realizm

Zmniejsz wagę stylu; dodaj negatywy, takie jak „przesadnie wystylizowany, malarski rozmaz”.

Zastąp obraz stylu promptem stylu tylko tekstowego.

Bałagan kompozycyjny

Podnieś wagę układu, zwiększ wskazówki dotyczące głębi w tekście („wyraźne oddzielenie planów”).

Uprość prompt; usuń sprzeczne przymiotniki.

Niedopasowanie oświetlenia

Dostosuj do jednej pory dnia i jednego kierunku światła; wspomnij o tym wyraźnie.

Jeśli obraz stylu narzuca inne oświetlenie, zmniejsz jego wagę.

Powtarzające się artefakty (dłonie, logo)

Wzmocnij negatywy; nieznacznie zwiększ guidance.

Wygeneruj ponownie z tym samym seedem po drobnych zmianach, aby zachować kompozycję, ale odświeżyć szczegóły.

Przypadki użycia w świecie rzeczywistym

Produkt w ustawieniu lifestyle

Układ: zdjęcie lifestyle; Tożsamość: packshot produktu; Styl: tablica tonacji marki.

Promptuj dla spójnych cieni i odbić; negatywne dla „pływających obiektów”, „fałszywych odbić”.

Portret w stylu mistrza

Układ: odniesienie do pozy w studio; Tożsamość: osoba; Styl: odniesienie do malowania lub oceny kolorów.

Kontroluj nasycenie i teksturę w tekście; utrzymuj umiarkowaną wagę stylu dla podobieństwa.

Mashup panelu storyboardu

Układ: płyta środowiskowa; Tożsamość: charakter turnaround; Styl: klatka kinematografii.

Określ ruch kamery wynikający z układu („niski dolly, lekkie przechylenie w górę”).

Przykładowe prompty (gotowe do skopiowania)

Fuzja dwóch obrazów: tożsamość + układ

Obrazy:
- img_layout: city_street_at_dusk.jpg waga: 0.7 rola: układ
- img_identity: subject_headshot.png waga: 1.0 rola: tożsamość
Prompt:
Portret w średnim ujęciu obiektu tożsamości stojącego na przejściu dla pieszych, ta sama perspektywa co img_layout.
Boczne światło złotej godziny, mała głębia, naturalna tekstura skóry, miękki bokeh.
Negatywy:
plastikowa skóra, zniekształcone palce, dodatkowe kończyny, artefakty logo, przesadnie wyostrzone krawędzie.
Kontrole:
seed: 88123, guidance: 6.5, rozmiar: 896x1152

Fuzja trzech obrazów: układ + tożsamość + styl

Obrazy:
- img_layout: forest_path_wide.png waga: 0.8 rola: układ
- img_identity: runner_profile.jpg waga: 0.9 rola: tożsamość
- img_style: teal_orange_grade.png waga: 0.5 rola: styl
Prompt:
Ujęcie całej sylwetki biegacza na tej samej leśnej ścieżce, dynamiczny krok, wyraźny ruch, kinematograficzna ocena teal-orange.
Obiektyw 35mm, niski kąt, poranna mgła, kierunkowe światło słoneczne z prawej strony.
Negatywy:
smugi rozmycia ruchu, zamglone listowie, posteryzacja, niedopasowane cienie.
Kontrole:
seed: 44701, guidance: 6.0, rozmiar: 1024x768

Kompozyt redakcyjny z dominującym stylem

Obrazy:
- img_layout: studio_three_point_lighting.jpg waga: 0.6 rola: układ
- img_identity: model_closeup.png waga: 0.7 rola: tożsamość
- img_style: magazine_cover_moodboard.jpg waga: 0.9 rola: styl
Prompt:
Portret na okładce redakcyjnej, błyszczące światła, minimalne tło, bezpieczna typograficznie przestrzeń negatywna po lewej stronie.
Obiektyw 85mm, f/2, neutralny wyraz twarzy, czysty makijaż.
Negatywy:
szorstkie wygładzanie skóry, przesadnie wystylizowana kreska, pasmowanie, obwódki kolorów.
Kontrole:
seed: 99021, guidance: 7.0, rozmiar: 1024x1365

Aby uzyskać bardziej szczegółowe konfiguracje scenariuszy i przykłady anatomii promptów wokół tego modelu, pomocne są opracowania społecznościowe. Niezależne zestawienia również podkreślają fuzję wielu obrazów wśród mocnych stron Nano Banana.

Profesjonalne porady dotyczące złożonych scen

Utrzymuj role w sposób wyraźny: Im więcej obrazów używasz, tym bardziej musisz zadeklarować, kto co robi.

Priorytetowo traktuj realizm za pomocą wskazówek dotyczących kamery: obiektyw, przysłona, wysokość, kierunek oświetlenia.

Używaj stylu jako przyprawy: zacznij nisko, podkręć tylko w razie potrzeby.

Iteruj jak projektant: małe, zalogowane delty ze stałym seedem.

Wiedz, kiedy się przełączyć: jeśli obraz ciągle walczy z celem (sprzeczna perspektywa), wymień go, zamiast go nadmiernie stroić.

Uwaga na temat Sider.AI

Jeśli tworzysz prompty i iteracyjne porównania, przydatne jest środowisko pracy obok siebie, które przechowuje seed, wagi i negatywy w wersjach. Warto zauważyć: możesz użyć narzędzia do zarządzania promptami, aby tworzyć szablony ról dla wielu obrazów, przechowywać identyfikatory obrazów i szybko ważyć A/B – przydatne podczas wykonywania dziesiątek małych iteracji w celu ustalenia jakości fuzji.

Kluczowe wnioski

Przypisz jasne role każdemu obrazowi referencyjnemu: układ, tożsamość, styl.

Zacznij konserwatywnie z wagą stylu; chroń tożsamość wyższą wagą.

Harmonizuj obiektyw i oświetlenie w tekstach i wskazówkach obrazowych.

Zablokuj seed przed mikro-dostrajaniem; zmieniaj jedną rzecz na raz.

Używaj ukierunkowanych negatywów do kontroli struktury, tekstury i artefaktów.

Referencje i dalsza lektura: Przeglądy promptowania Nano Banana i instrukcje społecznościowe; komentarze na temat jego możliwości fuzji wielu obrazów; wykaz katalogów modeli.

FAQ

P1: Jak mogę ważyć wiele obrazów w Nano Banana, aby uzyskać lepszą fuzję? Przypisz role (układ, tożsamość, styl) i zacznij od wag, takich jak 0,7/1,0/0,5. Podnieś wagę tożsamości, jeśli podobieństwo się zmienia; obniż wagę stylu, jeśli wygląd przytłacza realizm. Najlepiej sprawdzają się małe zmiany ±0,1.

P2: Jakie negatywne prompty pomagają w fuzji wielu obrazów w Nano Banana? Użyj osłon strukturalnych i tekstur: „zniekształcona anatomia, niedopasowana perspektywa, plastikowa skóra, posteryzacja, przesadnie wyostrzone krawędzie, artefakty logo”. Dodaj negatywy kontroli stylu, takie jak „przesadnie wystylizowana kreska”, gdy wymagany jest realizm.

P3: Czy powinienem ustalić seed podczas łączenia złożonych kompozycji? Tak. Eksploruj swobodnie, aż spodoba ci się kadrowanie, a następnie zablokuj seed, aby iterować w przewidywalny sposób na wagach, sile stylu, guidance i negatywach bez utraty kompozycji.

P4: Jakiej rozdzielczości i proporcji powinienem użyć do fuzji wielu obrazów? Generuj blisko docelowych proporcji (np. 1024 × 768 lub 896 × 1152), aby uniknąć przesunięć kompozycji. Następnie przeskaluj w górę z zachowaniem szczegółów, utrzymując stałe proporcje.

P5: Czy mogę połączyć obraz stylu i opis tekstowy? Absolutnie. Zacznij od niskiej wagi obrazu stylu (0,3–0,5) i wzmocnij wygląd za pomocą tekstu (oświetlenie, ocena kolorów). Jeśli obraz stylu koliduje ze sceną, zmniejsz jego wagę lub przełącz się na stylizację tylko tekstową.