How do I weight multiple images in Nano Banana for better fusion?

Assign roles (layout, identity, style) and start with weights like 0.7/1.0/0.5. Raise identity weight if likeness drifts; lower style weight if the look overpowers realism. Small ±0.1 changes work best.

What negative prompts help with multi‑image fusion in Nano Banana?

Use structural and texture guards: “warped anatomy, mismatched perspective, plastic skin, posterization, over‑sharpened edges, logo artifacts.” Add style‑control negatives like “over‑stylized brushwork” when realism is required.

Should I fix the seed when blending complex compositions?

Yes. Explore freely until you like the framing, then lock the seed to iterate predictably on weights, style strength, guidance, and negatives without losing composition.

What resolution and aspect ratio should I use for multi‑image fusion?

Generate close to your target aspect ratio (e.g., 1024×768 or 896×1152) to avoid composition shifts. Upscale afterward with a detail‑preserving pass, keeping the aspect constant.

Can I mix a style image and a text description together?

Absolutely. Start with a low style image weight (0.3–0.5) and reinforce the look via text (lighting, color grade). If the style image fights the scene, reduce its weight or switch to text‑only styling.

Wie man Prompts für Multi-Image-Fusion in Nano Banana für komplexe Kompositionen erstellt

Stil: Praktisch & lösungsorientiert

Wer jemals versucht hat, mehrere Referenzbilder zu einer einzigen, kohärenten Szene zu verschmelzen, kennt den Drahtseilakt: Subjektdetails bewahren, den Stil konsistent halten und trotzdem eine Komposition erzielen, die tatsächlich funktioniert. Die Multi-Image-Fusion von Nano Banana kann dies mit überraschender Zuverlässigkeit leisten – wenn man mit Absicht prompted. Dieser Leitfaden führt Sie durch einen praxiserprobten Workflow für komplexe Kompositionen, einschließlich Eingabeformatierung, Bildgewichtungsstrategien, Kompositionsplanung, Negative Prompts, Seed-Kontrolle und Fehlerbehebung.

Vorab sei angemerkt: Öffentliche Berichte beschreiben Nano Banana als ein hochmodernes Bildmodell mit starken Bearbeitungs-, Konsistenz- und Multi-Image-Fusionsfähigkeiten, und es wird in Modellverzeichnissen als produktionsreifes Modell aufgeführt. Community-Leitfäden skizzieren auch Prompt-Muster und szenariobasierte Tipps für das Modell sowie praktische Anwendungsbeispiele, die wir hier zusammenfassen.

Was ist Multi-Image-Fusion in Nano Banana?

Definition: Die Kombination von zwei oder mehr Eingangsbildern (Subjekte, Stile, Layouts) zu einem einzigen Ausgabebild unter Lösung von Konflikten in Bezug auf Beleuchtung, Perspektive, Farbpaletten und räumliche Anordnung.

Warum es wichtig ist: Es ermöglicht Ihnen, komplexe Komposits zu erstellen (z. B. ein Porträt im Stil einer Aquarelllandschaft; ein Produkt, das in eine Filmszene platziert wird) ohne manuelles Maskieren.

Kernhebel: Bildgewichtungen, Text-Prompt-Prioritäten, Negative Prompts, Seed-Kontrolle und Aspekt-/Größenbeschränkungen.

High-Level-Workflow für komplexe Kompositionen

Planen Sie die Komposition vor dem Prompten

Entscheiden Sie, welches Bild das Layout (Komposition), welches die Subjektidentität und welches den Stil liefert. Wenn Sie drei Bilder haben, weisen Sie jedem eine Rolle zu.

Skizzieren Sie eine Miniaturansicht (mental oder als schnelle Kritzelei). Notieren Sie Schwerpunkte und Tiefe.

Beginnen Sie mit einem Basisbild für das Layout

Verwenden Sie ein Referenzbild, dessen Perspektive und Rahmen bereits Ihrer gewünschten Szene entsprechen.

Halten Sie sein Gewicht anfangs moderat (z. B. 0,6–0,8). Sie werden später feinabstimmen.

Fügen Sie das/die Subjektidentitätsbild(er) hinzu

Geben Sie der Subjektreferenz ein etwas höheres Gewicht (z. B. 0,8–1,0), damit die Identität dem Kompositionsdruck standhält.

Verwenden Sie einen engen Ausschnitt für das Identitätsbild, wenn die Quelle unübersichtlich ist; dies verbessert die Identitätswiedergabe.

Layern Sie den Stil

Verwenden Sie ein Stilbild (Palette/Pinselstrich/Beleuchtung). Beginnen Sie mit einem geringeren Gewicht (0,3–0,6), um zu vermeiden, dass die Identität überlagert wird.

Wenn der Stil den Realismus untergräbt, experimentieren Sie mit einer textuellen Stilbeschreibung anstelle von (oder zusätzlich zu) einem Stilbild.

Schreiben Sie einen Prompt, der Konflikte löst

Geben Sie die Szene, die Linse, die Beleuchtung und die Materialeigenschaften an, um die unterschiedlichen Referenzen aufeinander abzustimmen.

Fügen Sie die räumlichen Rollen hinzu: „Subjekt A im Vordergrund“, „Hintergrund von Bild B“, „Stil von Bild C“.

Fügen Sie Negative Prompts hinzu, um die Komposition zu schützen

Nennen Sie Artefakte („verzerrte Hände“, „zusätzliche Gliedmaßen“, „doppelte Augen“, „Logo-Ausblutung“, „nicht übereinstimmende Beleuchtung“, „Glitches“).

Wenn der Stil zu stark ist, fügen Sie ein Negativ wie „überstylisierte, malerische Schmiererei“ oder „dicke Pinseltextur“ hinzu (wenn unerwünscht).

Sperren Sie den Seed nach einem guten Entwurf

Sobald die globale Komposition funktioniert, frieren Sie den Seed ein, um präzise an Gewichten, Stilintensität und Details zu iterieren.

Iterieren Sie mit kleinen Deltas

Ändern Sie jeweils einen Parameter (z. B. Stilgewicht +0,1) und vergleichen Sie.

Übrigens, einige öffentliche Leitfäden bieten szenariobasierte Prompting-Rezepte und A/Bs an, die diesen Staging-Ansatz widerspiegeln, während End-to-End-Anleitungen Referenzierungs- und Negative-Prompting-Taktiken aufschlüsseln.

Prompt-Architektur: ein zuverlässiges Muster

Verwenden Sie eine geschichtete, lesbare Struktur, die Sie schnell anpassen können:

System/Instruktionale Absicht (falls unterstützt): „Befolgen Sie Referenzbilder strikt für die Identität, verwenden Sie Text für Stilnuancen.“

Bilderblock mit Rollen: Layout, Identität, Stil.

Textblock mit Komposition, Kamera, Beleuchtung und Materialien.

Negativer Prompt.

Steuerelemente: Seed, Guidance/CFG, Größe/Aspekt.

Beispielstruktur (Pseudo-Prompt):

Bilder:
- img_layout: {URL or upload id} Gewicht: 0.7 Rolle: Layout
- img_identity: {URL or upload id} Gewicht: 0.9 Rolle: Subjektidentität
- img_style: {URL or upload id} Gewicht: 0.4 Rolle: Stil/Palette
Prompt:
Eine Mittelaufnahme des Subjekts von img_identity, das in der Straßenszene von img_layout steht.
Behalten Sie die Farbpalette und die Lichtstimmung von img_style bei: warmer Dämmerung, weiches Streiflicht, geringe Schärfentiefe.
Kamera: 50mm, f/1.8, Schulterhöhe. Weiches Bokeh, realistische Hauttextur.
Garderobe: minimalistische dunkle Jacke, keine Logos. Ausdruck: ruhig, selbstbewusst.
Negative:
überstylisierte Pinselstriche, malerische Schmiererei, plastische Haut, zusätzliche Finger, verzerrte Hände, doppelte Gesichtszüge,
nicht übereinstimmende Perspektive, posterisierte Schatten, chromatisches Rauschen, Logo-Artefakte.
Steuerelemente:
Seed: 142375
Guidance: 5.5–7.5 (Start 6.5)
Größe: 768x1024 (Porträt) oder 1024x768 (Landschaft)

Wenn Ihre Benutzeroberfläche Bildgewichtungsregler oder -token unterstützt, halten Sie die Gewichte in einem Band von 0,3–1,2; gehen Sie nur höher, wenn die Identität zusammenbricht. Auch außerhalb von Nano Banana haben Praktiker festgestellt, dass ein geringeres Gewicht Freiheit gewährt, während ein höheres Gewicht die Wiedergabetreue erzwingt.

Bildgewichtungen: drei praktische Rezepte

Identitätsorientiertes Porträt

Layout: 0,5–0,7

Identität: 0,9–1,1

Stil: 0,3–0,5

Warum: Behält die Gesichtstreue bei und deutet gleichzeitig einen Look an.

Stilorientiertes Editorial

Layout: 0,6–0,8

Identität: 0,6–0,8

Stil: 0,7–1,0

Warum: Setzt eine starke Art Direction im gesamten Bild durch.

Ausgewogener Weltenaufbau

Layout: 0,8–1,0

Identität: 0,7–0,9

Stil: 0,4–0,7

Warum: Die Kohärenz der Komposition ist am wichtigsten; die Identität ist vorhanden, aber nicht absolut.

Kompositionskontrolle: Perspektive, Tiefe und Beleuchtung

Perspektive: Richten Sie Linsenäquivalente zwischen Text und Bildern aus (z. B. „24mm Weitwinkelaufnahme“ für weitläufige Szenen; „85mm“ für Porträts). Wenn das Layoutbild 24mm ist, Sie aber nach einem 85mm-Look fragen, muss das Modell widersprüchliche Geometrien in Einklang bringen. Halten Sie sie konsistent.

Tiefe: Erwähnen Sie Vordergrund-/Mittelgrund-/Hintergrundrollen („Subjekt im Vordergrund, Skyline im Mittelgrund, Berge im Hintergrund“). Dies reduziert Objektüberlappungsfehler.

Beleuchtung: Deklarieren Sie eine einzige dominante Lichtquelle und Tageszeit. Verwenden Sie „Hauptlicht links, warm; Fülllicht weich, kühl; Streiflicht subtil.“ Dies hilft, nicht übereinstimmende Quellbilder zu verschmelzen.

Negative Prompts, die tatsächlich helfen

Strukturell: „nicht übereinstimmende Perspektive“, „geneigter Horizont“, „verzerrte Anatomie“, „flache Tiefe“.

Oberfläche/Textur: „plastischer Glanz“, „schlammige Details“, „Posterisierung“, „Banding“, „überschärfte Kanten“.

Stilkontrolle: „überstylisiert“, „dicke Pinseltextur“, „cartoonhaft“, wenn Realismus angestrebt wird.

Konsistenz: Wenn Logos oder Wasserzeichen eindringen, fügen Sie „keine Wasserzeichen, keine Logos“ hinzu.

Seed- und Variationsstrategie

Erkunden Sie mit einem zufälligen Seed, bis das Framing ‚klickt‘.

Sperren Sie den Seed und iterieren Sie die Gewichte in kleinen Schritten: ±0,1. Führen Sie ein Versionsprotokoll.

Wenn kleinere Details immer wieder kaputt gehen (Hände, kleine Requisiten), behalten Sie den Seed bei, aber passen Sie Guidance/CFG um ±0,5 an und passen Sie die Negative an.

Auflösung, Seitenverhältnis und Hochskalierung

Generieren Sie in oder nahe Ihrem Zielseitenverhältnis, um Kompositionsverschiebungen während der Hochskalierung zu vermeiden.

Wenn Sie ultrahohe Details benötigen, erzeugen Sie eine starke Basis mit 768–1024 px auf der kurzen Seite und skalieren Sie sie dann mit einem detailerhaltenden Durchgang hoch. Vermeiden Sie es, das Seitenverhältnis während der Hochskalierung zu ändern.

Playbook zur Fehlerbehebung

Gesicht oder Identität driften ab

Erhöhen Sie das Identitätsgewicht um +0,1 bis +0,2.

Fügen Sie explizite Identitätsdeskriptoren im Text hinzu (Frisur, Gesichtsmerkmale, Accessoires).

Verwenden Sie einen engeren Identitätsausschnitt.

Stil überlagert Realismus

Verringern Sie das Stilgewicht; fügen Sie Negative wie „überstylisierte, malerische Schmiererei“ hinzu.

Ersetzen Sie das Stilbild durch einen reinen Text-Stil-Prompt.

Kompositorische Unordnung

Erhöhen Sie das Layoutgewicht, erhöhen Sie die Tiefenhinweise im Text („klare Trennung der Ebenen“).

Vereinfachen Sie den Prompt; entfernen Sie widersprüchliche Adjektive.

Beleuchtungs-Mismatch

Harmonisieren Sie auf eine Tageszeit und eine Lichtrichtung; erwähnen Sie es explizit.

Wenn ein Stilbild eine andere Beleuchtung aufzwingt, reduzieren Sie sein Gewicht.

Wiederholte Artefakte (Hände, Logos)

Stärken Sie die Negative; erhöhen Sie die Guidance leicht.

Regenerieren Sie mit demselben Seed nach kleinen Änderungen, um die Komposition beizubehalten, aber die Details aufzufrischen.

Anwendungsfälle in der realen Welt

Produkthero in Lifestyle-Umgebung

Layout: Lifestyle-Foto; Identität: Produkt-Packshot; Stil: Brand-Toneboard.

Prompt für konsistente Schatten und Reflexionen; negativ für „schwebende Objekte“, „gefälschte Reflexionen“.

Porträt im Stil eines Meisters

Layout: Studio-Pose-Referenz; Identität: Person; Stil: Malerei- oder Farbkorrekturreferenz.

Kontrollieren Sie Sättigung und Textur im Text; halten Sie das Stilgewicht für die Ähnlichkeit moderat.

Storyboard-Panel-Mashup

Layout: Umgebung; Identität: Charakter-Turnaround; Stil: Kinematografie-Frame.

Geben Sie die Kamerabewegung an, die durch das Layout impliziert wird („niedrige Dollyfahrt, leichte Neigung nach oben“).

Beispiel-Prompts (kopierbereit)

Zwei-Bild-Fusion: Identität + Layout

Bilder:
- img_layout: city_street_at_dusk.jpg Gewicht: 0.7 Rolle: Layout
- img_identity: subject_headshot.png Gewicht: 1.0 Rolle: Identität
Prompt:
Ein Porträt des Identitätssubjekts in einer Mittelaufnahme, das an einem Fußgängerüberweg steht, gleiche Perspektive wie img_layout.
Goldene Stunde Seitenlicht, geringe Schärfentiefe, natürliche Hauttextur, weiches Bokeh.
Negative:
plastische Haut, verzerrte Finger, zusätzliche Gliedmaßen, Logo-Artefakte, überschärfte Kanten.
Steuerelemente:
Seed: 88123, Guidance: 6.5, Größe: 896x1152

Drei-Bild-Fusion: Layout + Identität + Stil

Bilder:
- img_layout: forest_path_wide.png Gewicht: 0.8 Rolle: Layout
- img_identity: runner_profile.jpg Gewicht: 0.9 Rolle: Identität
- img_style: teal_orange_grade.png Gewicht: 0.5 Rolle: Stil
Prompt:
Ganzkörperaufnahme des Läufers auf dem gleichen Waldweg, dynamischer Schritt, knackige Bewegung, teal-orangefarbene Kinematografie.
Objektiv 35mm, niedriger Winkel, Morgendunst, gerichtetes Sonnenlicht von rechts.
Negative:
Bewegungsunschärfestreifen, schlammiges Laub, Posterisierung, nicht übereinstimmende Schatten.
Steuerelemente:
Seed: 44701, Guidance: 6.0, Größe: 1024x768

Stil-dominanter Editorial-Composite

Bilder:
- img_layout: studio_three_point_lighting.jpg Gewicht: 0.6 Rolle: Layout
- img_identity: model_closeup.png Gewicht: 0.7 Rolle: Identität
- img_style: magazine_cover_moodboard.jpg Gewicht: 0.9 Rolle: Stil
Prompt:
Editorial Cover Porträt, glänzende Highlights, minimaler Hintergrund, typografiesicherer Negativraum links.
Objektiv 85mm, f/2, neutraler Ausdruck, sauberes Make-up.
Negative:
harte Hautglättung, überstylisierte Pinselstriche, Banding, Farbsäume.
Steuerelemente:
Seed: 99021, Guidance: 7.0, Größe: 1024x1365

Für tiefere Szenario-Setups und Prompt-Anatomie-Beispiele rund um dieses Modell sind Community-Berichte hilfreich. Unabhängige Zusammenfassungen heben auch die Multi-Image-Fusion unter den Stärken von Nano Banana hervor.

Profi-Tipps für komplexe Szenen

Halten Sie die Rollen explizit: Je mehr Bilder Sie verwenden, desto mehr müssen Sie deklarieren, wer was tut.

Priorisieren Sie den Realismus mit Kamera-Hinweisen: Objektiv, Blende, Höhe, Lichtrichtung.

Verwenden Sie Stil als Würze: Beginnen Sie niedrig, drehen Sie nur bei Bedarf auf.

Iterieren Sie wie ein Designer: kleine, protokollierte Deltas mit einem festen Seed.

Wissen Sie, wann Sie wechseln müssen: Wenn ein Bild ständig gegen das Ziel kämpft (widersprüchliche Perspektive), ersetzen Sie es, anstatt es zu stark zu tunen.

Ein Hinweis zu Sider.AI

Wenn Sie Prompt-Entwürfe und iterative Vergleiche durchführen, ist ein Side-by-Side-Arbeitsbereich, der Seeds, Gewichte und Negative versioniert, wertvoll. Erwähnenswert: Sie können ein Prompt-Management-Tool verwenden, um Multi-Image-Rollen zu templatieren, Bild-IDs zu speichern und Gewichte schnell A/B-zutesten – praktisch, wenn Sie Dutzende kleiner Iterationen durchführen, um die Fusionsqualität zu optimieren.

Wichtigste Erkenntnisse

Weisen Sie jedem Referenzbild klare Rollen zu: Layout, Identität, Stil.

Beginnen Sie konservativ mit dem Stilgewicht; schützen Sie die Identität mit einem höheren Gewicht.

Harmonisieren Sie Objektiv und Beleuchtung über Text- und Bildhinweise hinweg.

Sperren Sie den Seed vor der Mikro-Abstimmung; ändern Sie jeweils eine Sache.

Verwenden Sie gezielte Negative für Struktur-, Textur- und Artefaktkontrolle.

Referenzen und weiterführende Literatur: Nano Banana Prompting-Übersichten und Community-Anleitungen; Kommentare zu seiner Multi-Image-Fusionsfähigkeit; Modellverzeichnis-Eintrag.

FAQ

F1:Wie gewichte ich mehrere Bilder in Nano Banana für eine bessere Fusion? Weisen Sie Rollen zu (Layout, Identität, Stil) und beginnen Sie mit Gewichten wie 0,7/1,0/0,5. Erhöhen Sie das Identitätsgewicht, wenn die Ähnlichkeit abdriftet; verringern Sie das Stilgewicht, wenn der Look den Realismus überlagert. Kleine ±0,1-Änderungen funktionieren am besten.

F2:Welche negativen Prompts helfen bei der Multi-Image-Fusion in Nano Banana? Verwenden Sie Struktur- und Texturschutzvorrichtungen: „verzerrte Anatomie, nicht übereinstimmende Perspektive, plastische Haut, Posterisierung, überschärfte Kanten, Logo-Artefakte.“ Fügen Sie Stilkontroll-Negative wie „überstylisierte Pinselstriche“ hinzu, wenn Realismus erforderlich ist.

F3:Sollte ich den Seed fixieren, wenn ich komplexe Kompositionen mische? Ja. Erkunden Sie frei, bis Ihnen das Framing gefällt, und sperren Sie dann den Seed, um vorhersagbar an Gewichten, Stilintensität, Guidance und Negativen zu iterieren, ohne die Komposition zu verlieren.

F4:Welche Auflösung und welches Seitenverhältnis sollte ich für die Multi-Image-Fusion verwenden? Generieren Sie nahe Ihrem Zielseitenverhältnis (z. B. 1024×768 oder 896×1152), um Kompositionsverschiebungen zu vermeiden. Skalieren Sie anschließend mit einem detailerhaltenden Durchgang hoch und halten Sie das Seitenverhältnis konstant.

F5:Kann ich ein Stilbild und eine Textbeschreibung zusammen mischen? Absolut. Beginnen Sie mit einem niedrigen Stilbildgewicht (0,3–0,5) und verstärken Sie den Look per Text (Beleuchtung, Farbkorrektur). Wenn das Stilbild gegen die Szene kämpft, reduzieren Sie sein Gewicht oder wechseln Sie zu reinem Text-Styling.