Sider.ai
  • Chat
  • Wisebase
  • Werkzeuge
  • Verlängerung
  • Kunden
  • Preisgestaltung
Jetzt downloaden
Anmeldung

Lerne schneller, denke tiefer und wachse klüger mit Sider.

Produkte
Apps
  • Erweiterungen
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Werkzeuge
  • Web-EntwicklerNew
  • KI-FolienNew
  • KI-Aufsatzschreiber
  • Nano Banana Pro
  • Nano Banana Infographic
  • KI-Bildgenerator
  • Italienischer Gehirnrotor-Generator
  • Hintergrundentferner
  • Hintergrundwechsler
  • Foto-Radierer
  • Textentferner
  • Inpaint
  • Bildverbesserer
  • Erstellen
  • KI-Übersetzer
  • Bildübersetzer
  • PDF-Übersetzer
Sider
  • Kontaktieren Sie uns
  • Hilfezentrum
  • Herunterladen
  • Preise
  • Bildungsplan
  • Was gibt's Neues
  • Blog
  • Gemeinschaft
  • Partner
  • Partnerprogramm
  • Einladen
©2026 Alle Rechte vorbehalten
Nutzungsbedingungen
Datenschutzrichtlinie
  • Startseite
  • Blog
  • KI-Tools
  • Anleitung zum Prompten für Multi-Image Fusion in Nano Banana für komplexe Kompositionen

Anleitung zum Prompten für Multi-Image Fusion in Nano Banana für komplexe Kompositionen

Aktualisiert am 19. Sept. 2025

9 min


Wie man Prompts für Multi-Image-Fusion in Nano Banana für komplexe Kompositionen erstellt

Stil: Praktisch & lösungsorientiert
Wer jemals versucht hat, mehrere Referenzbilder zu einer einzigen, kohärenten Szene zu verschmelzen, kennt den Drahtseilakt: Subjektdetails bewahren, den Stil konsistent halten und trotzdem eine Komposition erzielen, die tatsächlich funktioniert. Die Multi-Image-Fusion von Nano Banana kann dies mit überraschender Zuverlässigkeit leisten – wenn man mit Absicht prompted. Dieser Leitfaden führt Sie durch einen praxiserprobten Workflow für komplexe Kompositionen, einschließlich Eingabeformatierung, Bildgewichtungsstrategien, Kompositionsplanung, Negative Prompts, Seed-Kontrolle und Fehlerbehebung.
Vorab sei angemerkt: Öffentliche Berichte beschreiben Nano Banana als ein hochmodernes Bildmodell mit starken Bearbeitungs-, Konsistenz- und Multi-Image-Fusionsfähigkeiten, und es wird in Modellverzeichnissen als produktionsreifes Modell aufgeführt. Community-Leitfäden skizzieren auch Prompt-Muster und szenariobasierte Tipps für das Modell sowie praktische Anwendungsbeispiele, die wir hier zusammenfassen.

Was ist Multi-Image-Fusion in Nano Banana?

  • Definition: Die Kombination von zwei oder mehr Eingangsbildern (Subjekte, Stile, Layouts) zu einem einzigen Ausgabebild unter Lösung von Konflikten in Bezug auf Beleuchtung, Perspektive, Farbpaletten und räumliche Anordnung.
  • Warum es wichtig ist: Es ermöglicht Ihnen, komplexe Komposits zu erstellen (z. B. ein Porträt im Stil einer Aquarelllandschaft; ein Produkt, das in eine Filmszene platziert wird) ohne manuelles Maskieren.
  • Kernhebel: Bildgewichtungen, Text-Prompt-Prioritäten, Negative Prompts, Seed-Kontrolle und Aspekt-/Größenbeschränkungen.

High-Level-Workflow für komplexe Kompositionen

  1. Planen Sie die Komposition vor dem Prompten
  • Entscheiden Sie, welches Bild das Layout (Komposition), welches die Subjektidentität und welches den Stil liefert. Wenn Sie drei Bilder haben, weisen Sie jedem eine Rolle zu.
  • Skizzieren Sie eine Miniaturansicht (mental oder als schnelle Kritzelei). Notieren Sie Schwerpunkte und Tiefe.
  1. Beginnen Sie mit einem Basisbild für das Layout
  • Verwenden Sie ein Referenzbild, dessen Perspektive und Rahmen bereits Ihrer gewünschten Szene entsprechen.
  • Halten Sie sein Gewicht anfangs moderat (z. B. 0,6–0,8). Sie werden später feinabstimmen.
  1. Fügen Sie das/die Subjektidentitätsbild(er) hinzu
  • Geben Sie der Subjektreferenz ein etwas höheres Gewicht (z. B. 0,8–1,0), damit die Identität dem Kompositionsdruck standhält.
  • Verwenden Sie einen engen Ausschnitt für das Identitätsbild, wenn die Quelle unübersichtlich ist; dies verbessert die Identitätswiedergabe.
  1. Layern Sie den Stil
  • Verwenden Sie ein Stilbild (Palette/Pinselstrich/Beleuchtung). Beginnen Sie mit einem geringeren Gewicht (0,3–0,6), um zu vermeiden, dass die Identität überlagert wird.
  • Wenn der Stil den Realismus untergräbt, experimentieren Sie mit einer textuellen Stilbeschreibung anstelle von (oder zusätzlich zu) einem Stilbild.
  1. Schreiben Sie einen Prompt, der Konflikte löst
  • Geben Sie die Szene, die Linse, die Beleuchtung und die Materialeigenschaften an, um die unterschiedlichen Referenzen aufeinander abzustimmen.
  • Fügen Sie die räumlichen Rollen hinzu: „Subjekt A im Vordergrund“, „Hintergrund von Bild B“, „Stil von Bild C“.
  1. Fügen Sie Negative Prompts hinzu, um die Komposition zu schützen
  • Nennen Sie Artefakte („verzerrte Hände“, „zusätzliche Gliedmaßen“, „doppelte Augen“, „Logo-Ausblutung“, „nicht übereinstimmende Beleuchtung“, „Glitches“).
  • Wenn der Stil zu stark ist, fügen Sie ein Negativ wie „überstylisierte, malerische Schmiererei“ oder „dicke Pinseltextur“ hinzu (wenn unerwünscht).
  1. Sperren Sie den Seed nach einem guten Entwurf
  • Sobald die globale Komposition funktioniert, frieren Sie den Seed ein, um präzise an Gewichten, Stilintensität und Details zu iterieren.
  1. Iterieren Sie mit kleinen Deltas
  • Ändern Sie jeweils einen Parameter (z. B. Stilgewicht +0,1) und vergleichen Sie.
Übrigens, einige öffentliche Leitfäden bieten szenariobasierte Prompting-Rezepte und A/Bs an, die diesen Staging-Ansatz widerspiegeln, während End-to-End-Anleitungen Referenzierungs- und Negative-Prompting-Taktiken aufschlüsseln.

Prompt-Architektur: ein zuverlässiges Muster

Verwenden Sie eine geschichtete, lesbare Struktur, die Sie schnell anpassen können:
  • System/Instruktionale Absicht (falls unterstützt): „Befolgen Sie Referenzbilder strikt für die Identität, verwenden Sie Text für Stilnuancen.“
  • Bilderblock mit Rollen: Layout, Identität, Stil.
  • Textblock mit Komposition, Kamera, Beleuchtung und Materialien.
  • Negativer Prompt.
  • Steuerelemente: Seed, Guidance/CFG, Größe/Aspekt.
Beispielstruktur (Pseudo-Prompt):
Bilder:
- img_layout: {URL or upload id} Gewicht: 0.7 Rolle: Layout
- img_identity: {URL or upload id} Gewicht: 0.9 Rolle: Subjektidentität
- img_style: {URL or upload id} Gewicht: 0.4 Rolle: Stil/Palette
Prompt:
Eine Mittelaufnahme des Subjekts von img_identity, das in der Straßenszene von img_layout steht.
Behalten Sie die Farbpalette und die Lichtstimmung von img_style bei: warmer Dämmerung, weiches Streiflicht, geringe Schärfentiefe.
Kamera: 50mm, f/1.8, Schulterhöhe. Weiches Bokeh, realistische Hauttextur.
Garderobe: minimalistische dunkle Jacke, keine Logos. Ausdruck: ruhig, selbstbewusst.
Negative:
überstylisierte Pinselstriche, malerische Schmiererei, plastische Haut, zusätzliche Finger, verzerrte Hände, doppelte Gesichtszüge,
nicht übereinstimmende Perspektive, posterisierte Schatten, chromatisches Rauschen, Logo-Artefakte.
Steuerelemente:
Seed: 142375
Guidance: 5.5–7.5 (Start 6.5)
Größe: 768x1024 (Porträt) oder 1024x768 (Landschaft)
Wenn Ihre Benutzeroberfläche Bildgewichtungsregler oder -token unterstützt, halten Sie die Gewichte in einem Band von 0,3–1,2; gehen Sie nur höher, wenn die Identität zusammenbricht. Auch außerhalb von Nano Banana haben Praktiker festgestellt, dass ein geringeres Gewicht Freiheit gewährt, während ein höheres Gewicht die Wiedergabetreue erzwingt.

Bildgewichtungen: drei praktische Rezepte

  • Identitätsorientiertes Porträt
  • Layout: 0,5–0,7
  • Identität: 0,9–1,1
  • Stil: 0,3–0,5
  • Warum: Behält die Gesichtstreue bei und deutet gleichzeitig einen Look an.
  • Stilorientiertes Editorial
  • Layout: 0,6–0,8
  • Identität: 0,6–0,8
  • Stil: 0,7–1,0
  • Warum: Setzt eine starke Art Direction im gesamten Bild durch.
  • Ausgewogener Weltenaufbau
  • Layout: 0,8–1,0
  • Identität: 0,7–0,9
  • Stil: 0,4–0,7
  • Warum: Die Kohärenz der Komposition ist am wichtigsten; die Identität ist vorhanden, aber nicht absolut.

Kompositionskontrolle: Perspektive, Tiefe und Beleuchtung

  • Perspektive: Richten Sie Linsenäquivalente zwischen Text und Bildern aus (z. B. „24mm Weitwinkelaufnahme“ für weitläufige Szenen; „85mm“ für Porträts). Wenn das Layoutbild 24mm ist, Sie aber nach einem 85mm-Look fragen, muss das Modell widersprüchliche Geometrien in Einklang bringen. Halten Sie sie konsistent.
  • Tiefe: Erwähnen Sie Vordergrund-/Mittelgrund-/Hintergrundrollen („Subjekt im Vordergrund, Skyline im Mittelgrund, Berge im Hintergrund“). Dies reduziert Objektüberlappungsfehler.
  • Beleuchtung: Deklarieren Sie eine einzige dominante Lichtquelle und Tageszeit. Verwenden Sie „Hauptlicht links, warm; Fülllicht weich, kühl; Streiflicht subtil.“ Dies hilft, nicht übereinstimmende Quellbilder zu verschmelzen.

Negative Prompts, die tatsächlich helfen

  • Strukturell: „nicht übereinstimmende Perspektive“, „geneigter Horizont“, „verzerrte Anatomie“, „flache Tiefe“.
  • Oberfläche/Textur: „plastischer Glanz“, „schlammige Details“, „Posterisierung“, „Banding“, „überschärfte Kanten“.
  • Stilkontrolle: „überstylisiert“, „dicke Pinseltextur“, „cartoonhaft“, wenn Realismus angestrebt wird.
  • Konsistenz: Wenn Logos oder Wasserzeichen eindringen, fügen Sie „keine Wasserzeichen, keine Logos“ hinzu.

Seed- und Variationsstrategie

  • Erkunden Sie mit einem zufälligen Seed, bis das Framing ‚klickt‘.
  • Sperren Sie den Seed und iterieren Sie die Gewichte in kleinen Schritten: ±0,1. Führen Sie ein Versionsprotokoll.
  • Wenn kleinere Details immer wieder kaputt gehen (Hände, kleine Requisiten), behalten Sie den Seed bei, aber passen Sie Guidance/CFG um ±0,5 an und passen Sie die Negative an.

Auflösung, Seitenverhältnis und Hochskalierung

  • Generieren Sie in oder nahe Ihrem Zielseitenverhältnis, um Kompositionsverschiebungen während der Hochskalierung zu vermeiden.
  • Wenn Sie ultrahohe Details benötigen, erzeugen Sie eine starke Basis mit 768–1024 px auf der kurzen Seite und skalieren Sie sie dann mit einem detailerhaltenden Durchgang hoch. Vermeiden Sie es, das Seitenverhältnis während der Hochskalierung zu ändern.

Playbook zur Fehlerbehebung

  • Gesicht oder Identität driften ab
  • Erhöhen Sie das Identitätsgewicht um +0,1 bis +0,2.
  • Fügen Sie explizite Identitätsdeskriptoren im Text hinzu (Frisur, Gesichtsmerkmale, Accessoires).
  • Verwenden Sie einen engeren Identitätsausschnitt.
  • Stil überlagert Realismus
  • Verringern Sie das Stilgewicht; fügen Sie Negative wie „überstylisierte, malerische Schmiererei“ hinzu.
  • Ersetzen Sie das Stilbild durch einen reinen Text-Stil-Prompt.
  • Kompositorische Unordnung
  • Erhöhen Sie das Layoutgewicht, erhöhen Sie die Tiefenhinweise im Text („klare Trennung der Ebenen“).
  • Vereinfachen Sie den Prompt; entfernen Sie widersprüchliche Adjektive.
  • Beleuchtungs-Mismatch
  • Harmonisieren Sie auf eine Tageszeit und eine Lichtrichtung; erwähnen Sie es explizit.
  • Wenn ein Stilbild eine andere Beleuchtung aufzwingt, reduzieren Sie sein Gewicht.
  • Wiederholte Artefakte (Hände, Logos)
  • Stärken Sie die Negative; erhöhen Sie die Guidance leicht.
  • Regenerieren Sie mit demselben Seed nach kleinen Änderungen, um die Komposition beizubehalten, aber die Details aufzufrischen.

Anwendungsfälle in der realen Welt

  • Produkthero in Lifestyle-Umgebung
  • Layout: Lifestyle-Foto; Identität: Produkt-Packshot; Stil: Brand-Toneboard.
  • Prompt für konsistente Schatten und Reflexionen; negativ für „schwebende Objekte“, „gefälschte Reflexionen“.
  • Porträt im Stil eines Meisters
  • Layout: Studio-Pose-Referenz; Identität: Person; Stil: Malerei- oder Farbkorrekturreferenz.
  • Kontrollieren Sie Sättigung und Textur im Text; halten Sie das Stilgewicht für die Ähnlichkeit moderat.
  • Storyboard-Panel-Mashup
  • Layout: Umgebung; Identität: Charakter-Turnaround; Stil: Kinematografie-Frame.
  • Geben Sie die Kamerabewegung an, die durch das Layout impliziert wird („niedrige Dollyfahrt, leichte Neigung nach oben“).

Beispiel-Prompts (kopierbereit)

  1. Zwei-Bild-Fusion: Identität + Layout
Bilder:
- img_layout: city_street_at_dusk.jpg Gewicht: 0.7 Rolle: Layout
- img_identity: subject_headshot.png Gewicht: 1.0 Rolle: Identität
Prompt:
Ein Porträt des Identitätssubjekts in einer Mittelaufnahme, das an einem Fußgängerüberweg steht, gleiche Perspektive wie img_layout.
Goldene Stunde Seitenlicht, geringe Schärfentiefe, natürliche Hauttextur, weiches Bokeh.
Negative:
plastische Haut, verzerrte Finger, zusätzliche Gliedmaßen, Logo-Artefakte, überschärfte Kanten.
Steuerelemente:
Seed: 88123, Guidance: 6.5, Größe: 896x1152
  1. Drei-Bild-Fusion: Layout + Identität + Stil
Bilder:
- img_layout: forest_path_wide.png Gewicht: 0.8 Rolle: Layout
- img_identity: runner_profile.jpg Gewicht: 0.9 Rolle: Identität
- img_style: teal_orange_grade.png Gewicht: 0.5 Rolle: Stil
Prompt:
Ganzkörperaufnahme des Läufers auf dem gleichen Waldweg, dynamischer Schritt, knackige Bewegung, teal-orangefarbene Kinematografie.
Objektiv 35mm, niedriger Winkel, Morgendunst, gerichtetes Sonnenlicht von rechts.
Negative:
Bewegungsunschärfestreifen, schlammiges Laub, Posterisierung, nicht übereinstimmende Schatten.
Steuerelemente:
Seed: 44701, Guidance: 6.0, Größe: 1024x768
  1. Stil-dominanter Editorial-Composite
Bilder:
- img_layout: studio_three_point_lighting.jpg Gewicht: 0.6 Rolle: Layout
- img_identity: model_closeup.png Gewicht: 0.7 Rolle: Identität
- img_style: magazine_cover_moodboard.jpg Gewicht: 0.9 Rolle: Stil
Prompt:
Editorial Cover Porträt, glänzende Highlights, minimaler Hintergrund, typografiesicherer Negativraum links.
Objektiv 85mm, f/2, neutraler Ausdruck, sauberes Make-up.
Negative:
harte Hautglättung, überstylisierte Pinselstriche, Banding, Farbsäume.
Steuerelemente:
Seed: 99021, Guidance: 7.0, Größe: 1024x1365
Für tiefere Szenario-Setups und Prompt-Anatomie-Beispiele rund um dieses Modell sind Community-Berichte hilfreich. Unabhängige Zusammenfassungen heben auch die Multi-Image-Fusion unter den Stärken von Nano Banana hervor.

Profi-Tipps für komplexe Szenen

  • Halten Sie die Rollen explizit: Je mehr Bilder Sie verwenden, desto mehr müssen Sie deklarieren, wer was tut.
  • Priorisieren Sie den Realismus mit Kamera-Hinweisen: Objektiv, Blende, Höhe, Lichtrichtung.
  • Verwenden Sie Stil als Würze: Beginnen Sie niedrig, drehen Sie nur bei Bedarf auf.
  • Iterieren Sie wie ein Designer: kleine, protokollierte Deltas mit einem festen Seed.
  • Wissen Sie, wann Sie wechseln müssen: Wenn ein Bild ständig gegen das Ziel kämpft (widersprüchliche Perspektive), ersetzen Sie es, anstatt es zu stark zu tunen.

Ein Hinweis zu Sider.AI

Wenn Sie Prompt-Entwürfe und iterative Vergleiche durchführen, ist ein Side-by-Side-Arbeitsbereich, der Seeds, Gewichte und Negative versioniert, wertvoll. Erwähnenswert: Sie können ein Prompt-Management-Tool verwenden, um Multi-Image-Rollen zu templatieren, Bild-IDs zu speichern und Gewichte schnell A/B-zutesten – praktisch, wenn Sie Dutzende kleiner Iterationen durchführen, um die Fusionsqualität zu optimieren.

Wichtigste Erkenntnisse

  • Weisen Sie jedem Referenzbild klare Rollen zu: Layout, Identität, Stil.
  • Beginnen Sie konservativ mit dem Stilgewicht; schützen Sie die Identität mit einem höheren Gewicht.
  • Harmonisieren Sie Objektiv und Beleuchtung über Text- und Bildhinweise hinweg.
  • Sperren Sie den Seed vor der Mikro-Abstimmung; ändern Sie jeweils eine Sache.
  • Verwenden Sie gezielte Negative für Struktur-, Textur- und Artefaktkontrolle.
Referenzen und weiterführende Literatur: Nano Banana Prompting-Übersichten und Community-Anleitungen; Kommentare zu seiner Multi-Image-Fusionsfähigkeit; Modellverzeichnis-Eintrag.

FAQ

F1:Wie gewichte ich mehrere Bilder in Nano Banana für eine bessere Fusion? Weisen Sie Rollen zu (Layout, Identität, Stil) und beginnen Sie mit Gewichten wie 0,7/1,0/0,5. Erhöhen Sie das Identitätsgewicht, wenn die Ähnlichkeit abdriftet; verringern Sie das Stilgewicht, wenn der Look den Realismus überlagert. Kleine ±0,1-Änderungen funktionieren am besten.
F2:Welche negativen Prompts helfen bei der Multi-Image-Fusion in Nano Banana? Verwenden Sie Struktur- und Texturschutzvorrichtungen: „verzerrte Anatomie, nicht übereinstimmende Perspektive, plastische Haut, Posterisierung, überschärfte Kanten, Logo-Artefakte.“ Fügen Sie Stilkontroll-Negative wie „überstylisierte Pinselstriche“ hinzu, wenn Realismus erforderlich ist.
F3:Sollte ich den Seed fixieren, wenn ich komplexe Kompositionen mische? Ja. Erkunden Sie frei, bis Ihnen das Framing gefällt, und sperren Sie dann den Seed, um vorhersagbar an Gewichten, Stilintensität, Guidance und Negativen zu iterieren, ohne die Komposition zu verlieren.
F4:Welche Auflösung und welches Seitenverhältnis sollte ich für die Multi-Image-Fusion verwenden? Generieren Sie nahe Ihrem Zielseitenverhältnis (z. B. 1024×768 oder 896×1152), um Kompositionsverschiebungen zu vermeiden. Skalieren Sie anschließend mit einem detailerhaltenden Durchgang hoch und halten Sie das Seitenverhältnis konstant.
F5:Kann ich ein Stilbild und eine Textbeschreibung zusammen mischen? Absolut. Beginnen Sie mit einem niedrigen Stilbildgewicht (0,3–0,5) und verstärken Sie den Look per Text (Beleuchtung, Farbkorrektur). Wenn das Stilbild gegen die Szene kämpft, reduzieren Sie sein Gewicht oder wechseln Sie zu reinem Text-Styling.

Aktuelle Artikel
Wie man ChatPDF meistert: Schnellere Einblicke in umfangreiche Dokumente

Wie man ChatPDF meistert: Schnellere Einblicke in umfangreiche Dokumente

Die beste Alternative zu X Auto-Translation für schnelle und präzise Dokumente

Die beste Alternative zu X Auto-Translation für schnelle und präzise Dokumente

Samsung KI-Übersetzung in Iran nicht verfügbar? Praktische Lösungen

Samsung KI-Übersetzung in Iran nicht verfügbar? Praktische Lösungen

Persische Übersetzungstools: Ein praktischer Leitfaden für schnellere und präzisere Arbeit

Persische Übersetzungstools: Ein praktischer Leitfaden für schnellere und präzisere Arbeit

Die beste Grok-Alternative für tiefgehende, zitierte Forschung

Die beste Grok-Alternative für tiefgehende, zitierte Forschung

Die 15 wichtigsten Funktionen von KI-Bildgeneratoren, die Sie wirklich nutzen werden

Die 15 wichtigsten Funktionen von KI-Bildgeneratoren, die Sie wirklich nutzen werden