Comment créer des prompts pour la fusion multi-images dans Nano Banana pour des compositions complexes
Style: Pratique et axé sur les solutions
Si vous avez déjà essayé de fusionner plusieurs images de référence en une seule scène cohérente, vous connaissez le défi : préserver les détails du sujet, maintenir la cohérence du style et obtenir une composition qui fonctionne réellement. La fusion multi-images de Nano Banana peut le faire avec une fiabilité surprenante, à condition de créer des prompts avec intention. Ce guide vous présente un flux de travail éprouvé pour les compositions complexes, comprenant le formatage des entrées, les stratégies de pondération des images, la planification de la composition, les prompts négatifs, le contrôle des seeds et le dépannage.
Il est important de noter d'emblée : les articles publics décrivent Nano Banana comme un modèle d'image de pointe avec de fortes capacités d'édition, de cohérence et de fusion multi-images, et il est répertorié parmi les modèles prêts pour la production dans les répertoires de modèles. Les guides de la communauté décrivent également des schémas de prompts et des conseils basés sur des scénarios pour le modèle, ainsi que des exemples pratiques d'utilisation, que nous synthétisons ici.
Qu'est-ce que la fusion multi-images dans Nano Banana ?
- Définition : Combinaison de deux images d'entrée ou plus (sujets, styles, mises en page) en une seule sortie tout en résolvant les conflits d'éclairage, de perspective, de palettes de couleurs et d'arrangement spatial.
- Pourquoi c'est important : Cela vous permet de créer des compositions complexes (par exemple, un portrait dans le style d'un paysage à l'aquarelle ; un produit placé dans une scène cinématique) sans masquage manuel.
- Leviers principaux : Pondération des images, priorités des prompts textuels, prompts négatifs, contrôle des seeds et contraintes d'aspect/taille.
Flux de travail de haut niveau pour les compositions complexes
- Planifiez la composition avant de créer les prompts
- Décidez quelle image fournit la mise en page (composition), laquelle fournit l'identité du sujet et laquelle fournit le style. Si vous avez trois images, attribuez un rôle à chacune.
- Esquissez une miniature (mentalement ou un gribouillage rapide). Notez les points focaux et la profondeur.
- Commencez par une image de base pour la mise en page
- Utilisez une image de référence dont la perspective et le cadrage correspondent déjà à la scène souhaitée.
- Gardez son poids modéré au début (par exemple, 0,6 à 0,8). Vous l'ajusterez plus tard.
- Ajoutez l'image(s) d'identité du sujet
- Donnez à la référence du sujet un poids légèrement supérieur (par exemple, 0,8 à 1,0) afin que l'identité survive à la pression de la composition.
- Utilisez un recadrage serré pour l'image d'identité si la source est chargée ; cela améliore la restitution de l'identité.
- Utilisez une image de style (palette/pinceau/éclairage). Commencez avec un poids plus faible (0,3 à 0,6) pour éviter de submerger l'identité.
- Si le style fait s'effondrer le réalisme, essayez une description textuelle du style au lieu d'une image de style (ou en plus).
- Rédigez un prompt qui résout les conflits
- Spécifiez la scène, l'objectif, l'éclairage et les propriétés des matériaux pour aligner les références disparates.
- Incluez les rôles spatiaux : « Sujet A au premier plan », « Arrière-plan de l'image B », « Style de l'image C ».
- Ajoutez des prompts négatifs pour protéger la composition
- Signalez les artefacts (« mains déformées », « membres supplémentaires », « yeux doubles », « bavures de logo », « éclairage incompatible », « bugs »).
- Si le style est trop fort, ajoutez un négatif comme « sur-stylisé, frottis pictural » ou « texture de brosse épaisse » (si non souhaité).
- Verrouillez la seed après un bon brouillon
- Une fois que la composition globale fonctionne, figez la seed pour itérer précisément sur les poids, la force du style et les détails.
- Itérez avec de petits changements
- Modifiez un paramètre à la fois (par exemple, poids du style +0,1) et comparez.
À propos, certains guides publics proposent des recettes de prompts basées sur des scénarios et des A/B qui reflètent cette approche de mise en scène, tandis que des guides pratiques de bout en bout décomposent les tactiques de référencement et de prompts négatifs.
Architecture du prompt : un modèle fiable
Utilisez une structure stratifiée et lisible que vous pouvez modifier rapidement :
- Intention système/instructionnelle (si prise en charge) : « Suivez strictement les images de référence pour l'identité, utilisez le texte pour la nuance de style. »
- Bloc d'images avec les rôles : mise en page, identité, style.
- Bloc de texte avec la composition, la caméra, l'éclairage et les matériaux.
- Contrôles : seed, guidance/CFG, taille/aspect.
Exemple de structure (pseudo-prompt) :
Images :
- img_layout: {URL or upload id} weight: 0.7 role: layout
- img_identity: {URL or upload id} weight: 0.9 role: subject identity
- img_style: {URL or upload id} weight: 0.4 role: style/palette
Prompt :
Un portrait en plan moyen du sujet de img_identity, debout dans la scène de rue de img_layout.
Conservez la palette de couleurs et l'ambiance lumineuse de img_style : crépuscule chaud, lumière de bord douce, faible profondeur de champ.
Caméra : 50 mm, f/1.8, angle au niveau de l'épaule. Bokeh doux, texture de peau réaliste.
Garde-robe : veste foncée minimaliste, sans logos. Expression : calme, confiante.
Négatifs :
pinceau sur-stylisé, frottis pictural, peau en plastique, doigts supplémentaires, mains déformées, traits du visage en double,
perspective incompatible, ombres postérisées, bruit chromatique, artefacts de logo.
Contrôles :
seed: 142375
guidance: 5.5–7.5 (début 6.5)
taille: 768x1024 (portrait) ou 1024x768 (paysage)
Si votre interface prend en charge les curseurs ou les tokens de poids d'image, maintenez les poids dans une bande de 0,3 à 1,2 ; augmentez-les uniquement lorsque l'identité s'effondre. Même en dehors de Nano Banana, les praticiens ont constaté qu'un poids plus faible accorde la liberté tandis qu'un poids plus élevé renforce la fidélité.
Poids des images : trois recettes pratiques
- Portrait axé sur l'identité
- Pourquoi : Conserve la fidélité du visage tout en suggérant un look.
- Éditorial axé sur le style
- Pourquoi : Pousse une direction artistique forte à travers le cadre.
- Construction du monde équilibrée
- Pourquoi : La cohérence de la composition est la plus importante ; l'identité est présente mais pas absolue.
Contrôle de la composition : perspective, profondeur et éclairage
- Perspective : Alignez les équivalents d'objectif entre le texte et les images (par exemple, « plan large de 24 mm » pour les scènes expansives ; « 85 mm » pour les portraits). Si l'image de mise en page est de 24 mm mais que vous demandez un look de 85 mm, le modèle doit réconcilier une géométrie conflictuelle. Gardez-les cohérents.
- Profondeur : Mentionnez les rôles de premier plan/plan moyen/arrière-plan (« sujet au premier plan, horizon au plan moyen, montagnes en arrière-plan »). Cela réduit les erreurs de chevauchement d'objets.
- Éclairage : Déclarez une seule source de lumière dominante et une heure de la journée. Utilisez « lumière principale à gauche, chaude ; remplissage doux, frais ; lumière de bord subtile. » Cela aide à fusionner des images source incompatibles.
Prompts négatifs qui aident réellement
- Structurel : « perspective incompatible », « horizon incliné », « anatomie déformée », « profondeur plate ».
- Surface/texture : « éclat plastique », « détails boueux », « postérisation », « banding », « bords sur-affûtés ».
- Contrôle du style : « sur-stylisé », « texture de brosse épaisse », « caricatural », lorsque vous visez le réalisme.
- Cohérence : Si des logos ou des filigranes s'introduisent, ajoutez « pas de filigranes, pas de logos ».
Stratégie de seed et de variation
- Explorez avec une seed aléatoire jusqu'à ce que le cadrage « clique ».
- Verrouillez la seed et itérez les poids par petits pas : ±0,1. Gardez un journal des versions.
- Si des détails mineurs continuent de se briser (mains, petits accessoires), conservez la seed mais poussez la guidance/CFG de ±0,5 et ajustez les négatifs.
Résolution, rapport d'aspect et upscaling
- Générez à ou près de votre rapport d'aspect cible pour éviter les changements de composition pendant l'upscaling.
- Si vous avez besoin de détails ultra-élevés, produisez une base solide à 768–1024 px sur le côté court, puis faites un upscaling avec une passe de préservation des détails. Évitez de changer l'aspect pendant l'upscaling.
Playbook de dépannage
- Dérive du visage ou de l'identité
- Augmentez le poids de l'identité de +0,1 à +0,2.
- Ajoutez des descripteurs d'identité explicites dans le texte (style de cheveux, marques faciales, accessoires).
- Utilisez un recadrage d'identité plus serré.
- Style submergeant le réalisme
- Diminuez le poids du style ; ajoutez des négatifs comme « sur-stylisé, frottis pictural ».
- Remplacez l'image de style par un prompt de style uniquement textuel.
- Encombrement de la composition
- Augmentez le poids de la mise en page, augmentez les indices de profondeur dans le texte (« séparation claire des plans »).
- Simplifiez le prompt ; supprimez les adjectifs conflictuels.
- Incompatibilité de l'éclairage
- Harmonisez vers une seule heure de la journée et une seule direction de la lumière ; mentionnez-le explicitement.
- Si une image de style impose un éclairage différent, réduisez son poids.
- Artefacts répétés (mains, logos)
- Renforcez les négatifs ; augmentez légèrement la guidance.
- Régénérez avec la même seed après de petites modifications pour maintenir la composition mais actualiser les détails.
Cas d'utilisation réels
- Héros produit dans un cadre de style de vie
- Mise en page : photo de style de vie ; Identité : packshot du produit ; Style : tableau d'ambiance de la marque.
- Prompt pour des ombres et des reflets cohérents ; négatif pour « objets flottants », « faux reflets ».
- Portrait dans le style d'un maître
- Mise en page : référence de pose en studio ; Identité : personne ; Style : référence de peinture ou d'étalonnage des couleurs.
- Contrôlez la saturation et la texture dans le texte ; maintenez un poids de style modéré pour la ressemblance.
- Mashup de panneau de storyboard
- Mise en page : plaque d'environnement ; Identité : rotation du personnage ; Style : cadre de cinématographie.
- Spécifiez le mouvement de la caméra impliqué par la mise en page (« travelling avant bas, légère inclinaison vers le haut »).
Exemples de prompts (prêts à copier)
- Fusion de deux images : identité + mise en page
Images :
- img_layout: city_street_at_dusk.jpg weight: 0.7 role: layout
- img_identity: subject_headshot.png weight: 1.0 role: identity
Prompt:
Un portrait en plan moyen du sujet d'identité debout à un passage piéton, même perspective que img_layout.
Lumière latérale de l'heure dorée, faible profondeur, texture de peau naturelle, bokeh doux.
Négatifs:
peau en plastique, doigts déformés, membres supplémentaires, artefacts de logo, bords sur-affûtés.
Contrôles:
seed: 88123, guidance: 6.5, taille: 896x1152
- Fusion de trois images : mise en page + identité + style
Images:
- img_layout: forest_path_wide.png weight: 0.8 role: layout
- img_identity: runner_profile.jpg weight: 0.9 role: identity
- img_style: teal_orange_grade.png weight: 0.5 role: style
Prompt:
Plan complet du coureur sur le même chemin forestier, foulée dynamique, mouvement net, étalonnage cinématique bleu sarcelle-orange.
Objectif 35 mm, angle bas, brume matinale, lumière du soleil directionnelle de droite.
Négatifs:
traînées de flou de mouvement, feuillage boueux, postérisation, ombres incompatibles.
Contrôles:
seed: 44701, guidance: 6.0, taille: 1024x768
- Composite éditorial à dominante stylistique
Images:
- img_layout: studio_three_point_lighting.jpg weight: 0.6 role: layout
- img_identity: model_closeup.png weight: 0.7 role: identity
- img_style: magazine_cover_moodboard.jpg weight: 0.9 role: style
Prompt:
Portrait de couverture éditoriale, reflets brillants, fond minimal, espace négatif à gauche pour la typographie.
Objectif 85 mm, f/2, expression neutre, maquillage propre.
Négatifs:
lissage de la peau dur, pinceau sur-stylisé, banding, franges de couleur.
Contrôles:
seed: 99021, guidance: 7.0, taille: 1024x1365
Pour des configurations de scénarios plus approfondies et des exemples d'anatomie de prompts autour de ce modèle, les articles de la communauté sont utiles. Des récapitulatifs indépendants mettent également en évidence la fusion multi-images parmi les forces de Nano Banana.
Conseils de pro pour les scènes complexes
- Gardez les rôles explicites : Plus vous utilisez d'images, plus vous devez déclarer qui fait quoi.
- Priorisez le réalisme avec des indices de caméra : objectif, ouverture, hauteur, direction de l'éclairage.
- Utilisez le style comme assaisonnement : commencez bas, augmentez uniquement au besoin.
- Itérez comme un concepteur : petits changements consignés avec une seed fixe.
- Sachez quand changer : si une image continue de lutter contre l'objectif (perspective conflictuelle), remplacez-la plutôt que de trop l'ajuster.
Si vous effectuez des brouillons de prompts et des comparaisons itératives, un espace de travail côte à côte qui conserve les seeds, les poids et les négatifs versionnés est précieux. Il est à noter : vous pouvez utiliser un outil de gestion des prompts pour créer des modèles de rôles multi-images, stocker des ID d'images et A/B rapidement les poids, ce qui est pratique lors de l'exécution de dizaines de petites itérations pour composer la qualité de la fusion.
Principaux points à retenir
- Attribuez des rôles clairs à chaque image de référence : mise en page, identité, style.
- Commencez prudemment avec le poids du style ; protégez l'identité avec un poids plus élevé.
- Harmonisez l'objectif et l'éclairage entre le texte et les indices d'image.
- Verrouillez la seed avant le micro-ajustement ; changez une chose à la fois.
- Utilisez des négatifs ciblés pour le contrôle de la structure, de la texture et des artefacts.
Références et lectures complémentaires : Aperçus des prompts de Nano Banana et guides pratiques de la communauté ; commentaires sur sa capacité de fusion multi-images ; liste des répertoires de modèles.
FAQ
Q1:Comment pondérer plusieurs images dans Nano Banana pour une meilleure fusion ?
Attribuez des rôles (mise en page, identité, style) et commencez avec des poids comme 0,7/1,0/0,5. Augmentez le poids de l'identité si la ressemblance dérive ; diminuez le poids du style si le look submerge le réalisme. De petits changements de ±0,1 fonctionnent mieux.
Q2:Quels prompts négatifs aident à la fusion multi-images dans Nano Banana ?
Utilisez des gardes structurels et de texture : « anatomie déformée, perspective incompatible, peau en plastique, postérisation, bords sur-affûtés, artefacts de logo. » Ajoutez des négatifs de contrôle de style comme « pinceau sur-stylisé » lorsque le réalisme est requis.
Q3:Dois-je fixer la seed lors de la fusion de compositions complexes ?
Oui. Explorez librement jusqu'à ce que vous aimiez le cadrage, puis verrouillez la seed pour itérer de manière prévisible sur les poids, la force du style, la guidance et les négatifs sans perdre la composition.
Q4:Quelle résolution et quel rapport d'aspect dois-je utiliser pour la fusion multi-images ?
Générez près de votre rapport d'aspect cible (par exemple, 1024×768 ou 896×1152) pour éviter les changements de composition. Faites un upscaling ensuite avec une passe de préservation des détails, en gardant l'aspect constant.
Q5:Puis-je mélanger une image de style et une description textuelle ensemble ?
Absolument. Commencez avec un faible poids d'image de style (0,3–0,5) et renforcez le look via le texte (éclairage, étalonnage des couleurs). Si l'image de style lutte contre la scène, réduisez son poids ou passez à un style uniquement textuel.