Sider.ai
  • Xat
  • Wisebase
  • Eines
  • Extensió
  • Clients
  • Preus
Descarrega ara
iniciar Sessió

Aprèn més ràpid, pensa més profundament i creix més intel·ligent amb Sider.

Productes
Aplicacions
  • Extensions
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
Eines
  • Creador de llocs webNew
  • AI SlidesNew
  • Escriptor d'assajos AI
  • Nano Banana Pro
  • Nano Banana Infographic
  • Generador d'imatges AI
  • Generador de Brainrot Italià
  • Eliminador de fons
  • Canviador de fons
  • Esborrador de fotos
  • Eliminador de text
  • Repintar
  • Millorador d'imatges
  • Crear
  • Traductor AI
  • Traductor d'imatges
  • Traductor de PDF
Sider
  • Contacta'ns
  • Centre d'ajuda
  • Descarregar
  • Preus
  • Pla d'Educació
  • Què hi ha de nou
  • Blog
  • Comunitat
  • Socis
  • Afiliat
  • Convida
©2026 Tots els drets reservats
Condicions d'ús
Política de privacitat
  • Pàgina d'inici
  • Bloc
  • Eines d'IA
  • Com generar instruccions per a la fusió de múltiples imatges a Nano Banana per a composicions complexes

Com generar instruccions per a la fusió de múltiples imatges a Nano Banana per a composicions complexes

Actualitzat el 19 Set. 2025

9 min


Com indicar la fusió de múltiples imatges a Nano Banana per a composicions complexes

Estil: Pràctic i orientat a la solució
Si alguna vegada has intentat fusionar diverses imatges de referència en una sola escena coherent, coneixes la corda fluixa: preservar els detalls del subjecte, mantenir l'estil coherent i, tot i així, aconseguir una composició que realment funcioni. La fusió de múltiples imatges de Nano Banana pot fer-ho amb una fiabilitat sorprenent, si ho indiques amb intenció. Aquesta guia et guia a través d'un flux de treball provat sobre el terreny per a composicions complexes, incloent-hi el format d'entrada, les estratègies de ponderació d'imatges, la planificació de la composició, l'indicació negativa, el control de la llavor i la resolució de problemes.
Val la pena assenyalar d'entrada: els escrits públics descriuen Nano Banana com un model d'imatge d'última generació amb fortes capacitats d'edició, consistència i fusió de múltiples imatges, i apareix entre els models preparats per a la producció en els directoris de models. Les guies de la comunitat també descriuen patrons d'indicacions i consells basats en escenaris per al model i guies pràctiques d'ús, que sintetitzem aquí.

Què és la fusió de múltiples imatges a Nano Banana?

  • Definició: Combinar dues o més imatges d'entrada (subjectes, estils, dissenys) en una sola sortida tot resolent conflictes d'il·luminació, perspectiva, paletes de colors i disposició espacial.
  • Per què és important: Permet construir composicions complexes (per exemple, un retrat a l'estil d'un paisatge d'aquarel·la; un producte col·locat en una escena cinematogràfica) sense emmascarament manual.
  • Elements bàsics: Ponderacions d'imatge, prioritats d'indicació de text, indicacions negatives, control de la llavor i restriccions d'aspecte/mida.

Flux de treball d'alt nivell per a composicions complexes

  1. Planifica la composició abans d'indicar
  • Decideix quina imatge proporciona el disseny (composició), quina proporciona la identitat del subjecte i quina proporciona l'estil. Si tens tres imatges, assigna una funció a cadascuna.
  • Esbossa una miniatura (mentalment o un garbuix ràpid). Anota els punts focals i la profunditat.
  1. Comença amb una imatge base per al disseny
  • Utilitza una imatge de referència la perspectiva i l'enquadrament de la qual ja coincideixin amb l'escena desitjada.
  • Mantén el seu pes moderat al principi (per exemple, 0,6–0,8). L'ajustaràs més tard.
  1. Afegeix la imatge(s) d'identitat del subjecte
  • Dóna a la referència del subjecte un pes lleugerament superior (per exemple, 0,8–1,0) perquè la identitat sobrevisqui a la pressió de la composició.
  • Utilitza un retall ajustat per a la imatge d'identitat si la font està ocupada; millora el record de la identitat.
  1. Capa l'estil
  • Utilitza una imatge d'estil (paleta/pinzellades/il·luminació). Comença amb un pes inferior (0,3–0,6) per evitar que superi la identitat.
  • Si l'estil col·lapsa el realisme, experimenta amb una descripció d'estil textual en lloc de (o a més de) una imatge d'estil.
  1. Escriu una indicació que resolgui els conflictes
  • Especifica l'escena, la lent, la il·luminació i les propietats del material per alinear les referències dispars.
  • Inclou els rols espacials: “Subjecte A en primer pla”, “Fons de la imatge B”, “Estil de la imatge C”.
  1. Afegeix indicacions negatives per protegir la composició
  • Esmenta els artefactes (“mans deformades”, “extremitats addicionals”, “ulls dobles”, “sangrat de logotip”, “il·luminació no coincident”, “errors”).
  • Si l'estil és massa fort, afegeix un negatiu com “massa estilitzat, taca pictòrica” o “textura de pinzell gruixuda” (si no es desitja).
  1. Bloqueja la llavor després d'un bon esborrany
  • Una vegada que la composició global funciona, congela la llavor per iterar precisament sobre els pesos, la força de l'estil i els detalls.
  1. Itera amb petits deltes
  • Canvia un paràmetre a la vegada (per exemple, pes d'estil +0,1) i compara.
Per cert, algunes guies públiques ofereixen receptes d'indicacions basades en escenaris i A/Bs que reflecteixen aquest enfocament d'escenificació, mentre que els manuals d'instruccions complets descomponen les tàctiques de referència i d'indicació negativa.

Arquitectura d'indicació: un patró fiable

Utilitza una estructura en capes i llegible que puguis ajustar ràpidament:
  • Intenció del sistema/instruccional (si és compatible): “Segueix estrictament les imatges de referència per a la identitat, utilitza el text per a matisos d'estil”.
  • Bloc d'imatges amb rols: disseny, identitat, estil.
  • Bloc de text amb composició, càmera, il·luminació i materials.
  • Indicació negativa.
  • Controls: llavor, guia/CFG, mida/aspecte.
Estructura d'exemple (pseudo-indicació):
Imatges:
- img_layout: <URL o id de càrrega> pes: 0,7 rol: disseny
- img_identity: <URL o id de càrrega> pes: 0,9 rol: identitat del subjecte
- img_style: <URL o id de càrrega> pes: 0,4 rol: estil/paleta
Indicació:
Un retrat de mig cos del subjecte de img_identity, dret a l'escena del carrer de img_layout.
Mantén la paleta de colors i l'estat d'ànim de la il·luminació de img_style: crepuscle càlid, llum suau a la vora, poca profunditat de camp.
Càmera: 50 mm, f/1,8, angle a l'altura de l'espatlla. Bokeh suau, textura de pell realista.
Guarda-roba: jaqueta fosca minimalista, sense logotips. Expressió: tranquil, segur.
Negatius:
pinzellades massa estilitzades, taca pictòrica, pell de plàstic, dits addicionals, mans deformades, trets facials duplicats,
perspectiva no coincident, ombres posteritzades, soroll cromàtic, artefactes de logotip.
Controls:
llavor: 142375
guia: 5,5–7,5 (comença 6,5)
mida: 768x1024 (retrat) o 1024x768 (paisatge)
Si la teva interfície admet lliscadors o fitxes de pes d'imatge, mantén els pesos en una banda de 0,3–1,2; puja més només quan la identitat col·lapsa. Fins i tot fora de Nano Banana, els professionals han descobert que un pes inferior atorga llibertat mentre que un pes superior imposa fidelitat.

Pesos d'imatge: tres receptes pràctiques

  • Retrat de prioritat d'identitat
  • disseny: 0,5–0,7
  • identitat: 0,9–1,1
  • estil: 0,3–0,5
  • Per què: Manté la fidelitat de la cara alhora que insinua un aspecte.
  • Editorial dirigida per l'estil
  • disseny: 0,6–0,8
  • identitat: 0,6–0,8
  • estil: 0,7–1,0
  • Per què: Impulsa una forta direcció d'art a tot el marc.
  • Construcció de món equilibrada
  • disseny: 0,8–1,0
  • identitat: 0,7–0,9
  • estil: 0,4–0,7
  • Per què: La coherència de la composició és el més important; la identitat està present però no és absoluta.

Control de la composició: perspectiva, profunditat i il·luminació

  • Perspectiva: Alinea els equivalents de lent entre el text i les imatges (per exemple, “plànol ample de 24 mm” per a escenes expansives; “85 mm” per a retrats). Si la imatge de disseny és de 24 mm però demanes un aspecte de 85 mm, el model ha de conciliar la geometria conflictiva. Mantén-los coherents.
  • Profunditat: Esmenta els rols de primer pla/segon pla/fons (“subjecte en primer pla, horitzó en segon pla, muntanyes al fons”). Això redueix els errors de superposició d'objectes.
  • Il·luminació: Declara una sola font de llum dominant i hora del dia. Utilitza “llum clau a l'esquerra, càlida; farcit suau, fresc; llum de vora subtil”. Això ajuda a fusionar imatges font no coincidents.

Indicacions negatives que realment ajuden

  • Estructural: “perspectiva no coincident”, “horitzó inclinat”, “anatomia deformada”, “profunditat plana”.
  • Superfície/textura: “brillantor de plàstic”, “detalls fangosos”, “posterització”, “bandes”, “vorells massa afilats”.
  • Control d'estil: “massa estilitzat”, “textura de pinzell gruixuda”, “de dibuixos animats”, quan es busca el realisme.
  • Coherència: Si els logotips o les marques d'aigua s'introdueixen, afegeix “sense marques d'aigua, sense logotips”.

Estratègia de llavor i variació

  • Explora amb una llavor aleatòria fins que l'enquadrament faci ‘clic’.
  • Bloqueja la llavor i itera els pesos en petits passos: ±0,1. Mantén un registre de versions.
  • Si els detalls menors continuen trencant-se (mans, petits objectes), mantén la llavor però impulsa la guia/CFG en ±0,5 i ajusta els negatius.

Resolució, relació d'aspecte i augment d'escala

  • Genera a prop o a la teva relació d'aspecte objectiu per evitar canvis de composició durant l'augment d'escala.
  • Si necessites un detall ultra-alt, produeix una base forta a 768–1024 px al costat curt, després augmenta l'escala amb una passada de conservació de detalls. Evita canviar l'aspecte durant l'augment d'escala.

Manual de resolució de problemes

  • Cara o identitat a la deriva
  • Augmenta el pes de la identitat en +0,1 a +0,2.
  • Afegeix descriptors d'identitat explícits al text (estil de cabell, marques facials, accessoris).
  • Utilitza un retall d'identitat més ajustat.
  • Estil que supera el realisme
  • Disminueix el pes de l'estil; afegeix negatius com “massa estilitzat, taca pictòrica”.
  • Substitueix la imatge d'estil per una indicació d'estil només de text.
  • Desordre compositiu
  • Augmenta el pes del disseny, augmenta les pistes de profunditat al text (“separació clara dels plans”).
  • Simplifica la indicació; elimina els adjectius conflictius.
  • No coincidència d'il·luminació
  • Harmonitza a una hora del dia i una direcció de llum; esmenta-ho explícitament.
  • Si una imatge d'estil imposa una il·luminació diferent, redueix-ne el pes.
  • Artefactes repetits (mans, logotips)
  • Enforteix els negatius; augmenta lleugerament la guia.
  • Regenera amb la mateixa llavor després de petits canvis per mantenir la composició però refrescar els detalls.

Casos d'ús del món real

  • Producte heroi en entorn d'estil de vida
  • Disseny: foto d'estil de vida; Identitat: packshot del producte; Estil: tauler de to de marca.
  • Indica ombres i reflexos coherents; negatiu per a “objectes flotants”, “reflexos falsos”.
  • Retrat a l'estil d'un mestre
  • Disseny: referència de posat d'estudi; Identitat: persona; Estil: pintura o referència de qualificació de color.
  • Controla la saturació i la textura al text; mantén el pes de l'estil moderat per a la semblança.
  • Mashup de panell de guió gràfic
  • Disseny: placa d'entorn; Identitat: canvi de personatge; Estil: fotograma de cinematografia.
  • Especifica el moviment de la càmera implícit en el disseny (“dolly baix, lleugera inclinació cap amunt”).

Exemples d'indicacions (llestes per copiar)

  1. Fusió de dues imatges: identitat + disseny
Imatges:
- img_layout: city_street_at_dusk.jpg pes: 0,7 rol: disseny
- img_identity: subject_headshot.png pes: 1,0 rol: identitat
Indicació:
Un retrat de mig cos del subjecte d'identitat dret a un pas de zebra, la mateixa perspectiva que img_layout.
Llum lateral d'hora daurada, poca profunditat, textura de pell natural, bokeh suau.
Negatius:
pell de plàstic, dits deformats, extremitats addicionals, artefactes de logotip, vores massa afilades.
Controls:
llavor: 88123, guia: 6,5, mida: 896x1152
  1. Fusió de tres imatges: disseny + identitat + estil
Imatges:
- img_layout: forest_path_wide.png pes: 0,8 rol: disseny
- img_identity: runner_profile.jpg pes: 0,9 rol: identitat
- img_style: teal_orange_grade.png pes: 0,5 rol: estil
Indicació:
Tir de cos sencer del corredor al mateix camí forestal, trepitjada dinàmica, moviment nítid, qualificació cinematogràfica de color verd blavós-taronja.
Lent 35 mm, angle baix, boira matinal, llum solar direccional des de la dreta.
Negatius:
ratlles de desenfocament de moviment, fullatge fangós, posterització, ombres no coincidents.
Controls:
llavor: 44701, guia: 6,0, mida: 1024x768
  1. Composició editorial dominant per l'estil
Imatges:
- img_layout: studio_three_point_lighting.jpg pes: 0,6 rol: disseny
- img_identity: model_closeup.png pes: 0,7 rol: identitat
- img_style: magazine_cover_moodboard.jpg pes: 0,9 rol: estil
Indicació:
Retrat de portada editorial, aspectes destacats brillants, fons mínim, espai negatiu segur per a la tipografia a l'esquerra.
Lent 85 mm, f/2, expressió neutra, maquillatge net.
Negatius:
allisament de la pell dur, pinzellades massa estilitzades, bandes, franges de color.
Controls:
llavor: 99021, guia: 7,0, mida: 1024x1365
Per a configuracions d'escenaris més profundes i exemples d'anatomia d'indicacions al voltant d'aquest model, els escrits de la comunitat són útils. Els resums independents també destaquen la fusió de múltiples imatges entre els punts forts de Nano Banana.

Consells professionals per a escenes complexes

  • Mantén els rols explícits: Com més imatges utilitzis, més has de declarar qui fa què.
  • Prioritza el realisme amb pistes de càmera: lent, obertura, alçada, direcció de la il·luminació.
  • Utilitza l'estil com a condiment: comença baix, puja només quan sigui necessari.
  • Itera com un dissenyador: deltes petits i registrats amb una llavor fixa.
  • Sap quan canviar: si una imatge continua lluitant contra l'objectiu (perspectiva conflictiva), substitueix-la en lloc de sobreajustar-la.

Una nota sobre Sider.AI

Si estàs fent esborranys d'indicacions i comparacions iteratives, un espai de treball de costat a costat que mantingui les llavors, els pesos i els negatius versionats és valuós. Val la pena assenyalar: pots utilitzar una eina de gestió d'indicacions per crear plantilles de rols de múltiples imatges, emmagatzemar identificadors d'imatge i pesos A/B ràpidament, útil quan s'executen desenes de petites iteracions per marcar la qualitat de la fusió.

Conclusions clau

  • Assigna rols clars a cada imatge de referència: disseny, identitat, estil.
  • Comença de manera conservadora amb el pes de l'estil; protegeix la identitat amb un pes superior.
  • Harmonitza la lent i la il·luminació a través de pistes de text i imatge.
  • Bloqueja la llavor abans de l'ajustament fi; canvia una cosa a la vegada.
  • Utilitza negatius dirigits per al control de l'estructura, la textura i els artefactes.
Referències i lectures addicionals: Vistes generals d'indicacions de Nano Banana i manuals d'instruccions de la comunitat; comentaris sobre la seva capacitat de fusió de múltiples imatges; llista de directoris de models.

Preguntes freqüents

P1:Com pondero diverses imatges a Nano Banana per a una millor fusió? Assigna rols (disseny, identitat, estil) i comença amb pesos com 0,7/1,0/0,5. Augmenta el pes de la identitat si la semblança deriva; disminueix el pes de l'estil si l'aspecte supera el realisme. Els petits canvis de ±0,1 funcionen millor.
P2:Quines indicacions negatives ajuden amb la fusió de múltiples imatges a Nano Banana? Utilitza proteccions estructurals i de textura: “anatomia deformada, perspectiva no coincident, pell de plàstic, posterització, vores massa afilades, artefactes de logotip”. Afegeix negatius de control d'estil com “pinzellades massa estilitzades” quan es requereix realisme.
P3:Hauria de fixar la llavor quan combino composicions complexes? Sí. Explora lliurement fins que t'agradi l'enquadrament, després bloqueja la llavor per iterar de manera predictible sobre els pesos, la força de l'estil, la guia i els negatius sense perdre la composició.
P4:Quina resolució i relació d'aspecte hauria d'utilitzar per a la fusió de múltiples imatges? Genera a prop de la teva relació d'aspecte objectiu (per exemple, 1024 × 768 o 896 × 1152) per evitar canvis de composició. Augmenta l'escala posteriorment amb una passada de conservació de detalls, mantenint l'aspecte constant.
P5:Puc barrejar una imatge d'estil i una descripció de text juntes? Absolutament. Comença amb un pes d'imatge d'estil baix (0,3–0,5) i reforça l'aspecte mitjançant text (il·luminació, qualificació de color). Si la imatge d'estil lluita contra l'escena, redueix-ne el pes o canvia a un estil només de text.

Articles Recents
Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

Com dominar ChatPDF: obtenir informació més ràpidament de documents densos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La millor alternativa a X Auto-Translation per a documents ràpids i precisos

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

La traducció AI de Samsung no està disponible a l'Iran? Solucions pràctiques

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

Eines de traducció persa: una guia pràctica per a un treball més ràpid i precís

La millor alternativa a Grok per a una recerca profunda i citada

La millor alternativa a Grok per a una recerca profunda i citada

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs

Les 15 millors funcions del generador d'imatges d'IA que realment utilitzaràs