Hogyan készítsünk promptot több kép fúziójához a Nano Banana-ban komplex kompozíciókhoz
Stílus: Gyakorlatias és megoldásorientált
Ha valaha is próbáltál már több referencia képet egyetlen, koherens jelenetté egyesíteni, akkor tudod, milyen nehéz a helyzet: megőrizni a téma részleteit, a stílust következetesen tartani, és mégis egy olyan kompozíciót létrehozni, ami ténylegesen működik. A Nano Banana több kép fúziója meglepő megbízhatósággal képes erre – ha szándékosan kéred. Ez az útmutató végigvezet egy terepen tesztelt munkafolyamaton a komplex kompozíciókhoz, beleértve a bemeneti formázást, a kép súlyozási stratégiákat, a kompozíció tervezést, a negatív promptokat, a seed vezérlést és a hibaelhárítást.
Érdemes előre megjegyezni: a nyilvános leírások szerint a Nano Banana egy csúcstechnológiás képmodell, erős szerkesztési, következetességi és több kép fúziós képességekkel, és szerepel a gyártásra kész modellek között a modellkönyvtárakban. A közösségi útmutatók a prompt mintákat és a forgatókönyv-alapú tippeket is felvázolják a modellhez, valamint a gyakorlati használati útmutatókat, amelyeket itt szintetizálunk.
Mi az a több kép fúzió a Nano Banana-ban?
- Definíció: Két vagy több bemeneti kép (témák, stílusok, elrendezések) kombinálása egyetlen kimenetbe, miközben feloldja a világításban, perspektívában, színpalettákban és térbeli elrendezésben lévő konfliktusokat.
- Miért fontos: Lehetővé teszi komplex kompozitok (pl. egy portré akvarell tájkép stílusában; egy termék egy filmes jelenetbe helyezve) készítését manuális maszkolás nélkül.
- Fő eszközök: Képsúlyok, szöveges prompt prioritások, negatív promptok, seed vezérlés és képarány/méret korlátozások.
Magas szintű munkafolyamat komplex kompozíciókhoz
- Tervezd meg a kompozíciót a promptolás előtt
- Döntsd el, melyik kép adja az elrendezést (kompozíciót), melyik a téma identitását, és melyik a stílust. Ha három képed van, rendelj mindegyikhez egy szerepet.
- Vázolj fel egy miniatűrt (gondolatban vagy egy gyors firkával). Jegyezd fel a fókuszpontokat és a mélységet.
- Kezdj egy alapképpel az elrendezéshez
- Használj egy referencia képet, amelynek perspektívája és keretezése már megfelel a kívánt jelenetnek.
- Tartsd a súlyát először mérsékelten (pl. 0,6–0,8). Később finomhangolod.
- Add hozzá a téma identitás kép(ek)et
- Adj a téma referenciának valamivel nagyobb súlyt (pl. 0,8–1,0), hogy az identitás túlélje a kompozíciós nyomást.
- Használj szoros kivágást az identitás képhez, ha a forrás zsúfolt; ez javítja az identitás felidézését.
- Használj egy stílus képet (paletta/ecsetkezelés/világítás). Kezdd alacsonyabb súllyal (0,3–0,6), hogy elkerüld az identitás elnyomását.
- Ha a stílus összeomlasztja a realizmust, kísérletezz egy szöveges stílusleírással a stílus kép helyett (vagy mellett).
- Írj egy promptot, amely feloldja a konfliktusokat
- Add meg a jelenetet, az objektívet, a világítást és az anyagtulajdonságokat, hogy összehangold a különböző referenciákat.
- Add meg a térbeli szerepeket: „A téma előtérben”, „Háttér a B képből”, „Stílus a C képből”.
- Adj hozzá negatív promptokat a kompozíció védelméhez
- Nevezd meg a hibákat („torz kezek”, „extra végtagok”, „dupla szemek”, „logó vérzés”, „eltérő világítás”, „glitchek”).
- Ha a stílus túl erős, adj hozzá egy negatívumot, például „túlstilizált, festői elkenődés” vagy „vastag ecset textúra” (ha nem kívánatos).
- Zárold a seed-et egy jó vázlat után
- Ha a globális kompozíció működik, fagyaszd le a seed-et, hogy pontosan iterálhass a súlyokon, a stílus erősségén és a részleteken.
- Változtass egyszerre egy paramétert (pl. stílus súly +0,1) és hasonlítsd össze.
Mellesleg, néhány nyilvános útmutató forgatókönyv-alapú prompt recepteket és A/B teszteket kínál, amelyek tükrözik ezt a rendezési megközelítést, míg a végponttól végpontig útmutatók lebontják a hivatkozási és a negatív promptolási taktikákat.
Prompt architektúra: egy megbízható minta
Használj egy rétegzett, olvasható struktúrát, amelyet gyorsan finomíthatsz:
- Rendszer/Instrukciós szándék (ha támogatott): „Szigorúan kövesse a referencia képeket az identitáshoz, használjon szöveget a stílus finomságához.”
- Képblokk szerepekkel: elrendezés, identitás, stílus.
- Szövegblokk kompozícióval, kamerával, világítással és anyagokkal.
- Vezérlők: seed, guidance/CFG, méret/arány.
Példa struktúra (pszeudo-prompt):
Képek:
- img_layout: {URL or upload id} súly: 0.7 szerep: elrendezés
- img_identity: {URL or upload id} súly: 0.9 szerep: téma identitás
- img_style: {URL or upload id} súly: 0.4 szerep: stílus/paletta
Prompt:
Egy közeli portré az img_identity témájáról, az img_layout utcai jelenetében állva.
Tartsa meg a színpalettát és a világítás hangulatát az img_style-ból: meleg alkonyat, lágy peremfény, sekély mélységélesség.
Kamera: 50mm, f/1.8, vállmagasságú szög. Lágy bokeh, realisztikus bőrtónus.
Garderób: minimalista sötét kabát, logók nélkül. Kifejezés: nyugodt, magabiztos.
Negatívok:
túlstilizált ecsetkezelés, festői elkenődés, műanyag bőr, extra ujjak, torz kezek, duplikált arcvonások,
eltérő perspektíva, poszterizált árnyékok, kromatikus zaj, logó hibák.
Vezérlők:
seed: 142375
guidance: 5.5–7.5 (kezdés 6.5)
méret: 768x1024 (portré) vagy 1024x768 (fekvő)
Ha az interfészed támogatja a képsúly csúszkákat vagy tokeneket, tartsd a súlyokat 0,3–1,2 sávban; csak akkor menj magasabbra, ha az identitás összeomlik. Még a Nano Banana-n kívül is a szakemberek azt tapasztalták, hogy az alacsonyabb súly szabadságot ad, míg a magasabb súly hűséget kényszerít ki.
Képsúlyok: három gyakorlati recept
- Miért: Megőrzi az arc hűségét, miközben utal egy megjelenésre.
- Stílusvezérelt szerkesztőség
- Miért: Erős művészeti irányt tol végig a kereten.
- Kiegyensúlyozott világépítés
- Miért: A kompozíciós koherencia a legfontosabb; az identitás jelen van, de nem abszolút.
Kompozíció vezérlés: perspektíva, mélység és világítás
- Perspektíva: Igazítsd össze az objektív megfelelőket a szövegben és a képeken (pl. „24mm-es széles felvétel” a terjedelmes jelenetekhez; „85mm” a portrékhoz). Ha az elrendezés kép 24 mm-es, de 85 mm-es megjelenést kérsz, a modellnek fel kell oldania az ütköző geometriát. Tartsd őket következetesen.
- Mélység: Említsd meg az előtér/középtér/háttér szerepeket („téma előtérben, égbolt középtérben, hegyek háttérben”). Ez csökkenti az objektum átfedési hibákat.
- Világítás: Jelents be egyetlen domináns fényforrást és napszakot. Használj „kulcsfény balról, meleg; kitöltés lágy, hideg; peremfény finom”. Ez segít egyesíteni az eltérő forrásképeket.
Negatív promptok, amelyek ténylegesen segítenek
- Strukturális: „eltérő perspektíva”, „dőlt horizont”, „torz anatómia”, „lapos mélység”.
- Felület/textúra: „műanyag fényesség”, „sáros részletek”, „poszterizáció”, „sávosodás”, „túlélesített élek”.
- Stílus vezérlés: „túlstilizált”, „vastag ecset textúra”, „rajzfilmszerű”, ha realizmusra törekszel.
- Konzisztencia: Ha logók vagy vízjelek zavarnak, adj hozzá „nincs vízjel, nincs logó”.
Seed és variációs stratégia
- Fedezd fel egy véletlenszerű seed-del, amíg a keretezés „kattint”.
- Zárold a seed-et és iteráld a súlyokat kis lépésekben: ±0,1. Vezess verzió naplót.
- Ha apró részletek folyamatosan elromlanak (kezek, kis kellékek), tartsd meg a seed-et, de told meg a guidance/CFG-t ±0,5-tel, és állítsd be a negatívokat.
Felbontás, képarány és felskálázás
- Generálj a cél képarányodnál vagy annak közelében, hogy elkerüld a kompozíciós eltolódásokat a felskálázás során.
- Ha ultra-nagy részletességre van szükséged, készíts egy erős alapot 768–1024 px-en a rövid oldalon, majd skálázd fel egy részletmegőrző lépéssel. Kerüld a képarány megváltoztatását a felskálázás során.
Hibaelhárítási kézikönyv
- Arc vagy identitás eltolódása
- Növeld az identitás súlyát +0,1-gyel +0,2-re.
- Adj hozzá explicit identitás leírókat a szövegben (hajviselet, arcjegyek, kiegészítők).
- Használj szorosabb identitás kivágást.
- A stílus felülírja a realizmust
- Csökkentsd a stílus súlyát; adj hozzá negatívokat, mint például „túlstilizált, festői elkenődés”.
- Cseréld le a stílus képet egy csak szöveges stílus promptra.
- Növeld az elrendezés súlyát, növeld a mélység jelzőket a szövegben („a síkok tiszta elválasztása”).
- Egyszerűsítsd a promptot; távolítsd el az ütköző mellékneveket.
- Hangold össze egyetlen napszakra és egyetlen fényirányra; említsd meg expliciten.
- Ha egy stílus kép eltérő világítást alkalmaz, csökkentsd a súlyát.
- Ismétlődő hibák (kezek, logók)
- Erősítsd meg a negatívokat; enyhén növeld a guidance-t.
- Generáld újra ugyanazzal a seed-del a kis változtatások után, hogy megőrizd a kompozíciót, de frissítsd a részleteket.
Valós felhasználási esetek
- Termék hős életmód környezetben
- Elrendezés: életmód fotó; Identitás: termékcsomag; Stílus: márka hangulat tábla.
- Prompt a következetes árnyékokhoz és tükröződésekhez; negatív a „lebegő tárgyak”, „hamis tükröződések” ellen.
- Portré egy mester stílusában
- Elrendezés: stúdió póz referencia; Identitás: személy; Stílus: festmény vagy színosztályozási referencia.
- Szabályozd a telítettséget és a textúrát a szövegben; tartsd a stílus súlyát mérsékelten a hasonlóság érdekében.
- Elrendezés: környezeti lemez; Identitás: karakterforduló; Stílus: operatőri keret.
- Add meg az elrendezés által sugallt kamera mozgást („alacsony dolly, enyhe felfelé billentés”).
Példa promptok (másolásra készek)
- Két kép fúziója: identitás + elrendezés
Képek:
- img_layout: city_street_at_dusk.jpg súly: 0.7 szerep: elrendezés
- img_identity: subject_headshot.png súly: 1.0 szerep: identitás
Prompt:
Egy közeli portré az identitás témájáról, egy zebránál állva, ugyanabban a perspektívában, mint az img_layout.
Arany órás oldalfény, sekély mélység, természetes bőrtónus, lágy bokeh.
Negatívok:
műanyag bőr, torz ujjak, extra végtagok, logó hibák, túlélesített élek.
Vezérlők:
seed: 88123, guidance: 6.5, méret: 896x1152
- Három kép fúziója: elrendezés + identitás + stílus
Képek:
- img_layout: forest_path_wide.png súly: 0.8 szerep: elrendezés
- img_identity: runner_profile.jpg súly: 0.9 szerep: identitás
- img_style: teal_orange_grade.png súly: 0.5 szerep: stílus
Prompt:
Teljes alakos felvétel a futóról ugyanazon az erdei ösvényen, dinamikus lépés, éles mozgás, kékes-narancssárga filmes színosztályozás.
Objektív 35mm, alacsony szög, reggeli pára, irányított napfény jobbról.
Negatívok:
mozgás elmosódás csíkok, sáros lombozat, poszterizáció, eltérő árnyékok.
Vezérlők:
seed: 44701, guidance: 6.0, méret: 1024x768
- Stílus-domináns szerkesztői kompozit
Képek:
- img_layout: studio_three_point_lighting.jpg súly: 0.6 szerep: elrendezés
- img_identity: model_closeup.png súly: 0.7 szerep: identitás
- img_style: magazine_cover_moodboard.jpg súly: 0.9 szerep: stílus
Prompt:
Szerkesztői címlap portré, fényes kiemelések, minimális háttér, tipográfia-biztos negatív tér balra.
Objektív 85mm, f/2, semleges kifejezés, tiszta smink.
Negatívok:
durva bőrsimítás, túlstilizált ecsetkezelés, sávosodás, színszegélyezés.
Vezérlők:
seed: 99021, guidance: 7.0, méret: 1024x1365
A modell körüli mélyebb forgatókönyv beállításokhoz és prompt anatómiájához a közösségi írások nyújtanak segítséget. Független összefoglalók szintén kiemelik a több kép fúziót a Nano Banana erősségei között.
Profi tippek komplex jelenetekhez
- Tartsd expliciten a szerepeket: Minél több képet használsz, annál inkább ki kell jelentenod, hogy ki mit csinál.
- Priorizáld a realizmust a kamera jelekkel: objektív, rekesz, magasság, világítási irány.
- Használd a stílust fűszerként: kezd alacsonyan, csak szükség esetén tekerd fel.
- Iterálj úgy, mint egy tervező: kicsi, naplózott eltérések rögzített seed-del.
- Tudd, mikor kell váltani: ha egy kép folyamatosan harcol a cél ellen (ütköző perspektíva), cseréld ki, ahelyett, hogy túlságosan finomítanád.
Megjegyzés a Sider.AI-ról
Ha prompt tervezést és iteratív összehasonlításokat végzel, értékes egy egymás melletti munkaterület, amely verzióköveti a seed-eket, a súlyokat és a negatívokat. Érdemes megjegyezni: használhatsz prompt kezelő eszközt a több kép szerepek sablonozásához, a képazonosítók tárolásához és a súlyok gyors A/B teszteléséhez – hasznos, ha több tucat kis iterációt futtatsz a fúzió minőségének beállításához.
Főbb tudnivalók
- Rendelj egyértelmű szerepeket minden referencia képhez: elrendezés, identitás, stílus.
- Kezdj óvatosan a stílus súlyával; védd az identitást nagyobb súllyal.
- Hangold össze az objektívet és a világítást a szöveges és a kép jelek között.
- Zárold a seed-et a mikro-finomítás előtt; egyszerre csak egy dolgot változtass.
- Használj célzott negatívokat a szerkezet, a textúra és a hibák vezérléséhez.
Referenciák és további olvasmányok: Nano Banana promptolási áttekintések és közösségi útmutatók; kommentár a több kép fúziós képességéről; modellkönyvtár listázás.
GYIK
Q1:Hogyan súlyozzak több képet a Nano Banana-ban a jobb fúzió érdekében?
Rendelj szerepeket (elrendezés, identitás, stílus) és kezdj olyan súlyokkal, mint 0,7/1,0/0,5. Növeld az identitás súlyát, ha a hasonlóság eltűnik; csökkentsd a stílus súlyát, ha a megjelenés felülírja a realizmust. A kis ±0,1 változtatások működnek a legjobban.
Q2:Milyen negatív promptok segítenek a több kép fúziójában a Nano Banana-ban?
Használj strukturális és textúra védőket: „torz anatómia, eltérő perspektíva, műanyag bőr, poszterizáció, túlélesített élek, logó hibák”. Adj hozzá stílus-vezérlő negatívokat, mint például a „túlstilizált ecsetkezelés”, ha realizmusra van szükség.
Q3:Rögzítsem a seed-et a komplex kompozíciók keverésekor?
Igen. Fedezd fel szabadon, amíg tetszik a keretezés, majd zárold a seed-et, hogy kiszámíthatóan iterálhass a súlyokon, a stílus erősségén, a guidance-en és a negatívokon anélkül, hogy elveszítenéd a kompozíciót.
Q4:Milyen felbontást és képarányt használjak a több kép fúziójához?
Generálj a cél képarányod közelében (pl. 1024×768 vagy 896×1152) a kompozíciós eltolódások elkerülése érdekében. Skálázd fel utána egy részletmegőrző lépéssel, a képarányt állandóan tartva.
Q5:Keverhetek egy stílus képet és egy szöveges leírást együtt?
Természetesen. Kezdd egy alacsony stílus kép súllyal (0,3–0,5) és erősítsd meg a megjelenést szöveggel (világítás, színosztályozás). Ha a stílus kép harcol a jelenettel, csökkentsd a súlyát, vagy válts csak szöveges stílusra.