Cara Membuat Prompt untuk Penggabungan Multi-Gambar di Nano Banana untuk Komposisi Kompleks
Gaya: Praktis & berorientasi solusi
Jika Anda pernah mencoba menggabungkan beberapa gambar referensi menjadi satu adegan yang koheren, Anda pasti tahu betapa sulitnya: mempertahankan detail subjek, menjaga gaya tetap konsisten, dan tetap mendapatkan komposisi yang benar-benar berhasil. Penggabungan multi-gambar Nano Banana dapat melakukan ini dengan keandalan yang mengejutkan—jika Anda membuat prompt dengan niat yang jelas. Panduan ini memandu Anda melalui alur kerja yang telah teruji di lapangan untuk komposisi kompleks, termasuk pemformatan input, strategi pembobotan gambar, perencanaan komposisi, negative prompting, kontrol seed, dan pemecahan masalah.
Penting untuk dicatat di awal: tulisan publik menggambarkan Nano Banana sebagai model gambar canggih dengan kemampuan pengeditan, konsistensi, dan penggabungan multi-gambar yang kuat, dan terdaftar di antara model siap produksi di direktori model. Panduan komunitas juga menguraikan pola prompt dan tips berbasis skenario untuk model dan panduan penggunaan praktis, yang kami sintesiskan di sini.
Apa itu penggabungan multi-gambar di Nano Banana?
- Definisi: Menggabungkan dua atau lebih gambar input (subjek, gaya, tata letak) menjadi satu output sambil menyelesaikan konflik dalam pencahayaan, perspektif, palet warna, dan pengaturan spasial.
- Mengapa ini penting: Ini memungkinkan Anda membuat komposit kompleks (misalnya, potret dalam gaya lanskap cat air; produk ditempatkan ke dalam adegan sinematik) tanpa masking manual.
- Tuas inti: Bobot gambar, prioritas prompt teks, negative prompt, kontrol seed, dan batasan aspek/ukuran.
Alur kerja tingkat tinggi untuk komposisi kompleks
- Rencanakan komposisi sebelum membuat prompt
- Tentukan gambar mana yang memasok tata letak (komposisi), mana yang memasok identitas subjek, dan mana yang memasok gaya. Jika Anda memiliki tiga gambar, tetapkan peran untuk masing-masing gambar.
- Buat sketsa thumbnail (dalam pikiran atau coretan cepat). Catat titik fokus dan kedalaman.
- Mulai dengan gambar dasar untuk tata letak
- Gunakan gambar referensi yang perspektif dan framing-nya sudah sesuai dengan adegan yang Anda inginkan.
- Pertahankan bobotnya sedang pada awalnya (misalnya, 0,6–0,8). Anda akan menyetelnya nanti.
- Tambahkan gambar identitas subjek
- Berikan referensi subjek bobot yang sedikit lebih tinggi (misalnya, 0,8–1,0) agar identitas tetap bertahan di bawah tekanan komposisi.
- Gunakan crop ketat untuk gambar identitas jika sumbernya sibuk; ini meningkatkan pengenalan identitas.
- Gunakan gambar gaya (palet/sapuan kuas/pencahayaan). Mulailah dengan bobot yang lebih rendah (0,3–0,6) untuk menghindari identitas yang terlalu kuat.
- Jika gaya meruntuhkan realisme, bereksperimenlah dengan deskripsi gaya tekstual alih-alih (atau selain) gambar gaya.
- Tulis prompt yang menyelesaikan konflik
- Tentukan adegan, lensa, pencahayaan, dan sifat material untuk menyelaraskan referensi yang berbeda.
- Sertakan peran spasial: “Subjek A di latar depan,” “Latar belakang dari Gambar B,” “Gaya dari Gambar C.”
- Tambahkan negative prompt untuk melindungi komposisi
- Sebutkan artefak (“tangan bengkok,” “anggota badan tambahan,” “mata ganda,” “kebocoran logo,” “pencahayaan tidak cocok,” “kerusakan”).
- Jika gaya terlalu kuat, tambahkan negatif seperti “terlalu bergaya, coretan seperti pelukis” atau “tekstur kuas tebal” (jika tidak diinginkan).
- Kunci seed setelah draf yang bagus
- Setelah komposisi global berfungsi, bekukan seed untuk melakukan iterasi secara tepat pada bobot, kekuatan gaya, dan detail.
- Ulangi dengan delta kecil
- Ubah satu parameter pada satu waktu (misalnya, bobot gaya +0,1) dan bandingkan.
Omong-omong, beberapa panduan publik menawarkan resep prompting berbasis skenario dan A/B yang mencerminkan pendekatan pementasan ini, sementara panduan langkah demi langkah menguraikan taktik referensi dan negative prompting.
Arsitektur prompt: pola yang andal
Gunakan struktur berlapis dan mudah dibaca yang dapat Anda ubah dengan cepat:
- Niat Sistem/Instruksional (jika didukung): “Ikuti gambar referensi secara ketat untuk identitas, gunakan teks untuk nuansa gaya.”
- Blok gambar dengan peran: tata letak, identitas, gaya.
- Blok teks dengan komposisi, kamera, pencahayaan, dan material.
- Kontrol: seed, guidance/CFG, ukuran/aspek.
Contoh struktur (pseudo-prompt):
Gambar:
- img_layout: {URL atau upload id} bobot: 0.7 peran: tata letak
- img_identity: {URL atau upload id} bobot: 0.9 peran: identitas subjek
- img_style: {URL atau upload id} bobot: 0.4 peran: gaya/palet
Prompt:
Potret medium-shot subjek dari img_identity, berdiri di adegan jalanan dari img_layout.
Pertahankan palet warna dan suasana pencahayaan dari img_style: senja hangat, cahaya tepi lembut, depth of field dangkal.
Kamera: 50mm, f/1.8, sudut setinggi bahu. Bokeh lembut, tekstur kulit realistis.
Pakaian: jaket gelap minimalis, tanpa logo. Ekspresi: tenang, percaya diri.
Negatif:
sapuan kuas yang terlalu bergaya, coretan seperti pelukis, kulit plastik, jari ekstra, tangan bengkok, fitur wajah duplikat,
perspektif tidak cocok, bayangan posterisasi, noise kromatik, artefak logo.
Kontrol:
seed: 142375
guidance: 5.5–7.5 (mulai 6.5)
ukuran: 768x1024 (potret) atau 1024x768 (lanskap)
Jika antarmuka Anda mendukung slider atau token bobot gambar, pertahankan bobot dalam rentang 0,3–1,2; naik lebih tinggi hanya jika identitas runtuh. Bahkan di luar Nano Banana, praktisi telah menemukan bahwa bobot yang lebih rendah memberikan kebebasan sementara bobot yang lebih tinggi memaksakan fidelitas.
Bobot gambar: tiga resep praktis
- Mengapa: Menjaga fidelitas wajah sambil mengisyaratkan tampilan.
- Editorial yang dipimpin gaya
- Mengapa: Mendorong arahan seni yang kuat di seluruh bingkai.
- Pembangunan dunia yang seimbang
- Mengapa: Koherensi komposisi paling penting; identitas hadir tetapi tidak mutlak.
Kontrol komposisi: perspektif, kedalaman, dan pencahayaan
- Perspektif: Sejajarkan lensa yang setara di seluruh teks dan gambar (misalnya, “bidikan lebar 24mm” untuk adegan luas; “85mm” untuk potret). Jika gambar tata letak 24mm tetapi Anda meminta tampilan 85mm, model harus mendamaikan geometri yang bertentangan. Pertahankan agar tetap konsisten.
- Kedalaman: Sebutkan peran latar depan/tengah/belakang (“subjek latar depan, kaki langit tengah, gunung latar belakang”). Ini mengurangi kesalahan tumpang tindih objek.
- Pencahayaan: Nyatakan satu sumber cahaya dominan dan waktu hari. Gunakan “cahaya utama kiri, hangat; isi lembut, sejuk; cahaya tepi halus.” Ini membantu menggabungkan gambar sumber yang tidak cocok.
Negative prompt yang benar-benar membantu
- Struktural: “perspektif tidak cocok,” “horizon miring,” “anatomi bengkok,” “kedalaman datar.”
- Permukaan/tekstur: “kilau plastik,” “detail berlumpur,” “posterisasi,” “banding,” “tepi yang terlalu tajam.”
- Kontrol gaya: “terlalu bergaya,” “tekstur kuas tebal,” “kekartunan,” saat membidik realisme.
- Konsistensi: Jika logo atau watermark mengganggu, tambahkan “tanpa watermark, tanpa logo.”
Seed dan strategi variasi
- Jelajahi dengan seed acak sampai framing ‘klik.’
- Kunci seed dan ulangi bobot dalam langkah kecil: ±0,1. Simpan log versi.
- Jika detail kecil terus rusak (tangan, alat peraga kecil), pertahankan seed tetapi dorong guidance/CFG dengan ±0,5 dan sesuaikan negatif.
Resolusi, rasio aspek, dan upscaling
- Hasilkan pada atau mendekati rasio aspek target Anda untuk menghindari pergeseran komposisi selama upscaling.
- Jika Anda membutuhkan detail ultra-tinggi, hasilkan basis yang kuat pada 768–1024 px di sisi pendek, lalu tingkatkan skala dengan pass yang mempertahankan detail. Hindari mengubah aspek selama upscale.
Buku pedoman pemecahan masalah
- Wajah atau identitas melayang
- Tingkatkan bobot identitas sebesar +0,1 hingga +0,2.
- Tambahkan deskriptor identitas eksplisit dalam teks (gaya rambut, tanda wajah, aksesori).
- Gunakan crop identitas yang lebih ketat.
- Gaya yang mengalahkan realisme
- Turunkan bobot gaya; tambahkan negatif seperti “terlalu bergaya, coretan seperti pelukis.”
- Ganti gambar gaya dengan prompt gaya berbasis teks saja.
- Naikkan bobot tata letak, tingkatkan isyarat kedalaman dalam teks (“pemisahan bidang yang jelas”).
- Sederhanakan prompt; hapus kata sifat yang bertentangan.
- Harmoniskan ke satu waktu hari dan satu arah cahaya; sebutkan secara eksplisit.
- Jika gambar gaya memaksakan pencahayaan yang berbeda, kurangi bobotnya.
- Artefak berulang (tangan, logo)
- Perkuat negatif; sedikit tingkatkan guidance.
- Hasilkan ulang dengan seed yang sama setelah perubahan kecil untuk mempertahankan komposisi tetapi segarkan detail.
Kasus penggunaan dunia nyata
- Pahlawan produk dalam pengaturan gaya hidup
- Tata letak: foto gaya hidup; Identitas: packshot produk; Gaya: papan nada merek.
- Prompt untuk bayangan dan pantulan yang konsisten; negatif untuk “objek mengambang,” “pantulan palsu.”
- Potret dalam gaya seorang master
- Tata letak: referensi pose studio; Identitas: orang; Gaya: lukisan atau referensi color grade.
- Kontrol saturasi dan tekstur dalam teks; pertahankan bobot gaya sedang untuk kemiripan.
- Tata letak: pelat lingkungan; Identitas: turnaround karakter; Gaya: bingkai sinematografi.
- Tentukan gerakan kamera yang tersirat oleh tata letak (“dolly rendah, sedikit miring ke atas”).
Contoh prompt (siap salin)
- Penggabungan dua gambar: identitas + tata letak
Gambar:
- img_layout: city_street_at_dusk.jpg bobot: 0.7 peran: tata letak
- img_identity: subject_headshot.png bobot: 1.0 peran: identitas
Prompt:
Potret medium-shot subjek identitas berdiri di penyeberangan jalan, perspektif yang sama dengan img_layout.
Cahaya samping jam keemasan, kedalaman dangkal, tekstur kulit alami, bokeh lembut.
Negatif:
kulit plastik, jari bengkok, anggota badan tambahan, artefak logo, tepi yang terlalu tajam.
Kontrol:
seed: 88123, guidance: 6.5, ukuran: 896x1152
- Penggabungan tiga gambar: tata letak + identitas + gaya
Gambar:
- img_layout: forest_path_wide.png bobot: 0.8 peran: tata letak
- img_identity: runner_profile.jpg bobot: 0.9 peran: identitas
- img_style: teal_orange_grade.png bobot: 0.5 peran: gaya
Prompt:
Bidikan seluruh tubuh pelari di jalur hutan yang sama, langkah dinamis, gerakan renyah, grade sinematik teal-oranye.
Lensa 35mm, sudut rendah, kabut pagi, sinar matahari langsung dari kanan.
Negatif:
coretan buram gerakan, dedaunan berlumpur, posterisasi, bayangan tidak cocok.
Kontrol:
seed: 44701, guidance: 6.0, ukuran: 1024x768
- Komposit editorial dominan gaya
Gambar:
- img_layout: studio_three_point_lighting.jpg bobot: 0.6 peran: tata letak
- img_identity: model_closeup.png bobot: 0.7 peran: identitas
- img_style: magazine_cover_moodboard.jpg bobot: 0.9 peran: gaya
Prompt:
Potret sampul editorial, sorotan mengkilap, latar belakang minimal, ruang negatif yang aman untuk tipografi di kiri.
Lensa 85mm, f/2, ekspresi netral, riasan bersih.
Negatif:
penghalusan kulit yang keras, sapuan kuas yang terlalu bergaya, banding, pinggiran warna.
Kontrol:
seed: 99021, guidance: 7.0, ukuran: 1024x1365
Untuk pengaturan skenario yang lebih dalam dan contoh anatomi prompt di sekitar model ini, tulisan komunitas sangat membantu. Rangkuman independen juga menyoroti penggabungan multi-gambar di antara kekuatan Nano Banana.
Kiat pro untuk adegan kompleks
- Pertahankan peran eksplisit: Semakin banyak gambar yang Anda gunakan, semakin banyak Anda harus menyatakan siapa melakukan apa.
- Prioritaskan realisme dengan isyarat kamera: lensa, apertur, tinggi, arah pencahayaan.
- Gunakan gaya sebagai bumbu: mulai rendah, naikkan hanya jika diperlukan.
- Ulangi seperti seorang desainer: delta kecil yang dicatat dengan seed tetap.
- Ketahui kapan harus beralih: jika sebuah gambar terus melawan tujuan (perspektif yang bertentangan), ganti daripada terlalu menyetel.
Jika Anda melakukan penyusunan prompt dan perbandingan iteratif, ruang kerja berdampingan yang menyimpan seed, bobot, dan negatif yang diberi versi sangat berharga. Perlu dicatat: Anda dapat menggunakan alat manajemen prompt untuk membuat templat peran multi-gambar, menyimpan ID gambar, dan dengan cepat melakukan A/B bobot—berguna saat menjalankan lusinan iterasi kecil untuk menyesuaikan kualitas fusi.
Poin-poin penting
- Tetapkan peran yang jelas untuk setiap gambar referensi: tata letak, identitas, gaya.
- Mulai konservatif dengan bobot gaya; lindungi identitas dengan bobot yang lebih tinggi.
- Harmoniskan lensa dan pencahayaan di seluruh teks dan isyarat gambar.
- Kunci seed sebelum penyetelan mikro; ubah satu hal pada satu waktu.
- Gunakan negatif bertarget untuk struktur, tekstur, dan kontrol artefak.
Referensi dan bacaan lebih lanjut: Ikhtisar prompting Nano Banana dan panduan komunitas; komentar tentang kemampuan penggabungan multi-gambarnya; daftar direktori model.
FAQ
Q1:Bagaimana cara menimbang beberapa gambar di Nano Banana untuk fusi yang lebih baik?
Tetapkan peran (tata letak, identitas, gaya) dan mulai dengan bobot seperti 0,7/1,0/0,5. Naikkan bobot identitas jika kemiripan melayang; turunkan bobot gaya jika tampilan mengalahkan realisme. Perubahan kecil ±0,1 bekerja paling baik.
Q2:Negative prompt apa yang membantu penggabungan multi-gambar di Nano Banana?
Gunakan penjaga struktural dan tekstur: “anatomi bengkok, perspektif tidak cocok, kulit plastik, posterisasi, tepi yang terlalu tajam, artefak logo.” Tambahkan negatif kontrol gaya seperti “sapuan kuas yang terlalu bergaya” saat realisme diperlukan.
Q3:Haruskah saya memperbaiki seed saat memadukan komposisi kompleks?
Ya. Jelajahi dengan bebas sampai Anda menyukai framing, lalu kunci seed untuk melakukan iterasi secara terprediksi pada bobot, kekuatan gaya, guidance, dan negatif tanpa kehilangan komposisi.
Q4:Resolusi dan rasio aspek apa yang harus saya gunakan untuk penggabungan multi-gambar?
Hasilkan dekat dengan rasio aspek target Anda (misalnya, 1024×768 atau 896×1152) untuk menghindari pergeseran komposisi. Tingkatkan skala setelahnya dengan pass yang mempertahankan detail, menjaga aspek tetap konstan.
Q5:Dapatkah saya mencampur gambar gaya dan deskripsi teks bersama-sama?
Tentu saja. Mulailah dengan bobot gambar gaya rendah (0,3–0,5) dan perkuat tampilan melalui teks (pencahayaan, color grade). Jika gambar gaya melawan adegan, kurangi bobotnya atau beralih ke gaya berbasis teks saja.