نحوه نوشتن پرامپت برای ترکیب چند تصویری در Nano Banana برای ایجاد ترکیبات پیچیده
سبک: عملی و راه حل محور
اگر تا به حال سعی کردهاید چندین تصویر مرجع را در یک صحنه منسجم ترکیب کنید، میدانید چه کار سختی است: حفظ جزئیات سوژه، حفظ ثبات سبک، و همچنان به ترکیبی دست یابید که واقعاً کار کند. ترکیب چند تصویری Nano Banana میتواند این کار را با قابلیت اطمینان شگفتانگیزی انجام دهد—البته اگر با هدف پرامپتنویسی کنید. این راهنما شما را با یک گردش کار آزمایششده در میدان برای ترکیبات پیچیده، از جمله قالببندی ورودی، استراتژیهای وزندهی تصویر، برنامهریزی ترکیببندی، پرامپتنویسی منفی، کنترل Seed و عیبیابی، آشنا میکند.
ذکر این نکته در ابتدا ارزشمند است: نوشتههای منتشر شده Nano Banana را به عنوان یک مدل تصویر پیشرفته با قابلیتهای قوی ویرایش، سازگاری و ترکیب چند تصویری توصیف میکنند، و در فهرست مدلهای آماده تولید در فهرستهای مدل قرار دارد. راهنماهای انجمن همچنین الگوهای پرامپت و نکات مبتنی بر سناریو را برای مدل و راهنمای استفاده عملی، که ما در اینجا ترکیب میکنیم، تشریح میکنند.
ترکیب چند تصویری در Nano Banana چیست؟
- تعریف: ترکیب دو یا چند تصویر ورودی (سوژهها، سبکها، طرحبندیها) در یک خروجی واحد ضمن رفع تعارضات در نورپردازی، پرسپکتیو، پالتهای رنگی و آرایش فضایی.
- چرا مهم است: این امکان را به شما میدهد تا کامپوزیتهای پیچیدهای بسازید (به عنوان مثال، یک پرتره به سبک یک منظره آبرنگ؛ محصولی که در یک صحنه سینمایی قرار داده شده است) بدون ماسک کردن دستی.
- اهرمهای اصلی: وزنهای تصویر، اولویتهای پرامپت متنی، پرامپتهای منفی، کنترل Seed و محدودیتهای ابعاد/اندازه.
گردش کار سطح بالا برای ترکیبات پیچیده
- قبل از پرامپتنویسی، ترکیببندی را برنامهریزی کنید
- تصمیم بگیرید کدام تصویر طرحبندی (ترکیببندی)، کدام تصویر هویت سوژه و کدام تصویر سبک را تامین میکند. اگر سه تصویر دارید، به هر کدام یک نقش اختصاص دهید.
- یک تصویر کوچک (به صورت ذهنی یا یک نقاشی سریع) بکشید. نقاط کانونی و عمق را یادداشت کنید.
- با یک تصویر پایه برای طرحبندی شروع کنید
- از یک تصویر مرجع استفاده کنید که پرسپکتیو و قاببندی آن از قبل با صحنه مورد نظر شما مطابقت داشته باشد.
- وزن آن را در ابتدا متوسط نگه دارید (به عنوان مثال، 0.6–0.8). بعداً آن را تنظیم خواهید کرد.
- تصویر(های) هویت سوژه را اضافه کنید
- به مرجع سوژه وزن کمی بالاتر بدهید (به عنوان مثال، 0.8–1.0) تا هویت تحت فشار ترکیببندی حفظ شود.
- اگر منبع شلوغ است، از یک برش نزدیک برای تصویر هویت استفاده کنید. این کار فراخوانی هویت را بهبود میبخشد.
- از یک تصویر سبک (پالت/قلمزنی/نورپردازی) استفاده کنید. با وزن کمتر (0.3–0.6) شروع کنید تا از غلبه بر هویت جلوگیری کنید.
- اگر سبک واقعگرایی را از بین میبرد، به جای (یا علاوه بر) یک تصویر سبک، یک توصیف متنی از سبک را امتحان کنید.
- پرامپتی بنویسید که تعارضات را برطرف کند
- صحنه، لنز، نورپردازی و خواص مواد را مشخص کنید تا مراجع ناهمگون را تراز کنید.
- نقشهای فضایی را وارد کنید: «سوژه A در پیشزمینه»، «پسزمینه از تصویر B»، «سبک از تصویر C.»
- برای محافظت از ترکیببندی، پرامپتهای منفی اضافه کنید
- مصنوعات را فراخوانی کنید («دستهای تابخورده»، «اندامهای اضافی»، «چشمهای دوتایی»، «نشت لوگو»، «نورپردازی ناهماهنگ»، «اشکالات»).
- اگر سبک خیلی قوی است، یک منفی مانند «بیش از حد سبکدار، لکه نقاشی» یا «بافت قلم ضخیم» (در صورت عدم تمایل) اضافه کنید.
- پس از یک پیشنویس خوب، Seed را قفل کنید
- هنگامی که ترکیببندی جهانی کار میکند، Seed را برای تکرار دقیق وزنها، قدرت سبک و جزئیات، فریز کنید.
- با دلتاهای کوچک تکرار کنید
- هر بار یک پارامتر را تغییر دهید (به عنوان مثال، وزن سبک +0.1) و مقایسه کنید.
به هر حال، برخی از راهنماهای عمومی دستورالعملهای پرامپتنویسی مبتنی بر سناریو و A/Bهایی را ارائه میدهند که رویکرد مرحلهبندی را منعکس میکنند، در حالی که راهنماییهای گام به گام تاکتیکهای ارجاع و پرامپتنویسی منفی را تجزیه میکنند.
معماری پرامپت: یک الگوی قابل اعتماد
از یک ساختار لایهای و خوانا استفاده کنید که بتوانید به سرعت آن را تغییر دهید:
- هدف سیستمی/آموزشی (در صورت پشتیبانی): «تصاویر مرجع را به طور دقیق برای هویت دنبال کنید، از متن برای تفاوتهای ظریف سبک استفاده کنید.»
- بلوک تصاویر با نقشها: طرحبندی، هویت، سبک.
- بلوک متن با ترکیببندی، دوربین، نورپردازی و مواد.
- کنترلها: Seed، راهنمایی/CFG، اندازه/نسبت.
ساختار مثال (شبه پرامپت):
تصاویر:
- img_layout: {URL or upload id} weight: 0.7 role: layout
- img_identity: {URL or upload id} weight: 0.9 role: subject identity
- img_style: {URL or upload id} weight: 0.4 role: style/palette
Prompt:
یک پرتره میاننما از سوژه از img_identity، ایستاده در صحنه خیابانی از img_layout.
پالت رنگی و حالت نورپردازی را از img_style حفظ کنید: غروب گرم، نور لبه ملایم، عمق میدان کم.
دوربین: 50mm، f/1.8، زاویه همسطح شانه. بوکه ملایم، بافت پوست واقعی.
لباس: ژاکت تیره مینیمالیستی، بدون لوگو. حالت چهره: آرام، مطمئن.
منفیها:
قلمزنی بیش از حد سبکدار، لکه نقاشی، پوست پلاستیکی، انگشتان اضافی، دستهای تابخورده، ویژگیهای صورت تکراری،
پرسپکتیو ناهماهنگ، سایههای پوستری شده، نویز رنگی، مصنوعات لوگو.
کنترلها:
seed: 142375
guidance: 5.5–7.5 (start 6.5)
size: 768x1024 (portrait) or 1024x768 (landscape)
اگر رابط شما از لغزندههای وزن تصویر یا توکنها پشتیبانی میکند، وزنها را در باند 0.3–1.2 نگه دارید. فقط زمانی بالاتر بروید که هویت از بین برود. حتی خارج از Nano Banana، متخصصان دریافتهاند که وزن کمتر آزادی میدهد در حالی که وزن بیشتر وفاداری را اعمال میکند.
وزنهای تصویر: سه دستورالعمل عملی
- چرا: وفاداری چهره را حفظ میکند در حالی که به یک ظاهر اشاره میکند.
- چرا: یک جهت هنری قوی را در سراسر فریم پیش میبرد.
- چرا: انسجام ترکیببندی از همه مهمتر است. هویت وجود دارد اما مطلق نیست.
کنترل ترکیببندی: پرسپکتیو، عمق و نورپردازی
- پرسپکتیو: معادلهای لنز را در متن و تصاویر تراز کنید (به عنوان مثال، «شات واید 24 میلیمتری» برای صحنههای گسترده؛ «85 میلیمتر» برای پرترهها). اگر تصویر طرحبندی 24 میلیمتر است اما شما یک ظاهر 85 میلیمتری را درخواست میکنید، مدل باید هندسه متناقض را حل کند. آنها را سازگار نگه دارید.
- عمق: نقشهای پیشزمینه/میانه/پسزمینه را ذکر کنید («سوژه در پیشزمینه، خط افق در میانه، کوهها در پسزمینه»). این کار خطاهای همپوشانی شی را کاهش میدهد.
- نورپردازی: یک منبع نور غالب و زمان روز را اعلام کنید. از «نور اصلی سمت چپ، گرم؛ پرکننده نرم، سرد؛ نور لبه ظریف» استفاده کنید. این به ادغام تصاویر منبع ناهماهنگ کمک میکند.
پرامپتهای منفی که واقعاً کمک میکنند
- ساختاری: «پرسپکتیو ناهماهنگ»، «افق کج»، «آناتومی تابخورده»، «عمق مسطح».
- سطح/بافت: «درخشش پلاستیکی»، «جزئیات گلآلود»، «پوستری شدن»، «نواربندی»، «لبههای بیش از حد تیز شده».
- کنترل سبک: «بیش از حد سبکدار»، «بافت قلم ضخیم»، «کارتونی»، هنگام هدفگیری واقعگرایی.
- سازگاری: اگر لوگوها یا واترمارکها مزاحم هستند، «بدون واترمارک، بدون لوگو» را اضافه کنید.
استراتژی Seed و تنوع
- با یک Seed تصادفی تا زمانی که قاببندی «کلیک» کند، کاوش کنید.
- Seed را قفل کنید و وزنها را در مراحل کوچک تکرار کنید: ±0.1. یک گزارش نسخه نگه دارید.
- اگر جزئیات جزئی به طور مداوم از بین میروند (دستها، وسایل کوچک)، Seed را نگه دارید اما راهنمایی/CFG را با ±0.5 هل دهید و منفیها را تنظیم کنید.
وضوح، نسبت تصویر و ارتقاء مقیاس
- در یا نزدیک نسبت تصویر هدف خود تولید کنید تا از تغییرات ترکیببندی در طول ارتقاء مقیاس جلوگیری کنید.
- اگر به جزئیات فوقالعاده بالایی نیاز دارید، یک پایه قوی در 768–1024 پیکسل در ضلع کوتاه تولید کنید، سپس با یک پاس حفظ جزئیات، مقیاس را ارتقا دهید. از تغییر نسبت در طول ارتقاء مقیاس خودداری کنید.
دفترچه راهنمای عیبیابی
- وزن هویت را 0.1 تا 0.2+ افزایش دهید.
- توصیفکنندههای هویت صریح را در متن اضافه کنید (مدل مو، علائم صورت، لوازم جانبی).
- از برش هویت نزدیکتر استفاده کنید.
- سبک بر واقعگرایی غلبه میکند
- وزن سبک را کاهش دهید. منفیهایی مانند «بیش از حد سبکدار، لکه نقاشی» اضافه کنید.
- تصویر سبک را با پرامپت سبک فقط متنی جایگزین کنید.
- وزن طرحبندی را بالا ببرید، نشانههای عمق را در متن افزایش دهید («جداسازی واضح صفحات»).
- پرامپت را ساده کنید. صفتهای متضاد را حذف کنید.
- با یک زمان از روز و یک جهت نور هماهنگ کنید. آن را به صراحت ذکر کنید.
- اگر یک تصویر سبک نورپردازی متفاوتی را تحمیل میکند، وزن آن را کاهش دهید.
- مصنوعات مکرر (دستها، لوگوها)
- منفیها را تقویت کنید. راهنمایی را کمی افزایش دهید.
- پس از تغییرات کوچک، با همان Seed دوباره تولید کنید تا ترکیببندی حفظ شود اما جزئیات تازه شوند.
موارد استفاده در دنیای واقعی
- قهرمان محصول در محیط زندگی
- طرحبندی: عکس سبک زندگی; هویت: تصویر بستهبندی محصول; سبک: تابلوی لحن برند.
- پرامپت برای سایهها و بازتابهای سازگار; منفی برای «اشیاء شناور»، «بازتابهای جعلی».
- طرحبندی: مرجع ژست استودیویی; هویت: شخص; سبک: نقاشی یا مرجع درجه رنگ.
- اشباع و بافت را در متن کنترل کنید; وزن سبک را برای شباهت متوسط نگه دارید.
- طرحبندی: صفحه محیط; هویت: چرخش شخصیت; سبک: فریم سینماتوگرافی.
- حرکت دوربین ضمنی ناشی از طرحبندی را مشخص کنید («دالی پایین، شیب ملایم به بالا»).
پرامپتهای نمونه (آماده کپی)
- ترکیب دو تصویری: هویت + طرحبندی
تصاویر:
- img_layout: city_street_at_dusk.jpg weight: 0.7 role: layout
- img_identity: subject_headshot.png weight: 1.0 role: identity
Prompt:
یک پرتره میاننما از سوژه هویت ایستاده در یک گذرگاه عابر پیاده، همان پرسپکتیو img_layout.
نور جانبی ساعت طلایی، عمق کم، بافت پوست طبیعی، بوکه ملایم.
منفیها:
پوست پلاستیکی، انگشتان تابخورده، اندامهای اضافی، مصنوعات لوگو، لبههای بیش از حد تیز شده.
کنترلها:
seed: 88123, guidance: 6.5, size: 896x1152
- ترکیب سه تصویری: طرحبندی + هویت + سبک
تصاویر:
- img_layout: forest_path_wide.png weight: 0.8 role: layout
- img_identity: runner_profile.jpg weight: 0.9 role: identity
- img_style: teal_orange_grade.png weight: 0.5 role: style
Prompt:
نمای تمام قد از دونده در همان مسیر جنگلی، گام پویا، حرکت واضح، درجه سینمایی فیروزهای-نارنجی.
لنز 35 میلیمتری، زاویه پایین، مه صبحگاهی، نور خورشید جهتدار از راست.
منفیها:
رگههای تاری حرکت، شاخ و برگ گلآلود، پوستری شدن، سایههای ناهماهنگ.
کنترلها:
seed: 44701, guidance: 6.0, size: 1024x768
- کامپوزیت سرمقاله غالب سبک
تصاویر:
- img_layout: studio_three_point_lighting.jpg weight: 0.6 role: layout
- img_identity: model_closeup.png weight: 0.7 role: identity
- img_style: magazine_cover_moodboard.jpg weight: 0.9 role: style
Prompt:
پرتره جلد سرمقاله، هایلایتهای براق، پسزمینه حداقلی، فضای منفی ایمن برای حروفچینی در سمت چپ.
لنز 85 میلیمتری، f/2، حالت چهره خنثی، آرایش تمیز.
منفیها:
صاف کردن شدید پوست، قلمزنی بیش از حد سبکدار، نواربندی، حاشیهنویسی رنگ.
کنترلها:
seed: 99021, guidance: 7.0, size: 1024x1365
برای تنظیمات سناریوی عمیقتر و مثالهای تشریحی پرامپت در مورد این مدل، نوشتههای انجمن مفید هستند. خلاصههای مستقل همچنین ترکیب چند تصویری را در میان نقاط قوت Nano Banana برجسته میکنند.
نکات حرفهای برای صحنههای پیچیده
- نقشها را صریح نگه دارید: هر چه تصاویر بیشتری استفاده کنید، باید بیشتر اعلام کنید که چه کسی چه کاری انجام میدهد.
- واقعگرایی را با نشانههای دوربین در اولویت قرار دهید: لنز، دیافراگم، ارتفاع، جهت نورپردازی.
- از سبک به عنوان چاشنی استفاده کنید: کم شروع کنید، فقط در صورت نیاز آن را بالا ببرید.
- مانند یک طراح تکرار کنید: دلتاهای کوچک و ثبت شده با یک Seed ثابت.
- بدانید چه زمانی باید تغییر دهید: اگر تصویری به طور مداوم با هدف مبارزه میکند (پرسپکتیو متضاد)، به جای تنظیم بیش از حد، آن را جایگزین کنید.
اگر در حال تهیه پیشنویس پرامپت و مقایسههای تکراری هستید، یک فضای کاری کنار هم که Seedها، وزنها و منفیهای نسخهبندی شده را نگه میدارد، ارزشمند است. شایان ذکر است: میتوانید از یک ابزار مدیریت پرامپت برای الگوبرداری از نقشهای چند تصویری، ذخیره شناسههای تصویر و A/B سریع وزنها استفاده کنید—هنگام اجرای دهها تکرار کوچک برای تنظیم کیفیت همجوشی، مفید است.
نکات کلیدی
- به هر تصویر مرجع نقشهای واضحی اختصاص دهید: طرحبندی، هویت، سبک.
- با وزن سبک محافظهکارانه شروع کنید. از هویت با وزن بالاتر محافظت کنید.
- لنز و نورپردازی را در متن و نشانههای تصویر هماهنگ کنید.
- Seed را قبل از تنظیم دقیق قفل کنید; هر بار یک چیز را تغییر دهید.
- از منفیهای هدفمند برای کنترل ساختار، بافت و مصنوعات استفاده کنید.
منابع و مطالعه بیشتر: نمای کلی پرامپتنویسی Nano Banana و راهنماییهای انجمن; تفسیر در مورد قابلیت ترکیب چند تصویری آن; فهرست فهرست مدل.
سوالات متداول
Q1:چگونه میتوانم وزن چند تصویر را در Nano Banana برای ترکیب بهتر تعیین کنم؟
نقشها (طرحبندی، هویت، سبک) را اختصاص دهید و با وزنهایی مانند 0.7/1.0/0.5 شروع کنید. اگر شباهت از بین رفت، وزن هویت را افزایش دهید. اگر ظاهر بر واقعگرایی غلبه کرد، وزن سبک را کاهش دهید. تغییرات کوچک ±0.1 بهترین کار را دارند.
Q2:کدام پرامپتهای منفی به ترکیب چند تصویری در Nano Banana کمک میکنند؟
از محافظهای ساختاری و بافتی استفاده کنید: «آناتومی تابخورده، پرسپکتیو ناهماهنگ، پوست پلاستیکی، پوستری شدن، لبههای بیش از حد تیز شده، مصنوعات لوگو.» هنگام نیاز به واقعگرایی، منفیهای کنترل سبک مانند «قلمزنی بیش از حد سبکدار» را اضافه کنید.
Q3:آیا باید Seed را هنگام ترکیب ترکیبات پیچیده ثابت کنم؟
بله. آزادانه کاوش کنید تا زمانی که از قاببندی خوشتان بیاید، سپس Seed را قفل کنید تا به طور قابل پیشبینی روی وزنها، قدرت سبک، راهنمایی و منفیها بدون از دست دادن ترکیببندی تکرار کنید.
Q4:از چه وضوح و نسبت تصویری باید برای ترکیب چند تصویری استفاده کنم؟
نزدیک به نسبت تصویر هدف خود تولید کنید (به عنوان مثال، 1024×768 یا 896×1152) تا از تغییرات ترکیببندی جلوگیری کنید. پس از آن، با یک پاس حفظ جزئیات، مقیاس را ارتقا دهید و نسبت را ثابت نگه دارید.
Q5:آیا میتوانم یک تصویر سبک و یک توصیف متنی را با هم ترکیب کنم؟
کاملاً. با وزن تصویر سبک کم (0.3–0.5) شروع کنید و ظاهر را از طریق متن تقویت کنید (نورپردازی، درجه رنگ). اگر تصویر سبک با صحنه مبارزه میکند، وزن آن را کاهش دهید یا به استایلینگ فقط متنی تغییر دهید.