जटिल रचनाओं के लिए नैनो बनाना में मल्टी-इमेज फ्यूजन के लिए प्रॉम्प्ट कैसे करें
शैली: व्यावहारिक और समाधान-उन्मुख
अगर आपने कभी कई रेफरेंस इमेज को एक ही, सुसंगत सीन में मिलाने की कोशिश की है, तो आप जानते हैं कि यह कितना मुश्किल है: विषय के विवरण को सुरक्षित रखें, शैली को सुसंगत रखें, और फिर भी एक ऐसी रचना प्राप्त करें जो वास्तव में काम करे। Nano Banana का मल्टी-इमेज फ्यूजन इसे आश्चर्यजनक विश्वसनीयता के साथ कर सकता है—अगर आप इरादे से प्रॉम्प्ट करते हैं। यह गाइड आपको जटिल रचनाओं के लिए फील्ड-टेस्टेड वर्कफ़्लो के बारे में बताता है, जिसमें इनपुट फ़ॉर्मेटिंग, इमेज वेटिंग रणनीतियाँ, रचना योजना, नेगेटिव प्रॉम्प्टिंग, सीड कंट्रोल और समस्या निवारण शामिल हैं।
शुरुआत में यह बताना ज़रूरी है: सार्वजनिक लेखन नैनो बनाना को मजबूत संपादन, निरंतरता और मल्टी-इमेज फ्यूजन क्षमताओं के साथ एक अत्याधुनिक इमेज मॉडल के रूप में वर्णित करते हैं, और यह मॉडल निर्देशिकाओं पर उत्पादन-तैयार मॉडल में सूचीबद्ध है। सामुदायिक गाइड मॉडल के लिए प्रॉम्प्ट पैटर्न और परिदृश्य-आधारित टिप्स और व्यावहारिक उपयोग के बारे में भी बताते हैं, जिसे हम यहां संश्लेषित करते हैं।
Nano Banana में मल्टी-इमेज फ्यूजन क्या है?
- परिभाषा: प्रकाश, परिप्रेक्ष्य, रंग पट्टियों और स्थानिक व्यवस्था में संघर्षों को हल करते हुए दो या दो से अधिक इनपुट इमेज (विषय, शैली, लेआउट) को एक ही आउटपुट में संयोजित करना।
- यह क्यों मायने रखता है: यह आपको मैन्युअल मास्किंग के बिना जटिल कंपोजिट (उदाहरण के लिए, एक जल रंग परिदृश्य की शैली में एक चित्र; एक उत्पाद को एक सिनेमाई दृश्य में रखा गया) बनाने की अनुमति देता है।
- मुख्य लीवर: इमेज वेट, टेक्स्ट प्रॉम्प्ट प्राथमिकताएं, नेगेटिव प्रॉम्प्ट, सीड कंट्रोल और पहलू/आकार की बाधाएं।
जटिल रचनाओं के लिए उच्च-स्तरीय वर्कफ़्लो
- प्रॉम्प्ट करने से पहले रचना की योजना बनाएं
- तय करें कि कौन सी इमेज लेआउट (रचना) की आपूर्ति करती है, कौन विषय पहचान की आपूर्ति करती है, और कौन शैली की आपूर्ति करती है। यदि आपके पास तीन इमेज हैं, तो प्रत्येक को एक भूमिका सौंपें।
- एक थंबनेल स्केच करें (मानसिक रूप से या जल्दी से डूडल करें)। फ़ोकल पॉइंट्स और गहराई को नोट करें।
- लेआउट के लिए एक बेस इमेज के साथ शुरू करें
- एक रेफरेंस इमेज का उपयोग करें जिसका परिप्रेक्ष्य और फ़्रेमिंग पहले से ही आपके इच्छित सीन से मेल खाता हो।
- इसका वेट पहले मध्यम रखें (जैसे, 0.6–0.8)। आप बाद में ट्यून करेंगे।
- विषय पहचान इमेज(इमेजों) को जोड़ें
- विषय रेफरेंस को थोड़ा अधिक वेट दें (जैसे, 0.8–1.0) ताकि रचना का दबाव पहचान को बनाए रखे।
- यदि स्रोत व्यस्त है तो पहचान इमेज के लिए एक तंग फसल का उपयोग करें; यह पहचान रिकॉल में सुधार करता है।
- एक शैली इमेज (पैलेट/ब्रशवर्क/प्रकाश) का उपयोग करें। पहचान को अभिभूत करने से बचने के लिए कम वेट (0.3–0.6) से शुरू करें।
- यदि शैली यथार्थवाद को ध्वस्त कर देती है, तो शैली इमेज के बजाय (या इसके अलावा) एक पाठ्य शैली विवरण के साथ प्रयोग करें।
- एक प्रॉम्प्ट लिखें जो संघर्षों को हल करे
- विभिन्न संदर्भों को संरेखित करने के लिए सीन, लेंस, प्रकाश और भौतिक गुणों को निर्दिष्ट करें।
- स्थानिक भूमिकाओं को शामिल करें: "विषय A अग्रभूमि", "इमेज B से पृष्ठभूमि", "इमेज C से शैली।"
- रचना की सुरक्षा के लिए नेगेटिव प्रॉम्प्ट जोड़ें
- कलाकृतियों को कॉल करें ("विकृत हाथ," "अतिरिक्त अंग," "दोहरी आंखें," "लोगो ब्लीड," "बेमेल प्रकाश," "गड़बड़ियाँ")।
- यदि शैली बहुत मजबूत है, तो "ओवर-स्टाइलिश, पेंटली स्मीयर" या "मोटी ब्रश बनावट" (यदि अवांछित) जैसा एक नेगेटिव जोड़ें।
- एक अच्छे मसौदे के बाद सीड को लॉक करें
- एक बार जब वैश्विक रचना काम कर जाती है, तो वेट, शैली शक्ति और विवरणों पर सटीक रूप से दोहराने के लिए सीड को फ्रीज कर दें।
- छोटे डेल्टा के साथ दोहराएं
- एक समय में एक पैरामीटर बदलें (जैसे, शैली वेट +0.1) और तुलना करें।
वैसे, कुछ सार्वजनिक गाइड परिदृश्य-आधारित प्रॉम्प्टिंग व्यंजनों और A/Bs की पेशकश करते हैं जो इस मंचन दृष्टिकोण को दर्शाते हैं, जबकि एंड-टू-एंड हाउ-टोस संदर्भ और नकारात्मक प्रॉम्प्टिंग रणनीति को तोड़ते हैं।
प्रॉम्प्ट आर्किटेक्चर: एक विश्वसनीय पैटर्न
एक स्तरित, पठनीय संरचना का उपयोग करें जिसे आप जल्दी से ट्वीक कर सकते हैं:
- सिस्टम/अनुदेशात्मक इरादा (यदि समर्थित है): "पहचान के लिए संदर्भ इमेज का सख्ती से पालन करें, शैली बारीकियों के लिए टेक्स्ट का उपयोग करें।"
- भूमिकाओं के साथ इमेज ब्लॉक: लेआउट, पहचान, शैली।
- रचना, कैमरा, प्रकाश और सामग्री के साथ टेक्स्ट ब्लॉक।
- नियंत्रण: सीड, मार्गदर्शन/CFG, आकार/पहलू।
उदाहरण संरचना (छद्म-प्रॉम्प्ट):
इमेज:
- img_layout: <URL या अपलोड id> वेट: 0.7 भूमिका: लेआउट
- img_identity: <URL या अपलोड id> वेट: 0.9 भूमिका: विषय पहचान
- img_style: <URL या अपलोड id> वेट: 0.4 भूमिका: शैली/पैलेट
प्रॉम्प्ट:
img_identity से विषय का एक मध्यम-शॉट चित्र, img_layout से सड़क दृश्य में खड़ा है।
img_style से रंग पैलेट और प्रकाश मूड बनाए रखें: गर्म गोधूलि, नरम रिम लाइट, क्षेत्र की उथली गहराई।
कैमरा: 50mm, f/1.8, कंधे-स्तर का कोण। सॉफ्ट बोके, यथार्थवादी त्वचा बनावट।
अलमारी: न्यूनतम डार्क जैकेट, कोई लोगो नहीं। अभिव्यक्ति: शांत, आत्मविश्वास।
नेगेटिव:
ओवर-स्टाइलिश ब्रशवर्क, पेंटली स्मीयर, प्लास्टिक की त्वचा, अतिरिक्त उंगलियां, विकृत हाथ, डुप्लिकेट चेहरे की विशेषताएं,
बेमेल परिप्रेक्ष्य, पोस्टराइज्ड छाया, क्रोमैटिक शोर, लोगो कलाकृतियाँ।
नियंत्रण:
सीड: 142375
गाइडेंस: 5.5–7.5 (शुरू 6.5)
आकार: 768x1024 (चित्र) या 1024x768 (परिदृश्य)
यदि आपका इंटरफ़ेस इमेज वेट स्लाइडर्स या टोकन का समर्थन करता है, तो वेट को 0.3–1.2 बैंड में रखें; केवल तभी अधिक जाएं जब पहचान ढह जाए। Nano Banana के बाहर भी, चिकित्सकों ने पाया है कि कम वेट स्वतंत्रता प्रदान करता है जबकि उच्च वेट निष्ठा को लागू करता है।
इमेज वेट: तीन व्यावहारिक रेसिपी
- क्यों: चेहरे की निष्ठा को बनाए रखता है जबकि एक लुक का संकेत देता है।
- शैली-नेतृत्व वाला संपादकीय
- क्यों: फ्रेम में एक मजबूत कला निर्देशन को आगे बढ़ाता है।
- क्यों: रचना सामंजस्य सबसे महत्वपूर्ण है; पहचान मौजूद है लेकिन निरपेक्ष नहीं है।
रचना नियंत्रण: परिप्रेक्ष्य, गहराई और प्रकाश
- परिप्रेक्ष्य: टेक्स्ट और इमेज में लेंस समकक्षों को संरेखित करें (उदाहरण के लिए, विस्तृत दृश्यों के लिए "24mm वाइड शॉट"; चित्रों के लिए "85mm")। यदि लेआउट इमेज 24mm है लेकिन आप 85mm लुक के लिए पूछते हैं, तो मॉडल को विरोधाभासी ज्यामिति का समाधान करना होगा। उन्हें सुसंगत रखें।
- गहराई: अग्रभूमि/मध्यभूमि/पृष्ठभूमि भूमिकाओं का उल्लेख करें ("विषय अग्रभूमि, क्षितिज मध्यभूमि, पहाड़ पृष्ठभूमि")। यह ऑब्जेक्ट ओवरलैप त्रुटियों को कम करता है।
- प्रकाश: एक ही प्रमुख प्रकाश स्रोत और दिन का समय घोषित करें। "बाईं ओर की लाइट की, गर्म; भरण नरम, ठंडा; रिम लाइट सूक्ष्म" का उपयोग करें। यह बेमेल स्रोत इमेज को फ्यूज करने में मदद करता है।
नेगेटिव प्रॉम्प्ट जो वास्तव में मदद करते हैं
- संरचनात्मक: "बेमेल परिप्रेक्ष्य," "तिरछा क्षितिज," "विकृत शरीर रचना," "समतल गहराई।"
- सतह/बनावट: "प्लास्टिक शीन," "मैला विवरण," "पोस्टराइजेशन," "बैंडिंग," "ओवर-शार्पन किनारों।"
- शैली नियंत्रण: यथार्थवाद का लक्ष्य रखते समय "ओवर-स्टाइलिश," "मोटी ब्रश बनावट," "कार्टूनिश।"
- संगति: यदि लोगो या वॉटरमार्क घुसपैठ करते हैं, तो "कोई वॉटरमार्क नहीं, कोई लोगो नहीं" जोड़ें।
सीड और भिन्नता रणनीति
- एक यादृच्छिक सीड के साथ तब तक अन्वेषण करें जब तक कि फ़्रेमिंग 'क्लिक' न हो जाए।
- सीड को लॉक करें और छोटे चरणों में वेट दोहराएं: ±0.1. एक संस्करण लॉग रखें।
- यदि मामूली विवरण टूटते रहते हैं (हाथ, छोटी प्रोप्स), तो सीड रखें लेकिन मार्गदर्शन/CFG को ±0.5 से हिलाएं और नेगेटिव को समायोजित करें।
रिज़ॉल्यूशन, पहलू अनुपात और अपस्केलिंग
- अपस्केलिंग के दौरान रचना बदलावों से बचने के लिए अपने लक्ष्य पहलू अनुपात पर या उसके पास जेनरेट करें।
- यदि आपको अल्ट्रा-हाई डिटेल की आवश्यकता है, तो कम पक्ष पर 768–1024 px पर एक मजबूत बेस का उत्पादन करें, फिर डिटेल-संरक्षण पास के साथ अपस्केल करें। अपस्केल के दौरान पहलू को बदलने से बचें।
समस्या निवारण प्लेबुक
- पहचान वेट को +0.1 से +0.2 तक बढ़ाएं।
- टेक्स्ट में स्पष्ट पहचान विवरण जोड़ें (हेयर स्टाइल, चेहरे के निशान, एक्सेसरीज़)।
- तंग पहचान फसल का उपयोग करें।
- शैली यथार्थवाद को अभिभूत कर रही है
- शैली वेट को कम करें; "ओवर-स्टाइलिश, पेंटली स्मीयर" जैसे नेगेटिव जोड़ें।
- शैली इमेज को टेक्स्ट-ओनली शैली प्रॉम्प्ट से बदलें।
- लेआउट वेट बढ़ाएं, टेक्स्ट में गहराई के संकेत बढ़ाएं ("विमानों का स्पष्ट अलगाव")।
- प्रॉम्प्ट को सरल बनाएं; विरोधाभासी विशेषणों को हटा दें।
- दिन के एक समय और एक प्रकाश दिशा में सामंजस्य स्थापित करें; इसे स्पष्ट रूप से उल्लेख करें।
- यदि कोई शैली इमेज अलग प्रकाश लगाती है, तो उसका वेट कम करें।
- बार-बार कलाकृतियाँ (हाथ, लोगो)
- नेगेटिव को मजबूत करें; थोड़ा मार्गदर्शन बढ़ाएं।
- रचना को बनाए रखने लेकिन विवरणों को ताज़ा करने के लिए छोटे बदलावों के बाद उसी सीड के साथ पुन: उत्पन्न करें।
वास्तविक दुनिया के उपयोग के मामले
- जीवनशैली सेटिंग में उत्पाद हीरो
- लेआउट: जीवनशैली फोटो; पहचान: उत्पाद पैकशॉट; शैली: ब्रांड टोन बोर्ड।
- लगातार छाया और प्रतिबिंबों के लिए प्रॉम्प्ट; "तैरती वस्तुओं," "नकली प्रतिबिंब" के लिए नेगेटिव।
- एक गुरु की शैली में चित्र
- लेआउट: स्टूडियो पोज़ रेफरेंस; पहचान: व्यक्ति; शैली: पेंटिंग या रंग ग्रेड रेफरेंस।
- टेक्स्ट में संतृप्ति और बनावट को नियंत्रित करें; समानता के लिए शैली वेट को मध्यम रखें।
- लेआउट: पर्यावरण प्लेट; पहचान: चरित्र टर्नअराउंड; शैली: सिनेमैटोग्राफी फ्रेम।
- लेआउट द्वारा निहित कैमरा मूवमेंट निर्दिष्ट करें ("लो डॉली, मामूली टिल्ट-अप")।
उदाहरण प्रॉम्प्ट (कॉपी-रेडी)
- दो-इमेज फ्यूजन: पहचान + लेआउट
इमेज:
- img_layout: city_street_at_dusk.jpg वेट: 0.7 भूमिका: लेआउट
- img_identity: subject_headshot.png वेट: 1.0 भूमिका: पहचान
प्रॉम्प्ट:
एक चौराहे पर खड़े पहचान विषय का एक मध्यम-शॉट चित्र, img_layout के समान परिप्रेक्ष्य।
गोल्डन आवर साइड लाइट, क्षेत्र की उथली गहराई, प्राकृतिक त्वचा बनावट, सॉफ्ट बोके।
नेगेटिव:
प्लास्टिक की त्वचा, विकृत उंगलियां, अतिरिक्त अंग, लोगो कलाकृतियाँ, ओवर-शार्पन किनारों।
नियंत्रण:
सीड: 88123, मार्गदर्शन: 6.5, आकार: 896x1152
- तीन-इमेज फ्यूजन: लेआउट + पहचान + शैली
इमेज:
- img_layout: forest_path_wide.png वेट: 0.8 भूमिका: लेआउट
- img_identity: runner_profile.jpg वेट: 0.9 भूमिका: पहचान
- img_style: teal_orange_grade.png वेट: 0.5 भूमिका: शैली
प्रॉम्प्ट:
उसी वन पथ पर धावक का फुल-बॉडी शॉट, गतिशील गति, क्रिस्प मोशन, टील-ऑरेंज सिनेमाई ग्रेड।
लेंस 35mm, लो एंगल, मॉर्निंग हेज़, दाहिनी ओर से दिशात्मक धूप।
नेगेटिव:
मोशन ब्लर स्ट्रीक्स, मैला पर्णसमूह, पोस्टराइजेशन, बेमेल छाया।
नियंत्रण:
सीड: 44701, मार्गदर्शन: 6.0, आकार: 1024x768
- शैली-प्रमुख संपादकीय कंपोजिट
इमेज:
- img_layout: studio_three_point_lighting.jpg वेट: 0.6 भूमिका: लेआउट
- img_identity: model_closeup.png वेट: 0.7 भूमिका: पहचान
- img_style: magazine_cover_moodboard.jpg वेट: 0.9 भूमिका: शैली
प्रॉम्प्ट:
संपादकीय कवर चित्र, चमकदार हाइलाइट्स, न्यूनतम पृष्ठभूमि, टाइपोग्राफी-सुरक्षित नेगेटिव स्थान बाएं।
लेंस 85mm, f/2, तटस्थ अभिव्यक्ति, साफ मेकअप।
नेगेटिव:
कठोर त्वचा चौरसाई, ओवर-स्टाइलिश ब्रशवर्क, बैंडिंग, रंग फ्रिंजिंग।
नियंत्रण:
सीड: 99021, मार्गदर्शन: 7.0, आकार: 1024x1365
इस मॉडल के आसपास गहरे परिदृश्य सेटअप और प्रॉम्प्ट एनाटॉमी उदाहरणों के लिए, सामुदायिक लेखन सहायक होते हैं। स्वतंत्र राउंडअप Nano Banana की ताकत के बीच मल्टी-इमेज फ्यूजन को भी उजागर करते हैं।
जटिल दृश्यों के लिए प्रो टिप्स
- भूमिकाओं को स्पष्ट रखें: आप जितनी अधिक इमेज का उपयोग करते हैं, आपको उतना ही अधिक घोषित करना होगा कि कौन क्या करता है।
- कैमरा संकेतों के साथ यथार्थवाद को प्राथमिकता दें: लेंस, एपर्चर, ऊंचाई, प्रकाश दिशा।
- शैली को मसाला के रूप में उपयोग करें: कम से शुरू करें, केवल आवश्यकतानुसार बढ़ाएं।
- एक डिजाइनर की तरह दोहराएं: एक निश्चित सीड के साथ छोटे, लॉग किए गए डेल्टा।
- कब स्विच करना है, यह जानें: यदि कोई इमेज लक्ष्य (विरोधाभासी परिप्रेक्ष्य) से लड़ती रहती है, तो ओवर-ट्यूनिंग के बजाय इसे बदल दें।
यदि आप प्रॉम्प्ट ड्राफ्टिंग और पुनरावृत्त तुलना कर रहे हैं, तो एक साइड-बाय-साइड वर्कस्पेस जो सीड, वेट और नेगेटिव को संस्करणित रखता है, मूल्यवान है। ध्यान देने योग्य: आप मल्टी-इमेज भूमिकाओं को टेम्पलेट करने, इमेज आईडी को संग्रहीत करने और जल्दी से A/B वेट करने के लिए एक प्रॉम्प्ट प्रबंधन टूल का उपयोग कर सकते हैं—फ्यूजन गुणवत्ता में डायल करने के लिए दर्जनों छोटे पुनरावृत्तियों को चलाते समय काम आता है।
मुख्य बातें
- प्रत्येक रेफरेंस इमेज को स्पष्ट भूमिकाएँ सौंपें: लेआउट, पहचान, शैली।
- शैली वेट के साथ रूढ़िवादी शुरू करें; उच्च वेट के साथ पहचान की रक्षा करें।
- टेक्स्ट और इमेज संकेतों में लेंस और प्रकाश को सामंजस्य स्थापित करें।
- माइक्रो-ट्यूनिंग से पहले सीड को लॉक करें; एक समय में एक चीज बदलें।
- संरचना, बनावट और कलाकृति नियंत्रण के लिए लक्षित नेगेटिव का उपयोग करें।
संदर्भ और आगे पढ़ना: नैनो बनाना प्रॉम्प्टिंग अवलोकन और सामुदायिक हाउ-टोस; इसकी मल्टी-इमेज फ्यूजन क्षमता पर टिप्पणी; मॉडल निर्देशिका लिस्टिंग।
अक्सर पूछे जाने वाले प्रश्न
Q1:बेहतर फ्यूजन के लिए मैं Nano Banana में कई इमेज को कैसे वेट करूं?
भूमिकाएँ असाइन करें (लेआउट, पहचान, शैली) और 0.7/1.0/0.5 जैसे वेट के साथ शुरू करें। यदि समानता बहती है तो पहचान वेट बढ़ाएं; यदि लुक यथार्थवाद को अभिभूत करता है तो शैली वेट को कम करें। छोटे ±0.1 परिवर्तन सबसे अच्छा काम करते हैं।
Q2:Nano Banana में मल्टी-इमेज फ्यूजन में कौन से नेगेटिव प्रॉम्प्ट मदद करते हैं?
संरचनात्मक और बनावट गार्ड का उपयोग करें: “विकृत शरीर रचना, बेमेल परिप्रेक्ष्य, प्लास्टिक की त्वचा, पोस्टराइजेशन, ओवर-शार्पन किनारों, लोगो कलाकृतियाँ।” जब यथार्थवाद की आवश्यकता हो तो “ओवर-स्टाइलिश ब्रशवर्क” जैसे शैली-नियंत्रण नेगेटिव जोड़ें।
Q3:क्या मुझे जटिल रचनाओं को मिलाते समय सीड को ठीक करना चाहिए?
हाँ। स्वतंत्र रूप से तब तक अन्वेषण करें जब तक कि आपको फ़्रेमिंग पसंद न आए, फिर रचना को खोए बिना वेट, शैली शक्ति, मार्गदर्शन और नेगेटिव पर अनुमानित रूप से दोहराने के लिए सीड को लॉक करें।
Q4:मल्टी-इमेज फ्यूजन के लिए मुझे किस रिज़ॉल्यूशन और पहलू अनुपात का उपयोग करना चाहिए?
रचना बदलावों से बचने के लिए अपने लक्ष्य पहलू अनुपात (जैसे, 1024×768 या 896×1152) के करीब जेनरेट करें। बाद में डिटेल-संरक्षण पास के साथ अपस्केल करें, पहलू को स्थिर रखें।
Q5:क्या मैं एक शैली इमेज और एक टेक्स्ट विवरण को एक साथ मिला सकता हूँ?
बिल्कुल। कम शैली इमेज वेट (0.3–0.5) के साथ शुरू करें और टेक्स्ट (प्रकाश, रंग ग्रेड) के माध्यम से लुक को सुदृढ़ करें। यदि शैली इमेज सीन से लड़ती है, तो उसका वेट कम करें या टेक्स्ट-ओनली स्टाइलिंग पर स्विच करें।