نکتهای که در مورد «تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی» وجود دارد این است که همه ادعا میکنند میتوانند با یک پرامپت قوی و کمی دعا آنها را احضار کنند. سپس تعجب میکنند که چرا نتایج شبیه به تبلیغات شامپویی است که از پشت سیبزمینی گرفته شده است. فوتورئالیسم یک حالت نیست. مجموعهای از محدودیتها است - لنز، نور، سنسور، فیزیک و کمی سلیقه - که دقیقاً همان چیزی است که مدلهای مولد هنگام تولید هر چیزی شبیه به یک عکس واقعی به آن نیاز دارند.
این فرمول پرامپت برای فوتورئالیسم واقعی در تصاویر تولیدشده توسط هوش مصنوعی است. نه «سینمایی». نه «رندر Octane». واقعی. به این معنی که: میتوانید نویز ISO را در سایهها احساس کنید و شیشه همانطور که باید عمل میکند.
بیایید زوم کنیم.
کلمه کلیدی روی میز: فرمول پرامپت برای فوتورئالیسم واقعی در تصاویر تولیدشده توسط هوش مصنوعی
هدف کاربر در اینجا بهطور واضح مشخص است: شما یک راهنمای عملی میخواهید، نه یک پایاننامه. پس این همان چیزی است که در اینجا ارائه میشود - یک فرمول کاربردی، به همراه دلیل کارکرد آن. ما داربستهای دنیای واقعی (فاصله کانونی، سنسورها، نسبتهای نورپردازی) را وارد میکنیم که مدلها در واقع از آنها یاد گرفتهاند و میدانند چگونه تقلید کنند. اگر تصویرسازی فانتزی میخواهید، دوربین را کنار بگذارید. اگر تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی میخواهید - بهویژه چهرهها، محصولات، محیطها - با زبان دوربین صحبت کنید.
بله، هزاران لیست وجود دارد که وعده «۱۰ نکته برای پرامپتهای فوتورئالیستی» را میدهند. برخی مناسب هستند، برخی دیگر شبیه به لباس مبدل برای صاحبان دوربینهای DSLR هستند که هرگز دکمهی چرخشی مُد را از حالت Auto خارج نکردهاند. چند راهنمای قوی تنظیمات Midjourney و ترفندهای پرامپت را گامبهگام آموزش میدهند، و تا جایی که پیش میروند خوب هستند. برخی دیگر ایدههای اصلی - ترکیببندی، نور، جزئیات - را پوشش میدهند، اما به یک فرمول تمیز نمیرسند. خلاصه: هر چه بیشتر به زبان عکاسی صحبت کنید، مدل بیشتر شبیه به یک دوربین رفتار میکند.
و اگر تعجب میکنید که آیا این موضوع حتی به Sider.AI مربوط است یا خیر - ابزار آنها یک نوار کناری هوش مصنوعی همهکاره با دسترسی به جدیدترین مدلها و یک فضای کاری پرامپت انعطافپذیر است که تکرار الگوهای پرامپت ساختاریافته و قابلاستفاده مجدد را بهطرز چشمگیری آسان میکند. به عبارت دیگر: مکان خوبی برای انجام درست این کار است. فرمول: طوری بگویید که یک دوربین میگوید
فرمول پرامپت برای فوتورئالیسم واقعی در تصاویر تولیدشده توسط هوش مصنوعی به پنج بخش تقسیم میشود:
- محدودیتهای فنی + نقصها (نوع خوب)
میتوانید آن را به صورت یک جمله بنویسید (تمیزتر)، یا به صورت بندهای جداشده با کاما (مدولارتر). من هر دو را نشان خواهم داد.
۱) موضوع + افعال واقعیت
تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی با اسمها و فعلهای اساسی شروع میشوند: «زنی که بند کفشهای دویدن خود را روی آسفالت خیس میبندد»، نه «الهه اثیری سرعت». مدل «آسفالت خیس» را بهتر از شعر شما میشناسد. نشانههای لمسی را اضافه کنید: «بندهای ریشریششده»، «قطرات روی بطری آب»، «بخار نفس در هوای سرد».
هسته موضوعی خوب:
- «یک باریستای میانسال که در حال بخار دادن شیر است، پارچ استیل، پیچشهای میکروفوم قابل مشاهده، تمرکز در چشمان»
- «فستبک قرمز رنگ مدل ۱۹۶۷ موستانگ زیر نور خیابان سدیمی پارک شده، گرد و غبار جادهای کمرنگ، اثر انگشت روی صندوق عقب، نمنم باران شبانه»
۲) دوربین + لنز + سنسور
این رمزگشایی بزرگ است. مدلهایی که روی عکاسی در مقیاس وب آموزش داده شدهاند، زبان دوربین را میفهمند. مشخص کنید:
- نوع دوربین: «DSLR فول فریم»، «بدون آینه»، «APS-C»، «مدیوم فرمت».
- لنز و فاصله کانونی: «لنز پرایم ۵۰ میلیمتری»، «۸۵mm f/1.8»، «واید انگل ۲۴ میلیمتری»، «۷۰–۲۰۰ میلیمتری در ۲۰۰ میلیمتر».
- دیافراگم: عمق میدان رئالیسم است. f/1.4 فوکوس کم عمق رویایی؛ f/8 وضوح خیابانی؛ f/11 وضوح محصول.
- سرعت شاتر و ISO اگر حرکت/نویز مهم باشد.
مثالها:
- «گرفتهشده با دوربین بدون آینه فول فریم با لنز ۸۵mm f/1.8 در f/2.2.»
- «۲۴mm در f/8، دستی، ۱/۲۵۰ ثانیه، ISO 400.»
۳) نور + نظم نوردهی
نور عامل موفقیت یا شکست است. منبع، کیفیت و جهت را مشخص کنید:
- «نور پسزمینه ساعت طلایی، هایلایتهای حاشیهای، نور اصلی نرم از پنجره بزرگ سمت چپ دوربین، نور ملایم از دیوار سفید.»
- «آسمان ابری، نور ملایم از بالا، کنتراست کم، بدون سایههای سخت.»
- «یک لامپ تنگستن ساده در کادر، نسبت نور اصلی به پرکننده ۲:۱، نوردهی کم به میزان ۰.۳ استاپ.»
مدلهای هوش مصنوعی به نسبتها، جهتها و اصلاحکنندههایی مانند «سافتباکس»، «دیفیوژن»، «بازتاب» و «فیلتر منفی» پاسخ میدهند.
۴) علم رنگ + فیلم/پردازش
فقط نگویید «سینمایی». یک استوک فیلم یا ویژگی پردازشی خاص را درخواست کنید:
- «پالت Kodak Portra 400، کاهش ملایم هایلایت.»
- «رنگ Fujifilm Provia—سایههای سردتر، کنتراست واضح.»
- «ظاهر دیجیتال: پروفایل خنثی، رنگ پوست دقیق، بدون رنگ نارنجی/آبی.»
همچنین تراز سفیدی و انتظارات محدوده دینامیکی را مشخص کنید:
- «تراز سفیدی نور روز 5600K.»
- «محدوده دینامیکی بالا با فشردهسازی طبیعی هایلایت.»
۵) محدودیتهای فنی + نقصها
دوربینهای واقعی محدودیتها و ویژگیهای خاصی دارند. مدلها نیز این را یاد میگیرند. اضافه کنید:
- «انحراف رنگی نامحسوس در هایلایتهای براق.»
- «نویز سنسور در ISO 1600 در سایهها.»
- «تاری حرکت روی دستهای متحرک در ۱/۶۰ ثانیه.»
- «بافت طبیعی پوست، منافذ قابل مشاهده، بدون صاف کردن پلاستیکی، بدون شارپسازی بیش از حد.»
شما در حال خراب کردن تصویر نیستید - شما آن را واقعی میکنید. نقصها واقعیت را میفروشند.
الگوی پرامپت فشرده
برای استفاده سریع، این فرمول یک خطی است. براکتها را با جزئیات پر کنید:
. راهنماهای عملی که اصول اولیه ترکیببندی و نورپردازی را تشریح میکنند نیز کمک میکنند، اما قطعه گمشده اغلب تحمل فنی است - نقصها و محدودیتهایی که واقعیت را میفروشند. آنها را حذف کنید و همه چیز شبیه به تبلیغات گوشیهای هوشمند به نظر میرسد: بیش از حد تمیز.
پیشرفته: تفکر نسبتی و کارگردانی جزئی
- ریاضیات نور اصلی/پرکننده: اگر بگویید «نسبت نور اصلی به پرکننده ۲:۱»، تعریف ملایمی دریافت خواهید کرد. «۴:۱» دراماتیک به نظر میرسد. «۸:۱» نوآر است.
- چراغهای کاربردی: «لامپ تنگستن کاربردی در کادر» به مدل میگوید یک منبع قابل باور را شامل شود.
- دستورالعملهای جزئی: «بازتابهای نور در ساعت ۱۰»، «نور حاشیهای موها را از پسزمینه جدا میکند»، «هایلایتهای براق روی کروم». اینها وسواسی به نظر میرسند. هستند. آنها همچنین کار میکنند.
- رئالیسم حرکت: از تاری حرکت نترسید وقتی منطقی است: «تاری حرکت دست ۱/۶۰ ثانیه». واقعیت به ندرت ثابت است.
- نشانههای محیطی: «چالهها با بازتابهای دوتایی»، «اثر انگشت روی شیشه»، «ذرات گرد و غبار در نور پسزمینه.»
پرامپت منفی: درخشندگی را از عروسک باربی بگیرید
اگر ابزار شما از پرامپت منفی پشتیبانی میکند، از آن برای مبارزه با تمایل مدل به پلاستیکی و فوقالعاده استفاده کنید:
- «بدون پوست پلاستیکی، بدون صاف کردن بیش از حد، بدون شارپسازی بیش از حد، بدون هالههای HDR، بدون شکوفایی، بدون نورپردازی سورئال، بدون انگشتان اضافی.»
- برای محصولات: «بدون بازتابهای غیرواقعی، بدون هایلایتهای غیرممکن، بدون قطعات شناور، بدون اعوجاج لوگو.»
ترکیببندی آگاهانه از دوربین
چند محدودیت ترکیببندی به عنوان «عکاس واقعی در حال کار» خوانده میشود:
- فاصله و قاببندی: «پرتره سر و شانه»، «سهچهارم»، «نمای باز»، «ماکرو ۱:۱.»
- زاویه: «همسطح چشم»، «همسطح کمر»، «تخت از بالا به پایین»، «قهرمان زاویه پایین.»
- اصلاحات پرسپکتیو: «عمودیها عمودی نگه داشته شوند»، «اعوجاج خفیف بشکهای مجاز است.»
- نشانههای عمق: «عنصر پیشزمینه خارج از فوکوس»، «موضوع میانی»، «پسزمینه با بوکه ملایم.»
بررسی واقعیت برای چهرهها و پوست
پوست جایی است که چیزهای وهمآور ظاهر میشوند. آن را محکم کنید:
- «بافت طبیعی پوست با منافذ، موهای کرکی ریز، بافت کمی زیر چشم.»
- «پراکندگی زیرسطحی روی گوشها در نور پسزمینه.»
- «تغییرات رنگی کوچک در گونهها و بینی (مویرگها).»
- «بدون صاف کردن بدون منافذ، بدون هایلایتهای مومی.»
اگر مدل شما تمایل به زیباتر کردن دارد، با «سبک مستند»، «نور موجود» و دیافراگمهای کوچکتر (f/4–f/8) آن را بیش از حد اصلاح کنید. زرق و برق یک نشانه است.
محیطهایی که هوا در آنها جریان دارد
فضای داخلی: مواد و بازتاب نور خود را فراخوانی کنید. «دیوارهای رنگشده مات که نور را جذب میکنند»، «بازتابهای براق کاشیهای براق»، «بافت چوب که نور گرم تنگستن را میگیرد.»
فضای بیرونی: «مه در دوردست»، «پرسپکتیو هوایی»، «سطوح خیس با بازتابهای نرم»، «زبالههای تصادفی (ظریف).» این تزئین نیست - این فیزیک به صورت خلاصه است.
کار با محصول: حالت کنترل وسواس
محصولات خواستار محدودیتهای سخت هستند:
- «پایدار روی سهپایه، f/11، وضوح یکنواخت از لبه به لبه.»
- «نور پلاریزه شده برای کاهش تابش خیرهکننده (یا نه، اگر درخشش میخواهید).»
- «هایلایتهای براق کنترلشده با پرچمها.»
- «پروفایل خنثی با رنگ دقیق، تراز سفیدی سفارشی، بدون تغییر رنگ.»
به مدل سطح میز، پسزمینه و اینکه سایه میخواهید یا یک برش شناور را بگویید.
طرح اولیه پرامپت قابل استفاده مجدد که میتوانید واقعاً از آن استفاده کنید
در اینجا یک طرح اولیه عملی وجود دارد که میتوانید آن را کپی و ویرایش کنید. براکتها متغیرهای شما را نشان میدهند. براکتها را در هنگام استفاده حذف کنید:
.
عیبیابی چیزهای وهمآور: چه چیزی را باید تعمیر کرد وقتی تقریباً واقعی است
- خیلی تمیز؟ نویز («نویز ISO 800 در سایهها»)، وینیتینگ لنز، انحراف رنگی ملایم را اضافه کنید. اشباع را به عقب بکشید. از یک پروفایل خنثی استفاده کنید.
- پوست خیلی براق؟ «بدون روتوش زیبایی»، «حفظ بافت پوست»، «ناحیه T مات» را مشخص کنید. دیافراگم را به f/4–f/5.6 افزایش دهید.
- نورپردازی مصنوعی به نظر میرسد؟ آن را در یک منبع معقول قرار دهید: «نور پنجره سمت چپ دوربین»، «فلورسنت بالای سر با رنگ سبز»، «یک تنگستن کاربردی.» سپس یک نسبت تنظیم کنید.
- عجیب و غریب بودن پرسپکتیو؟ فاصله کانونی و زاویه را اعلام کنید. «۵۰mm همسطح چشم» بسیاری از جرایم را برطرف میکند.
- لبههای بیش از حد شارپ؟ «فیلتر دیفیوژن ۱/۸» را اضافه کنید، یا میکروکنتراست را نرم کنید. شیشه واقعی دارای شخصیت است.
Midjourney، Stable Diffusion، DALL·E: ویژگیهای خاص پلتفرم
- Midjourney صفات سرسبز را دوست دارد اما به صحبتهای دوربین احترام میگذارد. ستون فقرات عکاسی را نگه دارید، سپس تزئین کنید. راهنماهای خودشان به سمت تنظیمات واقعگرایانه متمایل میشوند. فقط مراقب وسوسه بیش از حد سبکسازی باشید. اسلایدرهای زیادی با عنوان «—stylize» خواهید دید که به عنوان سلیقه تغییر چهره میدهند. کم استفاده کنید.
- Stable Diffusion (و SDXL) به ابهام حساسیت دارند. فواصل کانونی، ISO و استوکهای فیلم دقیق به خوبی عمل میکنند. پرامپتهای منفی دوست شما هستند.
- DALL·E تمایل دارد بهطور پیشفرض به «کاتالوگ تمیز» تغییر کند. اگر دانه میخواهید، باید اصرار کنید: دانه، هالاسیون، سرریز جهتدار، دماهای رنگی ترکیبی.
یک ویدیوی راهنما میتواند به شما کمک کند علت و معلول هر متغیر - به ویژه نورپردازی - را ببینید، اما به یاد داشته باشید: بیشتر آموزشها به جای مبانی فنی، به مربیگری زیباییشناختی تغییر میکنند. دومی چیزی است که «واقعی به نظر میرسد» را از «هوش مصنوعی به نظر میرسد» جدا میکند.
چند پرامپت فوتورئالیستی آماده به کار
- پرتره خیابانی: «مردی با کت نخودی سرمهای که در زیر باران منتظر در یک گذرگاه عابر پیاده است، نفس قابل مشاهده، گرفتهشده با فول فریم با ۵۰mm در f/2، ۱/۲۵۰ ثانیه، ISO 800، آسمان ابری به عنوان نور نرم از بالا، فیلتر منفی ظریف از لبه چتر سیاه سمت راست دوربین، رنگ Portra 400 با هالاسیون ملایم در اطراف چراغهای خیابان، دانه ریز، وینیتینگ ملایم لنز، قاببندی سهچهارم همسطح چشم، بازتاب آسفالت خیس، بوکه ترافیک شهری.»
- نمای نزدیک غذا: «برشی از پای لیموترش در بشقاب سرامیکی با رد چنگال، قطرات ریز میعان روی فیلینگ، گرفتهشده با APS-C با ماکرو ۶۰mm در f/5.6، ۱/۱۲۵ ثانیه، ISO 200، نور اصلی پخششده بزرگ از پنجره سمت چپ دوربین، بازتاب سفید در طرف مقابل، پروفایل دیجیتال خنثی، نور روز 5600K، وضوح واضح از لبه به لبه، خردههای طبیعی، سایه نرم روی رومیزی کتانی، زاویه ۳۰ درجه از بالا به پایین.»
- قهرمان محصول: «هدفونهای بیسیم مشکی مات روی تخته بتنی، علائم ساییدگی کمرنگ، گرفتهشده با مدیوم فرمت با ۸۰mm در f/11، ۱/۱۶۰ ثانیه، ISO 100، دو سافتباکس (نور اصلی در ۴۵ درجه، نور حاشیهای از پشت)، پرچمها برای کنترل بازتابهای براق، پروفایل رنگی خنثی، میکرو خراشهای ظریف حفظشده، شبح تمیز با سایه نرم، ترکیببندی متمرکز.»
- مستند داخلی: «بار کمنور با تابلوی نئون آبجو، متصدی بار در حال پاک کردن پیشخوان، گرفتهشده با فول فریم با ۳۵mm در f/2.8، ۱/۶۰ ثانیه، ISO 1600، ترکیبی از وسایل کاربردی تنگستن و سرریز نئون، کنتراست ۴:۱، رنگ خنثی با تصحیح رنگ سبز، نویز قابل مشاهده در سایهها، تاری حرکت جزئی روی دستها، مشتریان در بوکه پسزمینه نرم.»
حقیقت کسلکنندهای که تصاویر بهتری میسازد
فوتورئالیسم یک نظم و انضباط در تفریق است. شما رئالیسم اضافه نمیکنید - شما مزخرفات را حذف میکنید. هر بند در پرامپت، درجههای آزادی را که مدل در غیر این صورت برای توهم استفاده میکند، از بین میبرد. با محدودیتهای کافی، تنها چیزی که باقی میماند، باورپذیری است. و باورپذیری به طرز مشکوکی شبیه واقعیت به نظر میرسد.
اگر این غیرعاشقانه به نظر میرسد، خب، نورسنج هم همینطور است. اما از هر عکاس شاغلی بپرسید که چه چیزی مهمتر است: شرح اینستاگرام یا جهت نور اصلی. دقیقاً.
جاهایی که ابزارها واقعاً کمک میکنند (و جاهایی که کمک نمیکنند)
چه چیزی کمک میکند:
- فضای کاری که در آن بتوانید پرامپتها را در کنار هم تنظیم، نسخه و مقایسه کنید، در حالی که بلوکهای زبان دوربینی خود را دست نخورده نگه دارید. نوار کناری Sider.AI این کار را بدون اینکه شما را مجبور به مبارزه با رابط کاربری کند، انجام میدهد، که، صادقانه بگویم، یک معجزه کوچک در نرمافزار سال ۲۰۲۵ است.
- تکرار سریع با بذرهای سازگار، بنابراین میدانید چه چیزی تغییر کرده است.
- تغییر مدل بدون بازنویسی کل پرامپت: ستون فقرات عکاسی را نگه دارید، تزئینات را تنظیم کنید.
چه چیزی کمک نمیکند:
- «بستههای پرامپت جادویی» که شبیه تبلیغات بداهه به نظر میرسند. اگر نمیتوانید توضیح دهید که «نورپردازی کوانتومی حجمی فوقواقعی سینمایی» به چه معناست، مدل هم نمیتواند.
- نشانههای سبک که مانند ادکلن اسپری میشوند. یک نت خوشذوق جذاب است. یک نمونهبرداری از فروشگاه بزرگ تهوعآور است.
یک نکته دیالکتیکی درباره سلیقه
سلیقه بخشی از فوتورئالیسم است که در مورد آن صحبت نمیکنیم زیرا نمیتوان آن را بستهبندی کرد. شما میتوانید یک پرامپت عالی بنویسید و همچنان یک عکس خستهکننده بگیرید. واقعیت ذاتاً جالب نیست - هدفمند بودن جالب است. زبان دوربین به شما باورپذیری میدهد. شما دیدگاه را به ارمغان میآورید.
روی دیگر سکه: گاهی اوقات «واقعی» هدف نیست. گاهی اوقات چیزی میخواهید که شبیه به حافظه به نظر برسد - اغراقآمیز، بخشنده، کمی رویایی. از قضا، همان فرمول شما را به آنجا میرساند: متغیرهای خود را تنظیم کنید، سپس یکی را خم کنید. هالاسیون را فشار دهید. تراز سفیدی را کج کنید. وقتی باید از f/5.6 استفاده کنید، f/1.4 را تنظیم کنید. این «اشتباه بودن» در برابر پسزمینهای از درست است که حس خوبی دارد.
نکته اصلی
اگر فوتورئالیسم واقعی را در تصاویر تولیدشده توسط هوش مصنوعی میخواهید، از مدل نخواهید که یک هنرمند باشد و از آن بخواهید که یک دوربین باشد. مشخص باشید. تحتالفظی باشید. لنز خود را نام ببرید. نور خود را اعلام کنید. کمی دانه را در آغوش بگیرید. بقیه سلیقه است، و هیچ مقدار زرق و برق پرامپت آن را برای شما نمیخرد.
از فرمول استفاده کنید. سپس بروید چیزی بسازید که انگار آنجا بودهاید.
سؤالات متداول
س۱: سادهترین فرمول پرامپت برای فوتورئالیسم واقعی در تصاویر تولیدشده توسط هوش مصنوعی چیست؟
موضوع + دوربین + لنز + نوردهی + نور + رنگ/فیلم + محدودیتهای فنی + ترکیببندی + محیط. از اصطلاحات دوربین (به عنوان مثال، ۵۰mm در f/2، نور پسزمینه ساعت طلایی) صحبت کنید و تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی دریافت خواهید کرد که واقعاً شبیه عکس هستند.
س۲: چرا پرترههای هوش مصنوعی من به جای فوتورئالیستی، پلاستیکی به نظر میرسند؟
شما به مدل اجازه میدهید بهطور پیشفرض به سرزمین روتوش زیبایی برود. بافت واقعی پوست، منافذ، موهای ظریف را مشخص کنید و از شارپسازی بیش از حد یا هالههای HDR منع کنید. برای فوتورئالیسم باورپذیرتر در تصاویر تولیدشده توسط هوش مصنوعی، دانه اضافه کنید و در f/4–f/5.6 عکس بگیرید.
س۳: کدام تنظیمات دوربین برای تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی مهمتر هستند؟
فاصله کانونی و دیافراگم بزرگترین نشانهها هستند: ۸۵mm در f/2 به عنوان پرتره خوانده میشود. ۲۴mm در f/8 به عنوان خیابان/معماری خوانده میشود. پس از آن، کیفیت و جهت نور. ISO و سرعت شاتر به معرفی دانه و تاری حرکت طبیعی کمک میکنند.
س۴: آیا برای فوتورئالیسم واقعی به مراجع استوک فیلم نیاز دارم؟
نه، اما کمک میکنند. Portra 400، Provia یا یک پروفایل دیجیتال خنثی، لنگری برای رنگ و کاهش هایلایت به مدل میدهد. این یک میانبر برای علم رنگ باورپذیر در تصاویر فوتورئالیستی تولیدشده توسط هوش مصنوعی است.
س۵: Sider.AI چگونه با درخواست پرامپت فوتورئالیستی کمک میکند؟
این یک مکان مرتب برای نگهداری یک طرح اولیه پرامپت قابل استفاده مجدد، تنظیم متغیرها و مقایسه خروجیها بدون درگیری با دهها تب است. تشریفات کمتر، تکرارهای بیشتر - سس مخفی کسلکننده برای فوتورئالیسم واقعی در تصاویر تولیدشده توسط هوش مصنوعی.