Sider.ai
  • Chat
  • Wisebase
  • ابزار
  • افزونه
  • مشتریان
  • قیمت گذاری
اکنون بارگیری کن
وارد شدن

با Sider سریع‌تر بیاموزید، عمیق‌تر بیندیشید و هوشمندتر رشد کنید.

محصولات
برنامه‌ها
  • افزونه‌ها
  • iOS
  • Android
  • Mac OS
  • Windows
Wisebase
  • Wisebase
  • Deep Research
  • Scholar Research
  • Math Solver
  • Rec NoteNew
  • Audio To Text
  • Gamified Learning
  • Interactive Reading
  • ChatPDF
ابزارها
  • سازنده وبNew
  • اسلایدهای هوش مصنوعیNew
  • نویسنده مقاله هوش مصنوعی
  • Nano Banana Pro
  • Nano Banana Infographic
  • تولیدکننده تصویر هوش مصنوعی
  • ژنراتور اختلال ذهنی ایتالیایی
  • حذف‌کننده پس‌زمینه
  • تغییر دهنده پس‌زمینه
  • پاک‌کننده عکس
  • حذف‌کننده متن
  • نقاشی مجدد
  • ارتقاء دهنده تصویر
  • ایجاد
  • مترجم هوش مصنوعی
  • مترجم تصویر
  • مترجم PDF
Sider
  • تماس با ما
  • مرکز راهنما
  • دانلود
  • قیمت‌گذاری
  • برنامه آموزشی
  • چه چیز جدید است
  • وبلاگ
  • جامعه
  • شرکا
  • همکاری در فروش
  • دعوت
©2026 تمام حقوق محفوظ است
شرایط استفاده
سیاست حفظ حریم خصوصی
  • صفحه اصلی
  • وبلاگ
  • ابزارهای هوش مصنوعی
  • مهندسی پرامپت Sora 2: کلمات جادویی کمتر، تفکر واضح‌تر

مهندسی پرامپت Sora 2: کلمات جادویی کمتر، تفکر واضح‌تر

به‌روزرسانی شده در 9 اکتبر 2025

15 دقیقه


مشکل «مهندسی Prompt» در Promptها نیست

نکته در مورد مهندسی Prompt برای <b translate="no">Sora 2</b> این است که همه وانمود می‌کنند آن را می‌فهمند—تا زمانی که ویدیوی آن‌ها شبیه یک تب‌لرزه فیلم‌برداری‌شده با سیب‌زمینی به نظر برسد. واکنش این است که کلمات بیشتری اضافه کنید، کمی اصطلاحات تخصصی بپاشید و امیدوار باشید که مدل ذهن‌ها را بخواند. این اتفاق نخواهد افتاد. <b translate="no">Sora 2</b> هوشمند است، همان‌طور که یک تکمیل خودکار عالی هوشمند است: شگفت‌انگیز، اما بسیار تحت‌اللفظی. منظور خود را بیان کنید. اصل مطلب را در یک فرهنگ لغت دفن نکنید.
دستگاه تبلیغاتی صنعت می‌خواهد مهندسی <b translate="no">Prompt</b> به کیمیاگری تبدیل شود. این‌طور نیست. این ویرایش است. این کارگردانی است. این شما هستید که مسئولیت گفتن آنچه را که می‌خواهید به یک ماشین، به زبانی که به هیچ وجه نمی‌تواند اشتباه متوجه شود، بر عهده می‌گیرید. بقیه—«ورد‌های مخفی»، جادوی کپی-پیست—تا زمانی که کار نکند، کار می‌کند. <b translate="no">Sora 2</b> بهتر از این است. با آن مانند یک همکار رفتار کنید که هر آنچه را که می‌گویید به معنای ظاهری می‌پذیرد و هرگز فیلم‌های روزانه را تماشا نمی‌کند.

درباره چه چیزی واقعاً صحبت می‌کنیم

بیایید مشخص باشیم: مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> هنر نوشتن متن <b translate="no">Prompt</b> (و در صورت وجود، ورودی‌ها و کنترل‌های مرجع) است که ویدیوی منسجم و قابل کنترلی را به دست می‌دهد. نه «الهام». نه «حس و حال». شما در حال نوشتن محدودیت‌ها هستید—موضوع، عمل، دوربین، نورپردازی، سبک، مدت، سرعت و تداوم—بنابراین مدل یک اسب بنفش را در نیمه راه منظره شهری شما اختراع نمی‌کند.
بهترین راه برای فکر کردن به آن: شما در حال استوری‌بورد کردن با کلمات هستید. هرچه <b translate="no">Prompt</b> شما شبیه یک لیست شات محکم با یک نقطه نظر باشد، <b translate="no">Sora 2</b> بیشتر رفتار می‌کند. هرچه شل‌تر باشد—صفت‌های دست‌وپاگیر، پنج سبک هنری رقیب، اسکیزوفرنی زمان روز—بیشتر خروجی شبیه یک کلاژ از چیزهایی است که مدل نیمه‌به‌یاد می‌آورد.

چارچوب ساده برای <b translate="no">Prompt</b>های <b translate="no">Sora 2</b>

من هم چارچوب‌ها را دوست ندارم، اما این یکی ارزش خود را دارد. <b translate="no">Prompt</b>های <b translate="no">Sora 2</b> را به عنوان پنج لایه روی هم در نظر بگیرید. می‌توانید هر لایه‌ای را که نیاز ندارید نادیده بگیرید، اما اگر لایه‌ای از دست رفته باشد، مدل آن را با کلیشه‌ها پر می‌کند.
  1. موضوع و هدف («چه» و «چرا»)
  • یک موضوع اصلی. شاید یک موضوع پشتیبان. همین.
  • هدف: بیننده چه احساسی باید داشته باشد یا چه چیزی را درک کند.
  • مثال: «یک دوچرخه‌سوار تنها در سپیده‌دم از روی یک پل مه‌آلود عبور می‌کند تا عزم و اراده و شجاعت خاموش را نشان دهد.»
  1. حقایق صحنه («کجا» و «چه زمانی»)
  • زمان روز، آب و هوا، مشخصات مکان. اسم‌های عینی صفت‌های شاعرانه را شکست می‌دهند.
  • «ساعت طلایی» «نورپردازی زیبا» را شکست می‌دهد. «آسفالت خیس که نور نئون را منعکس می‌کند» «سایبرپانکی» را شکست می‌دهد.
  1. دوربین و حرکت («چگونه»)
  • نوع شات، حس لنز، حرکت دوربین، سرعت.
  • «دالی-این آهسته روی یک معادل ۵۰ میلی‌متری؛ ریزلرزش دستی به حداقل رسیده است» بهتر از «سینمایی» است.
  1. سبک بصری و محدودیت‌ها («ظاهر»)
  • یک مسیر زیبایی‌شناختی را انتخاب کنید: فوتورئال، فیلم ۱۶ میلی‌متری، انیمیشن سل، آبرنگ. ترکیب سه ظاهر درخواست آشفتگی زمانی است.
  • پالت، بافت و مراجع دوران را محدود کنید.
  1. تداوم و موارد ممنوعه («آن را ثابت نگه دارید»)
  • ویژگی‌های شخصیت، وسایل و جزئیات متعارف را قفل کنید.
  • منفی‌های صریح: «بدون تغییر لباس؛ بدون پوشش متن؛ بدون تغییر شکل اشیاء.»
مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> در مورد پر کردن کلمات بیشتر نیست؛ بلکه در مورد حذف روزنه‌ها است. شما در حال نوشتن قراردادی با یک همکار سرسخت و تحت‌اللفظی هستید. روزنه‌ها را ببندید.

لیست کوتاه کلماتی که شما را به دردسر می‌اندازند

  • «سینمایی». به معنای همه چیز و هیچ چیز است. آن را با دوربین، لنز و حرکتی که واقعاً می‌خواهید جایگزین کنید.
  • «حماسی». مترادف «تصمیم نگرفتم» است.
  • «فوق‌واقع‌گرایانه». بیش از حد روی منافذ تمرکز می‌کند، ترکیب را فراموش می‌کند.
  • «حس و حال». اگر نمی‌توانید حس و حال را با اسم نام ببرید، حس و حالی ندارید.
  • «سبک <b translate="no">AI</b> [نام هنرمند]». علاوه بر مسائل آشکار، مدل را با سبک سطحی بر روی ساختار اشتباه می‌گیرد. مواد مرجع، نه اعمال ادای احترام.
<b translate="no">Sora 2</b> به قصد احترام نمی‌گذارد؛ به دستورالعمل احترام می‌گذارد. اگر <b translate="no">Prompt</b> شما شبیه صدای تریلر است، انتظار برش‌های تریلر را داشته باشید: سریع، نامنسجم، همه لعاب.

یک دیالکتیک: اختصار در مقابل ویژگی

  • اردوگاه «<b translate="no">Prompt</b> کوتاه» استدلال می‌کند که <b translate="no">Sora 2</b> زمانی بهترین است که تنها گذاشته شود—فقط به مدل اعتماد کنید. گاهی اوقات درست است. کوتاه زمانی خوب است که مفهوم شما نمادین و از نظر بصری بیش از حد تعیین شده باشد: «یک طوفان رعد و برق که در هنگام غروب خورشید بر فراز <b translate="no">Monument Valley</b> در حال غلتیدن است، شات عریض.» <b translate="no">Sora 2</b> آن را هزاران بار دیده است؛ پیشینه‌ها بقیه کار را انجام می‌دهند.
  • اردوگاه «<b translate="no">Prompt</b> رمان» دستورالعمل‌ها را انباشته می‌کند. گاهی اوقات ضروری است. اگر به تداوم در طول ۸ ثانیه نیاز دارید—همان ژاکت، همان سگ، همان فنجان قهوه—اختصار شما را می‌کشد. مشخص کنید یا رنج ببرید.
ترکیب: در جایی که پیشینه‌ها قوی هستند کوتاه باشید (صحنه‌های رایج، فیزیک آشنا)، در جایی که پیشینه‌ها ضعیف هستند (وسایل جدید، رقص‌نگاری پیچیده، نورپردازی مختلط، جزئیات مارک تجاری) به‌طور کامل مشخص باشید. اگر نمی‌دانید در کدام دسته قرار دارید، در دسته دوم هستید.

الگوهای عملی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> که واقعاً کار می‌کنند

از این‌ها مانند دستور العمل استفاده کنید، نه کتاب مقدس. براکت‌ها را پر کنید؛ پرزها را از بین ببرید.
  1. عمل تک موضوعی، دوربین کنترل شده <b translate="no">Prompt</b>: «ویدیوی فوتورئال، ۸ ثانیه. [موضوع] [یک عمل واحد را انجام می‌دهد] در [مکان] در [زمان روز]. سه‌پایه قفل شده، شات متوسط، سرعت طبیعی. نور ابری نرم؛ عمق میدان کم. کمد لباس ثابت: [توضیحات]. بدون برش، بدون متن، بدون گذر زمان.» چرا کار می‌کند: حرکت را محدود می‌کند، تداوم را قفل می‌کند، از تمایل مدل به مونتاژ جلوگیری می‌کند.
  1. ایجاد به جزئیات بدون برش ناگهانی <b translate="no">Prompt</b>: «۱۰ ثانیه. با شات ایجاد عریض از [مکان] شروع کنید؛ دالی-این آهسته ۵ ثانیه‌ای. در ثانیه ۶، به شات متوسط از [موضوع] آسان کنید، در حالی که قاب سمت چپ صفحه را حفظ می‌کنید. نور پس‌زمینه ساعت طلایی؛ شعله‌های لنز ظریف. پالت رنگ را نارنجی‌های گرم و آبی‌های خنثی نگه دارید. بدون تغییر فوکوس قفسه‌ای؛ بدون تغییر زاویه ناگهانی.» چرا کار می‌کند: توالی را به <b translate="no">Sora 2</b> آموزش می‌دهد بدون اینکه هرج و مرج را دعوت کند.
  1. انیمیشن سبک‌دار با عقل زمانی <b translate="no">Prompt</b>: «انیمیشن دستی، به سبک سل، ۱۲ <b translate="no">fps</b>. رنگ‌های تخت، طرح‌های ضخیم، پالت محدود [لیست ۴ رنگ]. [شخصیت] از چپ به راست از طریق [تنظیمات] راه می‌رود. دوربین پیمایشی جانبی؛ اختلاف منظر فقط روی پس‌زمینه. بدون چرخش دوربین، بدون تغییرات پرسپکتیو. پایان حلقه‌پذیر: شخصیت از قاب سمت راست خارج می‌شود.» چرا کار می‌کند: سبک‌های انیمیشن غنی از پیشینه هستند اما به تغییرات دوربین حساس هستند. صفحه را قفل کنید.
  1. آب و هوا و بافت به عنوان سرنخ <b translate="no">Prompt</b>: «نمای نزدیک ماکرو از [سطح]، ۶ ثانیه، سه‌پایه. قطرات باران در حال تشکیل و ادغام شدن، در زمان واقعی. نور بالایی نرم، پس‌زمینه تاریک. صدا ضمنی است اما هیچ‌کدام قابل مشاهده نیست. بدون برش، بدون افراد انسانی، بدون بازتاب دوربین.» چرا کار می‌کند: پیشینه‌های بافت قوی هستند؛ محدودیت‌ها از نفوذهای وهم‌آور جلوگیری می‌کنند.
  1. میکرو-درام بدون گفتگو <b translate="no">Prompt</b>: «فوتورئال، ۹ ثانیه. [شخصیت الف]، [سن/جنسیت]، در [کمد لباس خاص]، در [مکان] منتظر است. او یک پیامک را بررسی می‌کند، به آرامی لبخند می‌زند، گوشی را در جیبش می‌گذارد. نمای متوسط بالای شانه؛ <b translate="no">DOF</b> کم؛ <b translate="no">bokeh</b> شهری. حرکت طبیعی دست، بدون حرکت لب. طول مو را [دقیق] نگه دارید، انگشتر در طول فیلم روی انگشت اشاره دست چپ قرار دارد. بدون تغییر مدل شخصیت پس‌زمینه.» چرا کار می‌کند: ضرب‌های کوچک در مقیاس انسانی؛ لنگرهای تداوم <b translate="no">Sora 2</b> را از تعویض وسایل یا چهره‌ها در اواسط کلیپ باز می‌دارند.

مشکل تداوم (و نحوه متوقف کردن باختن به آن)

بزرگ‌ترین ترفند مهمانی <b translate="no">Sora 2</b> همچنین پاشنه آشیل آن است: آن اختراع می‌کند. این عالی است تا زمانی که فنجان قهوه بین فریم‌ها در سراسر میز مهاجرت کند. شکستگی‌های تداوم در مدل‌های مولد پخته می‌شوند؛ آن‌ها هر لحظه را با تعصب برای مطابقت با آخرین حدس می‌زنند. وقتی <b translate="no">Prompt</b> شما مبهم است، حدس‌ها منحرف می‌شوند.
رفع‌هایی که جادویی نیستند:
  • اسم‌های مفرد را قفل کنید. «یک فنجان سرامیکی قرمز با لبه شکسته در سمت شرق میز.» نه «یک فنجان».
  • کمد لباس را فریز کنید. «ژاکت جین آبی با دو جیب سینه، دکمه‌های مسی، بدون وصله. تغییر نکند.»
  • فضای منفی را فرماندهی کنید. «میز خالی؛ هیچ چیز جز فنجان.» اگر آن را ممنوع نکنید، مدل آن را پر می‌کند.
  • حرکات دوربین را محدود کنید. هر محور حرکتی اضافی فرصتی برای شکستن تداوم است.
  • از ضرب‌های لنگر استفاده کنید. «در ثانیه ۳، سوژه به پایین نگاه می‌کند؛ در ثانیه ۶، سوژه به طور قابل مشاهده بازدم می‌کند.» وقتی زمان صریح است، انحراف فضای کمتری برای خزیدن دارد.
مهندسی <b translate="no">Prompt</b> برای <b translate="no">Sora 2</b> تا حد زیادی مهندسی تداوم است. این را بپذیرید و خروجی‌های شما یک درجه جهش می‌کنند.

سبک یک لباس نیست، بلکه یک محدودیت است

مردم «وس اندرسون» را همان‌طور می‌خواهند که «اسپرسو» را می‌خواهند—که معمولاً به این معنی است که شکر می‌خواهند. سبک یک لباس نیست که بتوانید روی هر موضوعی بپوشانید. در <b translate="no">Sora 2</b>، سبک قوانینی را انتخاب می‌کند که مدل از آن‌ها استفاده می‌کند: رنگ، ترکیب، حرکت، حتی رفتار لنز.
یکی را انتخاب کنید:
  • فوتورئال: منافذ پوست، انحرافات لنز، فیزیک واقع‌گرایانه. برای محصولات و احساسات انسانی عالی است. برای <b translate="no">Prompt</b>های بی‌دقت بی‌رحم است.
  • شبیه‌سازی فیلم (<b translate="no">16mm</b>، <b translate="no">35mm</b>): دانه درشت، هالاسیون، <b translate="no">rolloff</b> نرم‌تر، اشباع کمتر. در صورت لزوم استفاده کنید، دوره سهام را مشخص کنید و نورپردازی را ساده نگه دارید.
  • انیمیشن (سل، استاپ موشن، آبرنگ): به شبح‌های واضح، طرح‌های ثابت و صفحات دوربین قفل شده علاقه دارد. جزئیات بیش از حد تداوم زمانی را خراب می‌کند.
  • گرافیکی/تصویری: تن‌های تخت، کنتراست بالا، هندسه جسورانه. زمانی کار می‌کند که حرکت حداقل و سنجیده باشد.
اشتباه این است که نورپردازی فوتورئال را با هنر خط تصویری درخواست کنید. این می‌تواند اتفاق بیفتد، اما انتظار سر و صدای زمانی را داشته باشید زیرا مدل با خودش بحث می‌کند.

افسانه «صفت‌های بیشتر = ویدیوی بهتر»

اگر خروجی‌های خاصی می‌خواهید، از اسم‌ها و فعل‌های خاص استفاده کنید. صفت‌ها تزیین هستند:
  • بد: «یک شات سینمایی، حماسی و فوق‌واقع‌گرایانه از یک ماشین زیبا که به سرعت در یک شهر سایبرپانک آینده‌نگر مسابقه می‌دهد.»
  • خوب: «شات فوتورئال، ۶ ثانیه. یک <b translate="no">Datsun 240Z</b> مدل ۱۹۷۱ به رنگ نارنجی از طریق <b translate="no">Shibuya</b> در شب در باران سبک خط‌کشی می‌کند. دوربین نصب شده روی کاپوت، معادل ۲۴ میلی‌متری، تاری حرکت جزئی، آسفالت خیس که علائم نئون را منعکس می‌کند. تراکم ترافیک را متوسط نگه دارید؛ بدون ماشین پلیس؛ بدون نمای نزدیک آرم.»
<b translate="no">Prompt</b> خوب فریاد نمی‌زند. دقیقاً به شما می‌گوید چه اتفاقی می‌افتد، کجا، چگونه و چه کاری نباید انجام دهید.

چه زمانی واقعاً باید از <b translate="no">Prompt</b>های طولانی استفاده کنید

  • اقدام چند ضربه‌ای در یک برداشت. اگر دوربین یا سوژه باید در زمان‌های دقیق رفتار خود را تغییر دهند، آن را مشخص کنید.
  • محتوای مارک تجاری یا تنظیم شده. شما نمی‌توانید آرم‌های خیالی یا رفتارهای ناایمن را بپردازید. <b translate="no">Prompt</b>های منفی غیرقابل مذاکره می‌شوند.
  • اشیاء یا جهان‌های اختراع شده. اگر در حال ساختن «چتر شیشه‌ای هستید که نور خیابان را منکسر می‌کند»، ساخت و رفتار را تعریف کنید.
  • همکاری با پس از تولید. اگر می‌دانید که کامپوزیت خواهید کرد، نورپردازی، تاری حرکت و تمیزی صفحه را محدود کنید.
در غیر این صورت، با پرحرفی مانند نمک رفتار کنید. می‌توانید آن را اضافه کنید؛ نمی‌توانید آن را پس بگیرید.

تکرار: راز کسل‌کننده

افراد خلاق دوست دارند فکر کنند که اولین تلاش باید هیجان‌انگیز باشد. <b translate="no">Sora 2</b> به اندازه کافی سریع است که می‌توانید کسل‌کننده و روشمند باشید:
  • خنثی شروع کنید. یک موضوع، یک عمل، یک دوربین. تداوم ناخن.
  • هر بار یک چیز را تغییر دهید. اگر نورپردازی و دوربین را در یک پاس تغییر دهید، نمی‌دانید چه چیزی خراب شده است.
  • یک <b translate="no">changelog</b> از <b translate="no">Prompt</b>ها و خروجی‌ها نگه دارید. حتی یک سند <b translate="no">Google</b>. شما از آینده از شما تشکر خواهید کرد.
  • در صورت وجود، از استفاده مجدد از دانه حمایت کنید. کنترل باعث ایجاد قابلیت پیش‌بینی می‌شود.
هیجان در پیش‌نویس سوم است، زمانی که ویدیو در نهایت رفتار می‌کند و شما قسم می‌خورید که هیچ کاری نکرده‌اید. شما این کار را کردید: شما از دادن بهانه‌ها به مدل دست برداشتید.

حفاظ‌هایی که ساعت‌ها را ذخیره می‌کنند

  • زبان زمانی مهم است. «در ثانیه ۴» «بعداً» را شکست می‌دهد.
  • لنگرهای فضایی مهم هستند. «سمت چپ صفحه» «به سمت چپ» را شکست می‌دهد.
  • فیزیک مهم است. پنج چیزی را که فیزیک اساسی را نقض می‌کنند درخواست نکنید. مدل با تماشای جهان فیزیک را آموخته است؛ آن را <b translate="no">gaslight</b> نکنید.
  • چهره‌ها سخت هستند. زاویه سر، نورپردازی و فاصله را قفل کنید اگر ثبات می‌خواهید. از فشار سریع روی صورت‌ها خودداری کنید مگر اینکه ذوب شدن را دوست داشته باشید.
  • جمعیت‌ها هرج و مرج هستند. اگر مجبور هستید، آن‌ها را با عمق میدان یا نور کم تار کنید. عوامل اضافی را ستاره نکنید.

یک الگوی کارآمد برای مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b>

کپی کنید، سپس سفارشی کنید. هر خطی را که نیاز ندارید از بین ببرید.
عنوان/برچسب: مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b> — [نام پروژه]
هدف: [آنچه می‌خواهید بیننده در یک جمله احساس کند یا فکر کند.]
مدت: [X] ثانیه، شات پیوسته تکی. بدون برش مگر اینکه ذکر شده باشد.
موضوع: یک [موضوع واضح]، [سن/توضیحات]، [مشخصات کمد لباس].
صحنه: [مکان]، [زمان روز]، [آب و هوا]. وسایل کلیدی: [اسم‌ها]. فضای منفی: [آنچه باید خالی بماند].
دوربین: [نوع شات]، [حس لنز]، [حرکت]، [سرعت]. افق را [تراز/کج] نگه دارید. قاب‌بندی: موضوع [موقعیت صفحه] باقی می‌ماند.
نورپردازی: [منبع]، [کیفیت]، [جهت]. از [مصنوعات نورپردازی نامطلوب] خودداری کنید.
سبک: [فوتورئال / فیلم / انیمیشن سل / دیگر]، پالت [لیست چند رنگ]. بافت/دانه [در صورت وجود].
جدول زمانی عمل:
  • ۰ ثانیه – ۲ ثانیه: [ضرب]
  • ۲ ثانیه – ۵ ثانیه: [ضرب]
  • ۵ ثانیه – پایان: [ضرب]
قفل‌های تداوم: [جزئیات کمد لباس]، [حالت وسیله]، [رنگ مو/چشم]، [بدون پوشش متن]، [بدون تعویض آرم].
منفی‌ها: بدون تغییر شکل، بدون برش پرشی، بدون گذر زمان، بدون علامت‌گذاری خیالی، بدون بازتاب دوربین.

بررسی واقعیت: ابزارها جایگزین سلیقه نمی‌شوند

می‌توانید تمیزترین <b translate="no">Prompt</b> <b translate="no">Sora 2</b> را روی زمین بنویسید و اگر سلیقه شما خاموش باشد، همچنان یک کلیپ غیرقابل تماشا دریافت کنید. ترکیب، ریتم، نور. این‌ها مد نیستند؛ آن‌ها قوانین هستند و <b translate="no">Sora 2</b> شما را از یادگیری آن‌ها معاف نمی‌کند. بسیاری از «مهندسی <b translate="no">Prompt</b>» طراحی با حذف است: اجازه ندهید مدل کار مبتذلی را که می‌خواهد انجام دهد. اجازه ندهید وقتی احساس نیاز به سکون دارد، دوربین را بچرخاند.
اگر یک ابرقدرت پنهان برای مهندسی <b translate="no">Prompt</b> <b translate="no">Sora 2</b> وجود داشته باشد، آن خویشتن‌داری است. کمتر بخواهید، بیشتر بگیرید. همه چیز را بخواهید، سوپ بگیرید.

کجا <b translate="no">Sider.AI</b> واقعاً کمک می‌کند (و کجا کمک نمی‌کند)

<b translate="no">Sider.AI</b> واقعاً کار می‌کند—حداقل زمانی که از آن برای چیزی استفاده می‌کنید که در آن خوب است، که به اندازه کافی عجیب، چیزی نیست که همه در مورد آن لاف می‌زنند. این دکمه «هنر بساز» نیست. این دستیار «محدودیت‌های واضح را فراموش نکن» است. <b translate="no">Prompt</b> <b translate="no">Sora 2</b> خود را پیش‌نویس کنید، سپس اجازه دهید <b translate="no">Sider.AI</b> آن را مانند یک ویرایشگر کد برای معنا <b translate="no">lint</b> کند: صفت‌های نامحدود، حرکات دوربین متناقض، قفل‌های تداوم از دست رفته را علامت‌گذاری می‌کند. این یک تلنگر است که می‌گوید: «شما در همان زمان درخواست دستی و سه‌پایه کردید.»
جایی که کمک نخواهد کرد: اختراع سلیقه، یا حل تردید. اگر نمی‌دانید که کلیپ شما دالی می‌خواهد یا قفل، هیچ ابزاری نمی‌تواند به این سوال پاسخ دهد. اما هنگامی که تصمیم گرفتید، <b translate="no">Sider.AI</b> در ایجاد <b translate="no">Prompt</b> واضح، قابل تکرار و مهربانانه کوتاه خوب است.

مثال‌های کار شده: قبل و بعد

مثال ۱: شات قهرمان محصول
  • قبل: «شات سینمایی، حماسی از ساعت هوشمند جدید ما روی یک میز مرمر، نورپردازی چشمگیر، قطرات آب، فوق‌العاده دقیق.»
  • بعد: «ماکرو فوتورئال، ۶ ثانیه. ساعت هوشمند ما (۴۱ میلی‌متری، آلومینیوم نقره‌ای، بند فلوروالاستومر سیاه) روی مرمر سفید مات. سه‌پایه ثابت؛ دالی-این آهسته ۲% شبیه‌سازی شده، نه دستی. یک <b translate="no">softbox</b> بالایی تکی؛ مه سبک روی کریستال قطرات کوچک تشکیل می‌دهد. صفحه خاموش، تاج در ساعت ۳. بدون آرم به جز مال ما؛ بدون پوشش متن.» چه چیزی تغییر کرد: هر متغیری بسته شد؛ بدون «حماسی». نتیجه مانند یک لیست شات خوانده می‌شود، نه یک تابلوی <b translate="no">mood</b>.
مثال ۲: صحنه خیابان با یک ضربه انسانی
  • قبل: «یک صحنه شهری سایبرپانک جالب که در آن یک نفر با حس و حال نئون راه می‌رود، سینمایی.»
  • بعد: «۸ ثانیه، فوتورئال. خیابان فرعی <b translate="no">Shinjuku</b> در شب در باران سبک؛ آسفالت خیس که علائم نئون را منعکس می‌کند. یک نفر: زن، ۳۰ ساله، ترانچ آبی سرمه‌ای، کفش ورزشی سفید، مدل موی <b translate="no">bob</b> مشکی کوتاه. متوسط-عریض، هم‌سطح چشم، <b translate="no">steady-cam</b> با تثبیت ملایم؛ سوژه سمت راست صفحه باقی می‌ماند و به سمت دوربین حرکت می‌کند. پالت آبی‌های سرد با سرخابی گاه‌به‌گاه. بدون علامت‌گذاری به زبان انگلیسی؛ بدون چتر؛ بدون تعویض لنز.» چه چیزی تغییر کرد: یک موضوع، یک حرکت، زبانی که معنایی دارد. کلیپ منسجم می‌شود.
مثال ۳: حلقه سبک‌دار
  • قبل: «یک حلقه متحرک عجیب و غریب از یک گربه در یک جنگل جادویی، حس و حال استودیو <b translate="no">Ghibli</b>.»
  • بعد: «انیمیشن به سبک سل، ۱۲ <b translate="no">fps</b>. گربه <b translate="no">Calico</b> روی یک کنده خزه‌ای در یک پاکسازی کوچک می‌نشیند؛ کرم‌های شب‌تاب شناور هستند. دوربین قفل شده، از کنار. پالت محدود: سبز جنگلی، زرد کم رنگ، قهوه‌ای گرم، کرم. نسیم ملایم برگ‌ها را به حرکت در می‌آورد. دم گربه هر ۲ ثانیه یکبار تکان می‌خورد. پایان حلقه‌پذیر: نسیم و کرم‌های شب‌تاب به موقعیت‌های اولیه باز می‌گردند؛ بدون لرزش دوربین.» چه چیزی تغییر کرد: بدون نام بردن؛ سبک با قوانین تعریف می‌شود، نه مراجع.

مهندسی <b translate="no">Prompt</b> برای تیم‌های <b translate="no">Sora 2</b>

اگر با سهامداران کار می‌کنید، بزرگ‌ترین دشمن شما اجماع با صفت است. همه «انرژی بیشتر» و «سینمایی‌تر» می‌خواهند انگار یک دکمه است. صفت‌ها را با انتخاب‌ها جایگزین کنید.
  • یک مشخصات <b translate="no">Prompt</b> ایجاد کنید که حداکثر یک صفحه باشد. این یک لیست شات در جملات است.
  • یک چک لیست تأیید اضافه کنید: مدت، تعداد موضوع، دوربین، نورپردازی، سبک، قفل‌های تداوم، منفی‌ها. اگر یک جعبه علامت نخورده باشد، کارتان تمام نشده است.
  • <b translate="no">Prompt</b>ها را در کنار خروجی‌ها و یادداشت‌ها ذخیره کنید. آن‌ها را نسخه کنید. «<b translate="no">Prompt</b>های طلایی» شما به دارایی تبدیل می‌شوند.
تیم‌هایی که با <b translate="no">Prompt</b>های <b translate="no">Sora 2</b> مانند اسناد تولید رفتار می‌کنند، نتایجی می‌گیرند که به نظر می‌رسد تولید شده‌اند، نه کشف شده‌اند.

عیب‌یابی بدون کارت‌های تاروت

  • به طور غیرمنتظره قطع می‌شود. احتمالاً یک برش را القا کرده‌اید («در همین حال»، «ناگهان»، کنش‌های متعدد) یا از زبان مونتاژ استفاده کرده‌اید. «تک‌شات پیوسته» را اجباری کنید و ضرباهنگ‌های رقیب را حذف کنید.
  • چهره‌ها مدام تغییر شکل می‌دهند. جهت‌گیری سر، فاصله و نورپردازی را قفل کنید. حرکت را کاهش دهید و از زوم‌های سریع خودداری کنید. صفت‌های کمتری در مورد احساسات، و صفت‌های بیشتری در مورد کنش فیزیکی استفاده کنید.
  • وسایل صحنه تله‌پورت می‌شوند. نام وسیله را ببرید، موقعیت آن را نسبت به قاب یا صحنه تعیین کنید و از حرکت آن مگر در صورت مشخص شدن، خودداری کنید. از عبارت «در تمام مدت در [موقعیت] باقی می‌ماند» استفاده کنید.
  • نما شلوغ به نظر می‌رسد. شما اجازه داده‌اید مدل فضا را پر کند. فضای منفی را تعریف کنید و حرکت پس‌زمینه را کاهش دهید.
  • استایل سوسو می‌زند. شما دو ظاهر درخواست کرده‌اید. یکی را انتخاب کنید، یا انتقال‌ها را در بازه‌های زمانی مشخص اجازه دهید.

سخنی در باب اخلاق و منشاء

مهندسی پرامپت شما را از فکر کردن در مورد منابع مبرا نمی‌کند. اگر هدف شما رسیدن به ظاهر یک هنرمند زنده است، از خود بپرسید چرا. اگر پاسخ این است «چون محبوب است»، شما از قبل داستان را باخته‌اید. بینش‌های ساختاری - بلاک‌بندی رنگ، عدم تقارن، عمق میدان کم - را بگیرید و آنها را توصیف کنید. چیزی تمیزتر، سازگارتر و متعلق به خودتان به دست خواهید آورد.

نتیجه‌گیری آرام

مهندسی پرامپت Sora 2، در بهترین حالت خود، روی کاغذ کسل‌کننده و به طرز شگفت‌آوری روی صفحه نمایش تکان‌دهنده است. نه به این دلیل که کلمات جادویی را پیدا کرده‌اید، بلکه به این دلیل که به ماشین اجازه نداده‌اید در بخش‌های مهم، بداهه‌پردازی کند. نکته خنده‌دار در مورد کارگردانی یک مدل این است که همان انضباطی را پاداش می‌دهد که مجموعه‌های واقعی انجام می‌دهند: موضوع خود را بشناسید، نمای خود را قفل کنید، با قصد نورپردازی کنید، از دزدیدن صحنه توسط پس‌زمینه جلوگیری کنید.
اگر یک مانترا می‌خواهید، این یکی را در نظر بگیرید: صفت‌های کمتر، اسم‌های بیشتر؛ حس‌های کمتر، فعل‌های بیشتر. منظور خود را بیان کنید. مدل دقیقاً همان کار را انجام خواهد داد - نه بیشتر، نه کمتر. که نکته اصلی است.

یادداشت‌های کلیدواژه (برای کسانی که اهمیت می‌دهند)

این قطعه به مهندسی پرامپت Sora 2 می‌پردازد، از جمله نحوه نوشتن پرامپت‌های واضح برای Sora 2، مثال‌هایی از پرامپت‌های ویدیویی Sora 2، قفل‌های تداوم، دستورالعمل‌های دوربین و محدودیت‌های سبک. اگر تا اینجا خوانده‌اید، تبریک می‌گویم: اکنون می‌دانید چرا «سینمایی» کمترین کلمه سینمایی در این تجارت است.

سوالات متداول

سوال 1: مهندسی پرامپت Sora 2 واقعاً چیست؟ این نوشتن دستورالعمل‌های دقیق برای نما (shot-accurate) برای Sora 2 است - موضوع، دوربین، نورپردازی، سبک و تداوم - به طوری که مدل نتواند شما را اشتباه بخواند. هرچه روزنه‌های کمتری در پرامپت Sora 2 شما وجود داشته باشد، ویدیو بهتر خواهد بود.
سوال 2: چگونه پرامپت‌های بهتری برای Sora 2 بنویسم بدون اینکه شبیه یک شاعر به نظر برسم؟ از اسم‌ها و فعل‌ها استفاده کنید: چه کسی چه کاری را کجا و چگونه انجام می‌دهد. برای مهندسی پرامپت Sora 2، «سینمایی» را با لنز، حرکت و زمان‌بندی جایگزین کنید؛ «حس (vibe)» را با حقایق صحنه و فضای منفی جایگزین کنید.
سوال 3: چرا ویدیوی Sora 2 من مدام در وسط نما لباس‌ها و وسایل صحنه را تغییر می‌دهد؟ رانش تداوم. کمد لباس، موقعیت وسایل صحنه و ویژگی‌های شخصیت را به طور صریح در پرامپت Sora 2 قفل کنید و از تعویض خودداری کنید. اگر از آن جلوگیری نکنید، مدل آن را بازی جوانمردانه تلقی می‌کند.
سوال 4: آیا پرامپت‌های Sora 2 باید کوتاه باشند یا طولانی؟ زمانی که به پیش‌فرض‌های قوی تکیه می‌کنید (صحنه‌های ساده و نمادین) کوتاه، و زمانی که به جزئیات جدید یا ضرباهنگ‌های زمان‌بندی شده نیاز دارید، طولانی. در مهندسی پرامپت Sora 2، اطناب یک ابزار است، نه یک فضیلت.
سوال 5: سریع‌ترین راه برای بهبود نتایج Sora 2 امروز چیست؟ صفت‌ها را حذف کنید، دوربین را قفل کنید و یک موضوع و عمل واحد را مشخص کنید. قفل‌های تداوم و منفی‌ها را اضافه کنید - مهندسی پرامپت Sora 2 بیشتر در مورد بستن روزنه‌ها است.

مقالات اخیر
چگونه در ChatPDF مهارت پیدا کنیم: دسترسی سریع‌تر به اطلاعات از اسناد حجیم

چگونه در ChatPDF مهارت پیدا کنیم: دسترسی سریع‌تر به اطلاعات از اسناد حجیم

بهترین جایگزین X Auto-Translation برای ترجمه سریع و دقیق اسناد

بهترین جایگزین X Auto-Translation برای ترجمه سریع و دقیق اسناد

عدم دسترسی به ترجمه هوش مصنوعی سامسونگ در ایران؟ راهکارهای عملی

عدم دسترسی به ترجمه هوش مصنوعی سامسونگ در ایران؟ راهکارهای عملی

ابزارهای ترجمه فارسی: راهنمای عملی برای کار سریع‌تر و دقیق‌تر

ابزارهای ترجمه فارسی: راهنمای عملی برای کار سریع‌تر و دقیق‌تر

بهترین جایگزین Grok برای تحقیقات عمیق و مستند

بهترین جایگزین Grok برای تحقیقات عمیق و مستند

۱۵ ویژگی برتر تولیدکننده تصویر هوش مصنوعی که واقعاً از آنها استفاده خواهید کرد

۱۵ ویژگی برتر تولیدکننده تصویر هوش مصنوعی که واقعاً از آنها استفاده خواهید کرد