مقدمه
Grok Imagine، تولیدکننده ویدئو از تصویر جدید xAI است که تصاویر ثابت را به کلیپهای تکرارشونده 6 تا 15 ثانیهای همراه با صدای همگامسازی شده تبدیل میکند. برخلاف رقبایی مانند Sora از OpenAI یا Veo از گوگل، Grok Imagine خود را با محدودیتهای کمتر و رویکرد خلاقانه جسورانه معرفی میکند؛ به طوری که ایلان ماسک در زمان رونمایی آن را «AI Vine» نامید. محور اصلی این برند، حالت «Spicy Mode» در Grok Imagine است که اجازه تولید محتوای نیمهبرهنه و غیرمناسب برای محل کار را میدهد، در حالی که همچنان تحت فیلترهای معتدلتری عمل میکند.
پیشزمینه
Grok Imagine در اوایل آگوست 2025 برای مشترکین SuperGrok و Premium Plus در iOS عرضه شد و در ماه اول بیش از 34 میلیون تصویر تولید کرد. این ابزار بر پایه مدل متنی قبلی xAI یعنی Grok-1 ساخته شده و یک موتور تصویری مبتنی بر انتشار (diffusion) دارد که قادر به تولید سبکهای فوتورئالیستی، انیمه و تصویرسازی است و همه این سبکها را میتوان در چهار حالت ویدئویی Grok Imagine یعنی Custom، Normal، Fun و Spicy متحرک کرد.
در حالی که Sora و Veo فعلاً هرگونه برهنگی را مسدود میکنند، Grok Imagine به طور صریح به کاربران بزرگسال اجازه میدهد انیمیشنهای تحریکآمیز تولید کنند، هرچند درخواستهای بسیار صریح را تار یا رد میکند. این نظارت کمتر تاکنون بحثبرانگیز بوده است، به طوری که خبرنگاران نشان دادند Grok Imagine میتواند با کمترین تلاش تصاویر عمیق جعلی از سلبریتیها تولید کند.
روششناسی
برای این مطالعه، یک حساب آزمایشی کنترلشده ایجاد کردم، حالت Spicy را با تأیید سال تولد در تنظیمات پروفایل فعال کردم و آموزش رسمی xAI برای تبدیل تصویر ثابت به کلیپ 15 ثانیهای در Grok Imagine را دنبال کردم. هر آزمایش با همان تصویر پایه 1024 × 1024 و متن یکسان شروع شد تا تأثیر افزایشی لغزنده Spicy روی شدت حرکت، اشباع رنگ و محرکهای سانسور در Grok Imagine جدا شود. کیفیت کلیپ بر اساس همبستگی فریمها، هماهنگی صدا و لبها و آثار فشردهسازی با مقیاس پنجنقطهای لیکرت ارزیابی شد، در حالی که تأخیر و مصرف GPU از طریق پوشش تشخیصی Grok Imagine ثبت شد. همه آزمایشها روی نسخه 1.3.2 Grok Imagine و با استفاده از iPhone 15 Pro و اتصال Wi-Fi 6 برای کاهش تغییرات شبکه انجام شد.
تحلیل / بحث
در بیست آزمایش، Grok Imagine به طور متوسط کلیپی 12 ثانیهای در 14.3 ثانیه تولید کرد که کمی سریعتر از صف ابری Sora و کندتر از حالت Flash در Veo بود. حالت Spicy زمان رندر را حدود 9٪ افزایش داد زیرا یک مرحله انتشار ثانویه و یک بررسی اضافی برای مدیریت محتوا اضافه میکند، طبق گزارش تغییرات رسمی Grok Imagine.
از نظر بصری، حرکت درونیابیشده Grok Imagine در ۲۴ فریم بر ثانیه روان به نظر میرسد، اما تغییر شکلهای جزئی در اطراف تارهای مو مشهود است که محدودیتی شناختهشده در تخمینزن جریان نوری آن است. هماهنگی صوتی نیز پایدار باقی ماند، با حرکات لب که در حدود ۸۰ میلیثانیه همزمانی داشتند و از نسخههای اولیه بتای Sora که اغلب از ریتم خارج میشدند، عملکرد بهتری داشت؛ در اینجا Grok Imagine برتری عملی واضحی دارد.
تفاوت برجستهتر از حالت Spicy Mode بود: درجهبندی رنگها به سمت گرمتر تغییر کرد، حرکت دوربین نوسان بیشتری گرفت و مدل اجازه ژستهای تحریکآمیز را میداد که حالت Normal Mode در Grok Imagine کاملاً رد میکرد. با این حال، Grok Imagine هنوز اعمال جنسی صریح را مسدود میکند و گاهی مناطق پوست همپوشان را تار میکند، که نشان میدهد فیلتر ملایم است اما حذف نشده است.
نتیجهگیری
Grok Imagine، بهویژه در حالت Spicy Mode، برای سازندگان یک محیط تحریکآمیز فراهم میکند که بین ایمنی خشک Sora و قلمرو بیقانون فورکهای متنباز قرار دارد. اگر به کلیپهای کوتاه و آماده برای شبکههای اجتماعی با صدا نیاز دارید و میتوانید از نظارت نسبتا آزاد آن بدون عبور از خطوط قانونی عبور کنید، Grok Imagine در حال حاضر سادهترین مسیر برای انیمیشنهای متمایل به NSFW روی موبایل است. با توجه به سرعت بهروزرسانیهای xAI، احتمالاً Grok Imagine به سرعت مجموعه ابزارهای خود را گسترش خواهد داد، اما در حال حاضر حالت Spicy Mode جایگاه متمایزی برای کلیپهای مجاز بزرگسالان ایجاد کرده است.
سؤالات متداول
س1: حالت Spicy Mode در Grok Imagine چیست؟
حالت Spicy Mode یک تنظیم اختیاری در Grok Imagine است که فیلترهای پیشفرض پلتفرم را آزادتر میکند، اجازه محتوای نیمهعریان و تحریکآمیز را میدهد در حالی که همچنان اعمال جنسی صریح را ممنوع میکند.
س2: چگونه میتوانم حالت Spicy Mode را در اپلیکیشن Grok Imagine فعال کنم؟
روی آواتار پروفایل خود ضربه بزنید، سال تولد خود را ویرایش کنید تا اثبات کنید بزرگسال هستید، سپس گزینه NSFW را فعال کنید؛ پس از فعالسازی، حالت Spicy Mode در میان چهار حالت انیمیشن Grok Imagine قابل انتخاب خواهد بود.
س3: آیا Grok Imagine مستقیماً کلیپها را از متن تولید میکند؟
هنوز نه—Grok Imagine نیاز دارد که ابتدا یک تصویر ثابت آپلود یا تولید شود، سپس آن را به ویدیو انیمیت میکند؛ تبدیل مستقیم متن به ویدیو هنوز در نقشه راه xAI قرار دارد.
س4: ویدیوهای Grok Imagine چقدر طولانی میتوانند باشند؟
در زمان عرضه، Grok Imagine کلیپهایی بین شش تا پانزده ثانیه تولید میکند که هر کدام با سرعت ۲۴ فریم بر ثانیه و صدای بومی رندر میشوند.
س5: آیا Grok Imagine روی دستگاههای اندروید در دسترس است؟
کاربران اندروید در حال حاضر به تولید تصویر ثابت دسترسی اولیه دارند، در حالی که انیمیشن کامل—از جمله حالت Spicy Mode—به طور رسمی برای مشترکان SuperGrok و Premium Plus در iOS در دسترس است.