簡介
Grok Imagine 是 xAI 新推出的影像轉影片生成器,能將靜態圖片轉換成帶有同步音訊的 6 到 15 秒循環短片。與 OpenAI 的 Sora 或 Google 的 Veo 等競爭對手不同,Grok Imagine 以較少的限制和大膽前衛的創作理念自居,Elon Musk 在發布時甚至稱其為「AI Vine」。其中核心特色是 Grok Imagine 的「Spicy 模式」,該設定允許半裸及其他不適合公開場合(NSFW)的內容,同時仍在較寬鬆的審查範圍內運作。
背景
Grok Imagine 於 2025 年 8 月初向 iOS 上的付費 SuperGrok 和 Premium Plus 用戶推出,首月內迅速累積超過 3400 萬張圖片。此工具基於 xAI 先前的文字模型 Grok-1,並新增了擴散式視覺後端,能支援寫實、動漫及插畫風格,所有風格皆可在 Grok Imagine 的四種影片模式中進行動畫製作:自訂、普通、有趣及 Spicy。
目前 Sora 和 Veo 都會封鎖任何形式的裸體內容,但 Grok Imagine 明確允許成年用戶生成較辣的動畫,儘管對過於露骨的提示會進行模糊處理或拒絕。這種較寬鬆的控管已引發爭議,因為有記者示範 Grok Imagine 能夠輕鬆製作名人深偽裸體動畫。
方法論
本研究建立了一個受控實驗帳號,透過在個人資料設定中驗證出生年份啟用 Spicy 模式,並依照 xAI 官方教學將靜態圖片動畫化為 15 秒短片。每次實驗均使用相同的 1024 × 1024 基礎圖片與相同文字提示,以便隔離 Spicy 滑桿對動態強度、色彩飽和度及審查觸發的影響。短片品質透過畫面連貫性、音訊與口型同步以及壓縮失真,使用五點李克特量表評估;延遲與 GPU 使用率則透過 Grok Imagine 的診斷覆蓋層記錄。所有測試皆在 iPhone 15 Pro 上,使用 Wi-Fi 6 並運行 Grok Imagine 版本 1.3.2,以減少網路變異。
分析/討論
在 20 次試驗中,Grok Imagine 平均生成 12 秒短片所需時間為 14.3 秒,略快於 Sora 的雲端排隊時間,但慢於 Veo 的 Flash 模式。根據官方更新日誌,Spicy 模式因增加了第二次擴散處理及額外的審查流程,使渲染時間約增加 9%。
在視覺上,Grok Imagine 的插值動作在 24 fps 下感覺流暢,但在髮絲周圍會出現輕微的扭曲,這是其光流估算器的已知限制。音訊同步保持穩定,嘴唇動作與音頻對齊在 80 毫秒內,優於早期 Sora 測試版常常走音的表現;在這方面,Grok Imagine 擁有明顯的實際優勢。
最明顯的差異來自 Spicy Mode:色彩調整偏暖,鏡頭移動更富節奏感,且模型允許在 Grok Imagine 中 Normal Mode 會直接拒絕的暗示性姿勢。不過,Grok Imagine 仍會阻擋明確的性行為畫面,並偶爾模糊重疊的皮膚區域,證明該過濾器寬鬆但並非不存在。
結論
Grok Imagine,尤其是在 Spicy Mode 下,為創作者提供了一個介於 Sora 的嚴謹安全與開源分支的無法無天之間的挑逗性創作空間。如果你需要短小、音訊準備就緒的社交短片,且能在不觸犯法規的前提下駕馭其寬鬆的審查,Grok Imagine 目前是移動端製作傾向成人內容動畫最順暢的途徑。考慮到 xAI 的快速更新節奏,Grok Imagine 很可能會迅速擴充其工具組,但目前 Grok Imagine Spicy Mode 已經為允許成人內容的短片開闢了獨特的市場。
常見問題
Q1:什麼是 Grok Imagine Spicy Mode?
Spicy Mode 是 Grok Imagine 中的一個可選設定,放寬平台的預設過濾器,允許半裸及其他暗示性內容,同時仍禁止明確的性行為。
Q2:如何在 Grok Imagine 應用中啟用 Spicy Mode?
點擊你的個人頭像,編輯出生年份以驗證成年身份,然後切換 NSFW 選項;啟用後,Spicy Mode 將成為 Grok Imagine 四種動畫模式中的一種可選項。
Q3:Grok Imagine 是否能直接從文字提示生成影片?
尚未—Grok Imagine 需要你先上傳或生成靜態圖片,然後將其動畫化成影片;純文字轉影片仍在 xAI 的開發計劃中。
Q4:Grok Imagine 影片最長可達多久?
在推出時,Grok Imagine 生成的影片長度介於六至十五秒,均以 24 fps 及原生音訊渲染。
Q5:Grok Imagine 是否支援 Android 裝置?
Android 用戶目前僅能早期使用靜態圖片生成,而完整動畫功能(包括 Spicy Mode)則正式提供給 iOS 上的 SuperGrok 與 Premium Plus 訂閱者。