有沒有想過你可以像漫威客串一樣,漫步進入自己的影片中?
我的鄰居蒂娜曾經問我,為什麼我總是像這地方的主人一樣,頻繁出現在家庭影片中。我告訴她,這是一種導演的客串——希區考克做過,塔倫提諾也做過,現在,感謝現代人工智慧的奇蹟,你也可以做到。轉折是:你不需要看起來像浴簾的綠幕,也不需要只聽咖啡號令的好萊塢剪輯師。你只需要適合 Sora 2 的正確配方。
如果你聽說過 Sora 2,你可能也聽過驚嘆和懷疑的混合聲音。這是一種人工智慧影片模型,可以將文字提示(以及越來越多的媒體輸入)轉換為影片。今天,我們將重點關注一個非常具體、非常有趣的技巧:如何在 Sora 2 影片中插入你的客串——你的臉、你的全身、你的微表情——而無需花整個週末的時間陷入設定的兔子洞。
拿起你的手機,展現你最好的一面,並釋放你內心的導演。讓我們闖入謝幕名單。
在 Sora 2 中,「客串」到底是什麼?
簡單來說:在 Sora 2 中的客串就是你出現在生成的影片場景中——無論是作為前景角色(走過、揮手、揚起眉毛),還是作為換臉到模型生成的角色上。把它想像成數位的惡搞照片,只不過這是故意的,而且你看起来棒極了。
有三種常見的形式:
- 臉部客串:你提供一張大頭照或短片;Sora 2 將你的臉映射到場景中的角色。
- 全身客串:你提供一段自己的短片;系統會保留你的輪廓、服裝和動作。
- 插播客串:你作為一個單獨的鏡頭彈出——比如一個反應片段——然後 Sora 過渡回主場景。
所有這三種都可以通過 Sora 2 的提示和參考工作流程來完成。你輸入描述場景的文字,並附上你的參考媒體。神奇之處在於,Sora 2 會盡力在構建影片時,保持你的身份在每一幀中的一致性。
重要提示:人工智慧不是通靈者。它需要清晰的參考、良好的光線和明確的提示。如果這些都做對了,你的客串看起來會是故意的。如果搞錯了,模型會溫柔地將你「改善」成一個有著可疑對稱牙齒的陌生人。
快速入門配方(讓你可以在午餐前客串)
這是簡短、實用的版本,然後我們再深入研究。
- 臉部客串:一段 5–10 秒的 1080p 影片,正面拍攝,中性光線,緩慢的頭部轉動,幾個表情。沒有太陽眼鏡,沒有帽子。中性或簡單的背景。
- 全身客串:10–15 秒,從頭到腳都在畫面中,走兩步,轉身,揮手。良好的光線,最小的背景雜物。
- 以 MP4 或 MOV 格式匯出,1080p,24–30 fps。保持檔案大小合理(如果可能,保持在幾百 MB 以下)。
- 如果你使用靜止照片,上傳 3–5 張照片:正面、稍微向左/向右、一張帶有燦爛笑容的照片。一致性是目標。
- 更好:「30 秒的夜間霓虹燈小巷鏡頭,小雨,淺景深。一個穿著棕褐色外套的路人(使用我的參考臉)走過相機並點頭一次。日文街道標誌,水坑倒影,緩慢的推入相機移動。」
- 在 Sora 2 中,使用媒體參考欄位來放置你的臉部/身體片段。清楚地標記(例如,「臉部參考」、「全身參考」)。
- 提示行包括:「保留參考中的臉部身份。保持膚色、頭髮長度、眼睛顏色。避免改變年齡或性別。臉部不要風格化。」
- 5–8 秒。你正在測試相似度、光線和動作。在你確定你的外觀之前,不要在 45 秒的巨作上浪費 tokens。
- 如果臉部漂移:增加「身份權重」或添加「強身份保留」。
- 如果光線與你作對:描述你臉上的光線(「來自螢幕左側的暖色主光,來自右側的柔和補光」)。
- 如果動作模糊了你的特徵:要求較慢的相機移動、更高的快門外觀,或「最大限度地減少臉上的動作模糊」。
一個好的客串提示的剖析(附範例)
提示就像食譜。如果你說「湯」,模型肯定會產生湯;但它是番茄湯、越南河粉還是奶奶的雞麵?對於客串來說,關鍵成分是場景、相機、服裝和身份。
你可以複製的範本:
「30 秒影片,24 fps,電影感。場景:[描述設定和時間]。相機:[鏡頭大小、移動、鏡頭氛圍]。動作:[你的客串做什麼]。使用我的臉部參考作為路人/主角。保持臉部身份一致。光線:[主光/補光/輪廓光或簡單的「柔和日光」]。服裝:[你穿什麼]。色調:[情緒/類型]。避免臉部風格化;自然肌膚紋理。」
範例 1:友好的路邊彈出
「10 秒鐘的鏡頭,在布魯克林人行道上的黃金時段。緩慢地推入一個中景鏡頭。一個穿著海軍藍帽衫的路人(使用我的臉部參考)瞥了一眼相機並給了一個小小的揮手。保持身份一致和自然。來自右側的柔和暖光,柔和的背景散景。臉部最小的動作模糊。」
範例 2:科幻走廊眨眼
「12 秒鐘的鏡頭,在一個有藍色地板照明的光滑科幻走廊內。手持感覺,輕微的相機搖擺。一個穿著棕褐色外套的技術人員(使用我的全身參考)經過前景並眨眼。保留參考中的頭髮長度和膚色。避免風格化的皮膚或逆齡。保持眼睛清晰。」
範例 3:插播自白
「8 秒鐘的特寫鏡頭,採訪照明,中性灰色背景。使用我的臉部參考作為說話的主體:『我甚至不在這裡工作。』自然的皮膚紋理,沒有化妝的外觀,乾淨的音訊氛圍(即使是無聲的)。將其剪切為一個反應鏡頭。」
專業提示:如果你希望你的客串成為一個稍縱即逝的時刻,請保持相機移動穩定,鏡頭長度短,並要求「在整個過程中保持面部身份」。如果你想大喊「嘿,是我!」,那麼指定一個特寫鏡頭、眼神交流和一個獨特的姿勢:揮手、傾斜、抬眉毛。
臉部 vs. 全身:你應該選擇哪種客串?
- 當身體的其餘部分不重要時(人群鏡頭、汽車中的駕駛員、路人),選擇臉部客串。它更快、更可靠,並且對服裝的要求更少。
- 當你的服裝、輪廓或步態是笑點的一部分時,選擇全身客串——比如穿著香蕉套裝走過畫面。(不做評判。我的一些最好的朋友是水果。)
注意事項:
- 帽子、眼鏡和濃妝會混淆身份映射。如果你必須擁有它們,請包含一個帶有這些道具的額外參考幀。
- 戲劇性的光線(霓虹燈標誌、閃爍的警車燈)會改變膚色。使用明確的光線說明來抵消。
- 快速平移或快速變焦會弄髒臉部。要求「限制相機加速;保持臉部清晰」。
你的參考工具包:可以節省數小時的三個檔案
將其視為你的客串緊急包:
- 中性臉部片段:5–10 秒,無表情,緩慢的頭部轉動。
- 表情豐富的臉部片段:5 秒,微笑、驚訝、輕微皺眉;幫助模型理解你的範圍。
- 姿勢照片:四分之三的身體,自然的站姿,均勻的光線。
如果你在手機上製作這些:
- 以 1080p、30 fps 錄製;除非你需要,否則避免使用 4K。
Sora 2 工作流程:友好的演練
以下是你從頭開始構建一個客串時會發生的情況。
步驟 1:建立場景提示
寫下你的設定、色調、鏡頭長度和相機行為。保持你的動作簡單。你要求的動作越挑剔(「我一邊玩弄著燃燒的棉花糖,一邊在月球上行走」),模型就會越分散注意力。
步驟 2:上傳參考
將你的臉部或全身片段添加到參考面板。標記它們。如果 Sora 2 允許你設定權重,請從中等身份權重開始。太低會導致臉部漂移;太高會導致模型將表情木乃伊化。
步驟 3:在文字中鎖定身份
添加如下行:「使用我的臉部參考作為穿著棕褐色外套的人;保留年齡和雀斑;避免改變下巴線。」具體說明模型應附加到哪個角色。
步驟 4:用文字照亮臉部
告訴 Sora 光線應該如何影響你的臉部:「來自右側的柔和暖光主光,左側的昏暗冷光補光,頭髮上微弱的輪廓光。」你正在引導模型遠離不討喜的選擇(我們都見過那些),並走向一致性。
步驟 5:生成一個簡短的預覽
注意:相似度、嘴巴區域(牙齒通常會變得很有創意)、眼睛(顏色和凝視)和髮際線。暫時不要擔心背景的完美。
步驟 6:調整並重新生成
- 如果眼睛漂移:「保持參考中的眼睛顏色和形狀;避免風格化的反光。」
- 如果你的棕褐色外套變成深紅色:「將服裝鎖定為棕褐色外套;沒有顏色變化。」
步驟 7:提交完整拍攝
一旦你喜歡 6–10 秒的測試,就進行 20–30 秒的最終版本。保存你的設定和參考權重,以便稍後可以重複使用它們。
兩個客串的故事:為什麼迭代會獲勝
我要求 Sora 2 快速拍攝一張小巷照片,並在路人身上加上我的臉部客串。第一個渲染版本是,我們應該說,我更英俊的表弟。它有我的頭髮、下巴和疫情後的眼袋——感謝——但笑容屬於牙膏廣告。我補充說:「自然的皮膚紋理,小小的微笑,保持牙齒大部分隱藏。」轟。下一個渲染版本:90% 是我,10% 是睡眠。
道德:不要接受第一稿。像保齡球館添加緩衝墊一樣,在你的提示中添加邊界線。溫和的更正會產生令人驚訝的人性化結果。
排查五個經典的客串故障
- 修復:增加身份權重;鎖定年齡和面部毛髮;減少相機移動。添加:「在整個鏡頭中保持身份。」
- 修復:「沒有美顏濾鏡;保留毛孔和精細細節;自然的皮膚紋理。」要求更柔和的光線,而不是人工智慧化妝。
- 修復:指定「閉嘴的微笑」或「中性的嘴唇」。對於說話的鏡頭,保持對話盡可能少;要求「微妙的嘴唇動作」。
- 修復:「將服裝鎖定為海軍藍帽衫;沒有款式或顏色變化。」保持場景光線穩定。
- 修復:「穩定的顏色分級;最大限度地減少閃爍;臉部均勻曝光。」縮短鏡頭或減慢相機速度。
倫理和同意(因為未來的你會感謝現在的你)
如果你客串自己,那就沒問題。如果你客串其他人——配偶、同事、你的戴太陽眼鏡的貓——獲得書面許可。避免暗示代言。如果你將自己插入到真實世界的影片或歷史場景中,請使用字幕或上下文以避免混淆。
此外:某些平台要求你標記人工智慧生成的媒體。在你點擊上傳之前,檢查發佈規則。這比向瑪姬阿姨解釋為什麼你似乎正在接受一個你無法發音的領域的諾貝爾獎更容易。
將你的客串剪輯到最終版本中
Sora 2 可以生成包含你的客串的整個場景,但你可能想要修剪、分級和潤色。快速的人工編輯會大有幫助。
- 修剪時刻:如果你的客串是笑話,請保持在三秒以下。喜劇喜歡簡潔。
- 輕柔地分級:使中間調變暖;不要將你的皮膚漂白成瓷娃娃。
- 添加一個微小的聲音提示:一個腳步聲、一個嗖嗖聲、一個「嘿!」來傳達存在感。
- 切換到反應:讓另一個鏡頭承認你的彈出;這就是樂趣的一半。
Sider.AI 可以提供幫助嗎?是的——當你寫作、迭代和組織時
這是一個驚喜:Sider.AI 在不迷人但必不可少的部分表現出色——集思廣益的提示、組織變體以及追蹤實際有效的內容。我像使用帶有渦輪增壓的導演筆記本一樣使用它。貼上你的提示,貼上你的結果筆記(「眼睛漂移;帽衫保持鎖定」),並要求 Sider 提出三個更嚴格的變體(「保持身份;減少運動模糊;添加柔和的輪廓光」)。 它不會渲染你的影片——那是 Sora 2 的領域——但它會幫助你闡明更清晰的提示,生成替代相機方向,甚至為你的客串捕捉日製作一個整潔的清單。但是,如果你嘗試讓它為你的最終版本進行顏色分級,那麼……祝你好運。
高級客串技巧
- 身份錨點:命名應該承載你的臉的角色——「穿著棕褐色外套的路人使用我的臉部參考」——以防止模型將你貼在錯誤的臨時演員上。
- 多重參考融合:提供一個中性的臉部片段和一個微笑的靜止照片。要求 Sora 2 偏愛中性片段 70%,微笑靜止照片 30%,以獲得微表情。
- 光線連續性:包含場景光線的靜止幀,並告訴 Sora 2:「將臉部光線與此參考圖像相匹配。」
- 鏡頭和距離:臉部會因極端鏡頭而變形。要求 50 毫米–85 毫米的「外觀」和中等距離,以獲得討人喜歡、一致的身份。
- 為了理智而提出的否定提示:「沒有故障、沒有眼睛顏色變化、沒有濃妝、沒有老化/逆齡。」
- 簡短是美好的:客串以 5–12 秒出售。如果你想要更長的存在時間,請將其分成兩個鏡頭;分塊更容易保持連續性。
你可以貼在螢幕上的清單
捕捉
提示
迭代
最終確定
懷疑論者的角落:何時不客串
- 嚴肅的紀錄片:你的臉彈出到檔案片段中可能會造成混淆或誤導。將笑話留到幕後花絮。
- 高速動作:快速平移和爆炸會抹去臉部。如果必須這樣做,請保持你的客串靜態且靠近。
- 複雜的舞蹈編排:身體和道具越多,模型就越會弄亂你的身份。從簡單開始;稍後添加混亂。
最後一件事:讓客串有意義
當客串是對觀眾的眨眼時,效果最佳。也許你是默默地將一杯標有「劇情轉折」的咖啡遞給你的英雄的咖啡師。也許你是那個快速點頭說「是的,你看到了」的路人。在一個可以生成一切的人工智慧世界中,你自己的臉是來自現實的明信片。將其用作錨點、笑話或簽名。保持簡短、保持清晰,並保持真實的你。
現在去給你未來的觀眾一個眨眼和微笑的時刻。啟動相機。走過。不要絆倒。
常見問題
Q1:如何在沒有綠幕的情況下在 Sora 2 中插入我的臉部客串?
在良好的光線下錄製一個乾淨的 5–10 秒的臉部片段,將其上傳為參考,並添加提示行,例如「保留臉部身份;自然的皮膚紋理;沒有風格化。」保持鏡頭簡短和相機穩定,以便 Sora 2 可以鎖定你的身份,而無需綠幕的麻煩。
Q2:Sora 2 客串的最佳提示是什麼?
描述場景、相機、你臉上的光線、服裝和一個簡單的動作,然後添加身份鎖定:「使用我的臉部參考作為路人;保持年齡、頭髮、眼睛顏色。」最後添加「限制運動模糊;保持眼睛清晰」以幫助 Sora 2 保持你的相似度。
Q3:為什麼我的 Sora 2 客串不斷變化服裝或光線?
人工智慧喜歡即興創作。添加「將服裝鎖定為 [物品]」和「穩定的顏色分級;最大限度地減少閃爍;臉部均勻曝光。」如果它仍然漂移,請簡化相機移動並縮短鏡頭長度。
Q4:我可以在 Sora 2 中進行全身客串嗎,還是只能換臉?
你可以兩者都做。對於全身,拍攝一段 10–15 秒的從頭到腳的片段,其中包含一個簡單的行走和揮手,然後提示 Sora 2 將其用作角色的身份。它比臉部客串更挑剔,因此請保持光線和背景清潔。
Q5:在使用 Sora 2 製作客串提示時,使用 Sider.AI 有幫助嗎?
是的——Sider.AI 非常適合集思廣益,產生清晰、可測試的提示並組織迭代。它不會渲染影片,但它可以提出更嚴謹的變體,並保持整潔的日誌,記錄是什麼讓您的 Sora 2 客串看起來最像您。