เคยจ้องมองภาพถ่ายวันหยุดเก่าๆ แล้วหวังว่ามันจะ...ขยับได้เล็กน้อยไหม? อาจจะเป็นลมพัดผ่านต้นปาล์ม, แสงระยิบระยับบนทะเลสาบ, รอยยิ้มครึ่งๆ กลางๆ ของลูกคุณเปลี่ยนเป็นรอยยิ้มเต็มที่? ฉันเคยเป็นแบบนั้น เราอยู่ในยุคทองของ “จะเกิดอะไรขึ้นถ้า...?” และด้วย Veo 3.1 ของ Google ที่ทำงานภายในพื้นที่ทำงานแบบ Flow ทีละขั้นตอน คุณสามารถเปลี่ยนภาพนิ่งให้เป็นช่วงเวลาสั้นๆ ที่เคลื่อนไหวได้ โดยไม่ต้องขอร้องญาติของคุณที่ “รู้เรื่อง After Effects”
ตอนนี้ มาดูคำจำกัดความกัน เพราะศัพท์เฉพาะเข้ามาหาคุณอย่างรวดเร็วในทุกวันนี้ Veo คือโมเดลวิดีโอ AI ที่เป็นข่าวพาดหัวของ Google ลองนึกถึงการแปลงข้อความเป็นวิดีโอ, การแปลงรูปภาพเป็นวิดีโอ และการโรย “ฉันไม่อยากจะเชื่อเลยว่ามันใช้งานได้” เล็กน้อย Veo 3.1 เวอร์ชันใหม่ล่าสุด เพิ่มความเร็ว, ความสอดคล้อง และ (ทำให้ฉันใจเต้นแรง) การควบคุมความคิดสร้างสรรค์ที่มากขึ้น รวมถึงเสียงในตัวและระยะเวลาวิดีโอที่ยาวนานขึ้น คุณสามารถเข้าถึงได้ผ่านคุณสมบัติการสร้างวิดีโอ Gemini ของ Google และ AI Studio ซึ่งคุณสามารถป้อนข้อความแจ้งและรูปภาพเพื่อสร้างวิดีโอพร้อมเสียงในอัตราส่วนภาพต่างๆ โมเดลการ์ดของ Google เองยืนยันปุ่มและหน้าปัดต่างๆ ไม่ว่าจะเป็นแนวนอนหรือแนวตั้ง คลิปที่ยาวขึ้น และความสม่ำเสมอที่ดีขึ้นจากเฟรมสู่เฟรม
กล่าวอีกนัยหนึ่ง: ใช่แล้ว การสร้างภาพเคลื่อนไหวจากภาพนิ่งด้วย Veo 3.1 กลายเป็นเรื่องปกติไปแล้ว และมันก็ยอดเยี่ยมมาก ในพื้นที่ทำงานแบบ Flow (คิดว่ามันเป็นเหมือนสายพานเล็กๆ สำหรับขั้นตอนการสร้างสรรค์ของคุณ) คุณเรียงอินพุตและการควบคุมของคุณ ไม่ว่าจะเป็นภาพถ่ายเข้า, พรอมต์เข้า, ตั้งค่าอัตราส่วนภาพ แล้วคลิปสั้นๆ ก็ปรากฏออกมา วันนี้ ฉันจะแนะนำวิธีการสร้างภาพเคลื่อนไหวจากภาพนิ่งโดยใช้ Veo 3.1 ในการตั้งค่าแบบ Flow, ให้คำแนะนำที่เป็นประโยชน์ และชี้ให้เห็นถึงกับดักที่ฉันเคยตกลงไป เพื่อที่คุณจะได้ไม่ต้องเจอ และใช่ ฉันจะแสดงให้เห็นว่า Sider.AI เข้ามามีบทบาทอย่างไรในฐานะเพื่อนคู่คิดในการเขียนพรอมต์ของคุณ เมื่อสมองของคุณปฏิเสธที่จะคิดประโยคที่สมบูรณ์แบบออกมา “Flow” หมายถึงอะไรในที่นี้ และทำไมคุณถึงต้องการมัน
ลองนึกภาพ “Flow” เป็นช่องทางโปรเจกต์ สถานที่ที่รูปภาพ, พรอมต์, การตั้งค่าโมเดล และเอาต์พุตของคุณอยู่ด้วยกัน เพื่อให้คุณสามารถปรับแต่ง, เรียกใช้อีกครั้ง และเปรียบเทียบได้โดยไม่เสียสติ AI Studio ของ Google เป็นประตูอย่างเป็นทางการสำหรับคุณสมบัติ Veo 3.x รวมถึง 3.1 ล่าสุด พร้อมรองรับอัตราส่วนภาพและการควบคุมความคิดสร้างสรรค์ที่หลากหลาย ในส่วนหน้า เครื่องมือสร้างวิดีโอ Gemini ช่วยให้คุณสามารถเปลี่ยนข้อความและรูปภาพให้เป็นวิดีโอพร้อมเสียง ซึ่งขับเคลื่อนโดย Veo 3.1 และญาติที่เร็วกว่าอย่าง Veo 3.1 Fast หน้า Veo ของ DeepMind อธิบายถึงสิ่งดีๆ ใหม่ๆ ไม่ว่าจะเป็นเสียงในตัวและวิดีโอที่ยาวขึ้น ดังนั้นคุณไม่ได้แค่สร้างภาพเคลื่อนไหว แต่คุณกำลังใส่เพลงประกอบความทรงจำด้วย
หากนี่เป็นการเต้นรำครั้งแรกของคุณกับ Veo: คุณอัปโหลดหรืออ้างอิงรูปภาพ, เขียนพรอมต์ที่อธิบายภาพเคลื่อนไหวที่คุณต้องการ, เลือกความยาวและอัตราส่วนภาพ แล้วกด Generate เครื่องมือสไตล์ Flow ช่วยให้คุณเก็บรักษาเวอร์ชันต่างๆ ให้เป็นระเบียบ, แชร์ได้ และทำซ้ำได้ หากฟังดูคล้ายกับการมีโต๊ะทำงานที่เป็นระเบียบเรียบร้อยสักครั้ง นั่นแหละคือแนวคิด
สิ่งนี้เหมาะสำหรับใคร (สปอยล์: อาจจะเป็นคุณ)
- นักเล่นแร่แปรธาตุแห่งความทรงจำ: คุณมีภาพนิ่งและคุณต้องการชีวิต ชีพจรของน้ำ, ผมที่เคลื่อนไหว, ป้ายถนนที่กระพริบ
- ผู้โพสต์โซเชียล: คุณต้องการวิดีโอแนวตั้งที่น่าสนใจสำหรับ Stories หรือ TikTok ที่เริ่มต้นชีวิตเป็นภาพนิ่ง
- ครู/นักการตลาด: สไลด์ที่มีภาพเคลื่อนไหวเล็กน้อยหรือพารัลแลกซ์แสง เล่าเรื่องได้ดีกว่าภาพนิ่ง
- นักประดิษฐ์: คุณแค่อยากจะดูว่าหูของสุนัขจะกระพือหรือไม่
ฉบับย่อ: วิธีสร้างภาพเคลื่อนไหวจากภาพนิ่งใน Veo 3.1
หากคุณเป็นประเภท “ฉันจะคิดออกเองตอนขึ้นเครื่อง” นี่คือช่องทางด่วน:
- เตรียมรูปภาพของคุณ: ครอป, ทำความสะอาดฝุ่น และอัปสเกลหากจำเป็น รูปภาพที่มีความละเอียดสูงจะทำให้ Veo 3.1 มีอะไรให้เคี้ยวมากขึ้น
- เลือกอัตราส่วนภาพ: แนวนอน 16:9 สำหรับ YouTube; แนวตั้ง 9:16 สำหรับ Reels/Shorts
- พรอมต์อย่างแม่นยำ: อธิบายการเคลื่อนไหว, ความเร็ว และบรรยากาศ ตัวอย่าง: “ลมพัดเบาๆ 3 วินาทีทำให้ใบไม้ของต้นไม้เคลื่อนไหว; การส่ายกล้องที่เป็นธรรมชาติเบาๆ; รักษาสภาพใบหน้าของวัตถุไว้เหมือนเดิม; ไม่มีสิ่งแปลกปลอม”
- เปิดใช้งานเสียงในตัว หากคุณต้องการบรรยากาศแสง: “บรรยากาศป่าที่นุ่มนวล, ระดับเสียงต่ำ”
- เลือกความยาว: เริ่มต้นด้วย 3–5 วินาที เพื่อให้คุณสามารถทำซ้ำได้อย่างรวดเร็ว
- สร้าง, ตรวจสอบ, ปรับแต่ง: ปรับคำพูดในพรอมต์, ความเข้มของการเคลื่อนไหว และความยาว เพื่อขจัดความผิดปกติ (ใบหน้าที่บิดเบี้ยว, มือที่ละลาย)
เรียบร้อย แต่ถ้าคุณต้องการทัวร์พร้อมไกด์ โดยหลีกเลี่ยงหลุมบ่อและค้นพบไข่อีสเตอร์ มากับฉัน
การตั้งค่า Flow ของคุณ: ช่องทางภาพถ่ายเคลื่อนไหว
- ขั้นตอนที่ 1: สร้างโปรเจกต์ใหม่ใน AI Studio ของ Google (หรือพื้นที่ทำงานแบบ Flow ที่รองรับ Veo) เพิ่มภาพนิ่งของคุณเป็นโหนดอินพุต การ์ดโมเดลยืนยันว่า Veo 3.x รองรับการกำหนดค่าเหล่านี้และความต้องการในการใช้งานจริง
- ขั้นตอนที่ 2: เลือก Veo 3.1 หรือ Veo 3.1 Fast เวอร์ชัน Fast จะเร็วกว่าสำหรับการร่าง เปลี่ยนไปใช้ 3.1 ที่เหมาะสมสำหรับการเรนเดอร์ขั้นสุดท้ายของคุณ
- ขั้นตอนที่ 3: เลือกอัตราส่วนภาพของคุณอย่างชาญฉลาด คุณกำลังสร้างแบนเนอร์เดสก์ท็อป 16:9 ที่โดดเด่นหรือรีลแนวตั้ง? Veo 3.x จัดการรูปแบบเหล่านี้ได้โดยกำเนิด
- ขั้นตอนที่ 4: เขียนพรอมต์ภาพเคลื่อนไหวของคุณ คิดถึงโน้ตของผู้กำกับ ไม่ใช่บทกวี คุณกำลังบอกโมเดลว่าจะทำอะไร ที่ไหน และมากแค่ไหน
- ขั้นตอนที่ 5: ความยาวและจังหวะ ลอง 3–5 วินาทีก่อน ยิ่งคุณไปนานเท่าไหร่ โอกาสที่จะเกิดสิ่งแปลกปลอมก็จะยิ่งมากขึ้น เว้นแต่คุณจะทำให้การเคลื่อนไหวน้อยที่สุดและสอดคล้องกัน Veo 3.1 มีความแข็งแกร่งด้านความสอดคล้องมากกว่าโมเดลก่อนหน้า
- ขั้นตอนที่ 6: เสียงในตัวเสริม คุณสามารถขอเสียงรอบข้างให้เข้ากับฉาก คลื่น, เสียงกระซิบจากร้านกาแฟ, ลม ในระดับที่ละเอียดอ่อน
- ขั้นตอนที่ 7: สร้าง แล้วทำซ้ำ ฉบับร่างแรกของคุณจะเป็นประสบการณ์การเรียนรู้ ปรับแต่งพรอมต์และการตั้งค่าเพื่อนำทาง Veo เหมือนเด็กฝึกงานที่หวังดีแต่ตรงไปตรงมาเล็กน้อย
สูตรพรอมต์ที่ใช้งานได้จริง
- ลมพัดเบาๆ: “เพิ่มการเคลื่อนไหวของใบไม้ที่ละเอียดอ่อนและแสงแดดระยิบระยับบนน้ำอย่างนุ่มนวล; รักษาสภาพใบหน้าของวัตถุให้คงที่อย่างสมบูรณ์แบบ; ไม่มีการบิดเบือนบนมือ; การส่ายกล้องแบบถือด้วยมือที่เบามาก; ระยะเวลา 4 วินาที”
- Cinematic Parallax: “จำลองพารัลแลกซ์ตื้นๆ บนพื้นหลังเท่านั้น; ยึดวัตถุที่อยู่เบื้องหน้า; การเปลี่ยนระยะชัดลึกเล็กน้อย; หลีกเลี่ยงการแปลงร่างหรือการละลาย; 5 วินาที; แนวนอน 16:9”
- Micro-Motion Portrait: “สร้างภาพเคลื่อนไหวเฉพาะผมและไฟพื้นหลังด้วยการกะพริบที่ละเอียดอ่อน; ไม่มีการเปลี่ยนแปลงรูปทรงเรขาคณิตหรือการแสดงออกทางสีหน้า; ดวงตาและฟันที่มั่นคง; 3 วินาที; แนวตั้ง 9:16”
- The Nostalgia Pan: “แพนแนวนอนช้าๆ ข้ามภาพถ่าย; เพิ่มเกรนฟิล์มจางๆ; รักษาความคมชัดขององค์ประกอบดั้งเดิม; หลีกเลี่ยงสิ่งแปลกปลอมที่ยืดออก; 5 วินาที”
- The Weather Wink: “เพิ่มหิมะตกเบาๆ ในเบื้องหน้า; ขนาดและความโน้มถ่วงที่สม่ำเสมอ; ไม่มีการซ้อนทับบนใบหน้าของวัตถุ; การแบ่งชั้นความลึกที่นุ่มนวล; 4 วินาที; ภูมิทัศน์เสียงฤดูหนาวโดยรอบในระดับเสียงต่ำ”
การแก้ไขปัญหา: เมื่อสิ่งต่างๆ แปลกประหลาด
- ใบหน้าละลาย ทำไม? โมเดลพยายาม “ช่วย” แก้ไขโดยระบุอย่างชัดเจนว่า: “รักษาสภาพใบหน้าไว้เหมือนเดิม; ไม่มีการเปลี่ยนแปลงทางเรขาคณิต; รักษาสภาพเดิม” ลดขอบเขตการเคลื่อนไหวและความยาว
- พื้นหลังบิดเบี้ยว จำกัดการเคลื่อนไหวให้อยู่ในพื้นที่ที่กำหนด: “สร้างภาพเคลื่อนไหวเฉพาะต้นไม้และท้องฟ้า; รักษาสภาพอาคารให้คงที่” หลีกเลี่ยงการขอการเคลื่อนไหวของกล้องและการเคลื่อนไหวของวัตถุพร้อมกันในการเริ่มต้น
- บรรยากาศไม่ดี คุณขอ “ชวนฝัน” แต่ได้ “Michael Bay” แทนที่คำคุณศัพท์ด้วยคำแนะนำทางกายภาพ: “การเคลื่อนไหวช้าๆ น้อยที่สุด”, “การส่ายกล้อง 2 องศา”, “ระดับสีความคมชัดต่ำ”
- เอาต์พุตมีสัญญาณรบกวน เริ่มต้นด้วย Veo 3.1 Fast สำหรับการร่าง จากนั้นอัปเกรดเป็น Veo 3.1 สำหรับรอบชิงชนะเลิศ ตั้งค่าการเคลื่อนไหวให้น้อยที่สุด หลีกเลี่ยงคำสั่งผสมที่ยาวและซับซ้อน
คำพูดสั้นๆ เกี่ยวกับเสียง
Veo 3.1 นำเสนอเสียงในตัว ซึ่งหมายความว่าคุณสามารถขอเสียงรอบข้างที่ละเอียดอ่อนซึ่งซิงค์กับฉากของคุณได้ ไม่ใช่ชุดเครื่องมือการผลิตเพลงประกอบทั้งหมด แต่สำหรับถนนในเมือง, เสียงกระซิบจากร้านกาแฟ หรือความเงียบสงบริมทะเล มันน่าเชื่ออย่างน่าประหลาดใจ เคล็ดลับ: เก็บไว้ในระดับต่ำ หากเสียงกลายเป็นดาวเด่น เวทมนตร์ภาพเล็กๆ น้อยๆ จะหายไป
การเลือกอัตราส่วนภาพที่เหมาะสม (และทำไมมันถึงสำคัญ)
- แนวนอน 16:9: เหมาะสำหรับ YouTube, เว็บไซต์, งานนำเสนอ
- แนวตั้ง 9:16: เรื่องราวโซเชียล, Reels, Shorts; การเคลื่อนไหวควรมีทิศทางแนวตั้งเพื่อให้ได้ผลดีที่สุด
- สี่เหลี่ยมจัตุรัส 1:1 (หากรองรับในการตั้งค่าของคุณ): เล่นอย่างปลอดภัยสำหรับแพลตฟอร์มผสม; รักษาการเคลื่อนไหวให้อยู่ตรงกลาง
เคล็ดลับ: อย่าแค่ครอป แต่ให้จัดองค์ประกอบ ขอการเคลื่อนไหวในที่ที่ดวงตาของผู้ชมจะไปตามธรรมชาติในทิศทางนั้น
การควบคุมเวอร์ชันอย่างมืออาชีพในพื้นที่ทำงาน Flow
- เก็บโหนดภาพนิ่งต้นฉบับ “Gold” ไว้ หากการทดลองผิดพลาด คุณสามารถแตกแขนงได้อย่างหมดจด
- โคลนโหนด เปลี่ยนตัวแปรหนึ่งตัว เปรียบเทียบเอาต์พุตแบบเคียงข้างกัน
- ป้ายกำกับซ้ำ: “Breeze-2deg-sway”, “Parallax-background-only” และอื่นๆ ใช่ คุณจะรู้สึกเหมือนเป็นบรรณารักษ์ ใช่ คุณจะขอบคุณตัวเองในภายหลัง
มินิ Walkthrough ในโลกแห่งความเป็นจริง
สมมติว่าคุณมีรูปถ่ายลูกของคุณที่ชายหาด คุณต้องการลูปที่นุ่มนวลที่ทำให้ฉากมีชีวิตชีวาโดยไม่ทำให้ Junior กลายพันธุ์
- เตรียมภาพถ่าย: ครอปเป็นแนวตั้ง 9:16, ทำให้คมชัดขึ้นเล็กน้อย, ลบนักท่องเที่ยวชายหาดที่หลงทาง
- พรอมต์: “ระลอกคลื่นในมหาสมุทรที่นุ่มนวลและสมจริงและคลื่นเล็กๆ; การเคลื่อนไหวของเส้นผมที่ละเอียดอ่อนบนวัตถุ; รักษาสภาพรูปทรงเรขาคณิตและการแสดงออกทางสีหน้าไว้เหมือนเดิม; ไม่มีการเปลี่ยนแปลงที่มือ; การส่ายแบบถือด้วยมือน้อยที่สุด; 4 วินาที; บรรยากาศมหาสมุทรที่เงียบสงบ”
- สร้างใน Veo 3.1 Fast เพื่อดูตัวอย่าง
- แก้ไขปัญหา: หากปากกระตุก ให้เพิ่ม “ไม่มีการเคลื่อนไหวของปาก; ฟันและริมฝีปากที่มั่นคง” หากแขนงอแปลกๆ ให้เพิ่ม “ไม่มีการเปลี่ยนรูปของแขนขา”
- สุดท้าย: เปลี่ยนไปใช้ Veo 3.1 สำหรับเอาต์พุตที่สะอาด; ส่งออกที่ความละเอียดที่แพลตฟอร์มของคุณต้องการ
หมายเหตุของนักวิจารณ์ที่สุภาพเกี่ยวกับความสมจริง
Veo 3.1 สามารถทำให้ภาพนิ่งทุกภาพดูเหมือนวิดีโอจริงได้หรือไม่? ไม่เสมอไป และบางครั้งคุณก็ไม่ต้องการแบบนั้น เสน่ห์อยู่ที่สัมผัสที่เบา เหมือนภาพถ่ายที่มีชีวิตในหนังสือพิมพ์พ่อมด ยิ่งคุณต้องการการเคลื่อนไหวมากเท่าไหร่ โอกาสที่จะเกิดสิ่งแปลกปลอมก็จะยิ่งมากขึ้น หากวัตถุของคุณมีรายละเอียดปลีกย่อย ไม่ว่าจะเป็นตาข่าย, ลูกไม้, ใบไม้หนาแน่น ให้ขอให้โมเดลรักษาสภาพพื้นที่เหล่านั้นให้คงที่หรือละเอียดอ่อนอย่างยิ่ง
Sider.AI: เพื่อนร่วมทีมในการแจ้งเตือนของคุณ นี่คือเรื่องน่าประหลาดใจ: Sider.AI เข้าใกล้เวทมนตร์มาก ตราบใดที่คุณนำทางมันไปสู่สิ่งที่สร้างขึ้นมาจริงๆ ใช้เพื่อร่างและปรับแต่งพรอมต์ที่เป็นรูปธรรม มีขอบเขต และทดสอบได้ “สร้างภาพเคลื่อนไหวเฉพาะใบไม้และเส้นผม; ไม่มีการเปลี่ยนแปลงทางสีหน้า; 4 วินาที; การส่ายแบบถือด้วยมือเบาๆ” แทนที่จะเป็น “ทำให้มันเป็นภาพยนตร์และทำให้ฉันทึ่ง” Sider ยังสามารถช่วยคุณสร้างชุดรูปแบบพรอมต์สำหรับการทดสอบ A/B และสรุปสิ่งที่เปลี่ยนแปลงไประหว่างการลอง เพื่อที่คุณจะได้ไม่ทำผิดซ้ำอีก หากคุณพยายามทำให้มันทำภาษีของคุณ อย่างไรก็ตาม… ขอให้โชคดี จริยธรรมและมารยาท
- ความยินยอมเป็นสิ่งสำคัญ: อย่าสร้างภาพเคลื่อนไหวบนใบหน้าของใครบางคนโดยไม่ได้รับอนุญาต มันยังคงเป็นภาพเหมือนของพวกเขา
- ติดป้ายกำกับสิ่งที่คุณสร้าง: แท็ก “สร้างด้วย AI” ช่วยกำหนดความคาดหวัง
- อย่าปลอมแปลงหลักฐาน: ภาพนิ่งที่เคลื่อนไหวของฉากข่าวอาจทำให้เข้าใจผิดได้ รักษามันให้เป็นศิลปะและซื่อสัตย์
เคล็ดลับขั้นสูง: เมื่อคุณพร้อมที่จะเลื่อนระดับ
- พรอมต์ภูมิภาคที่น่าสนใจ: ระบุ “เฉพาะท้องฟ้าและน้ำพื้นหลังเท่านั้นที่เคลื่อนไหว” หากเครื่องมือของคุณอนุญาตให้ใช้มาสก์ ให้ใช้มาสก์เหล่านั้น มาสก์แข็งสำหรับใบหน้า มาสก์อ่อนสำหรับความเคลื่อนไหวของสิ่งแวดล้อม
- การเคลื่อนไหวของกล้องเป็นเครื่องปรุง: เพิ่มการส่าย 1–2 องศาหรือการซูมเล็กน้อย มากกว่านั้นและคุณเสี่ยงต่อการบิดเบือนโลกยาง
- จังหวะเวลา: ขอให้วนซ้ำหากคุณต้องการความรู้สึกเหมือน GIF: “ลูปที่ไร้รอยต่อ, 4 วินาที”
- สีและเกรด: กำกับอารมณ์: “โทนสีบ่ายที่อบอุ่นนุ่มนวล, เกรนฟิล์มเล็กน้อย, บทความขนาดเล็กที่ละเอียดอ่อน”
- Clean plates: หากพื้นที่หนึ่งเสียอยู่เรื่อยๆ (ฟัน, ดวงตา) ให้ลดการเคลื่อนไหวที่ร้องขอที่อื่น ให้โมเดลทำงานน้อยลงในคราวเดียว
การส่งออกและการแบ่งปัน
- รักษาสภาพต้นฉบับไว้ในขนาดดั้งเดิมของแพลตฟอร์ม อย่าอัปสเกลแนวตั้ง 9:16 เป็น 4K แล้วคาดหวังปาฏิหาริย์
- ตัดเฟรมแรกและเฟรมสุดท้าย 3–5 เฟรมเพื่อหลีกเลี่ยงอาการกระตุกที่บอกเล่าของ AI เมื่อเริ่มต้น/หยุด
- หากรวมเสียงไว้ ให้ทดสอบบนลำโพงโทรศัพท์และหูฟัง เสียงรอบข้างที่ใช้ได้ดีบนหูฟังอาจหายไปบนลำโพงโทรศัพท์ เพิ่มขึ้นเล็กน้อยหากหายไป
เบื้องหลัง: สิ่งที่ Veo 3.1 นำมาสู่ปาร์ตี้
หน้าต่างๆ ของ Google เองวาดภาพ: Veo 3.x นำเสนอการควบคุมความคิดสร้างสรรค์ที่ขยายใหญ่ขึ้น เสียงในตัว และหน้าต่างการสร้างที่ยาวขึ้นสำหรับการเล่าเรื่องที่สอดคล้องกันมากขึ้น ใน Gemini คุณสามารถเปลี่ยนจากข้อความและรูปภาพไปเป็นวิดีโอพร้อมเสียงได้โดยตรง และเลือก Veo 3.1 Fast สำหรับการทำซ้ำอย่างรวดเร็วเมื่อกาแฟของคุณเย็นลง เอกสาร AI Studio อธิบายถึงตัวเลือกอัตราส่วนภาพและลักษณะการทำงานของโมเดลที่ปรับแต่งมาเพื่อความต้องการในโลกแห่งความเป็นจริง คำแปล: ไม่ใช่แค่การสาธิตในห้องปฏิบัติการอีกต่อไป
กรณีการใช้งานทั่วไปที่โดดเด่น
- Memory Moments: ภูมิทัศน์วันหยุด, งานแต่งงาน, ภาพถ่ายวันแรกของการเปิดเทอม เพิ่มชีวิตชีวาเล็กน้อย
- ภาพถ่ายผลิตภัณฑ์: สร้างภาพเคลื่อนไหวของแสงสะท้อน, ไฟ LED หรือไอน้ำจากแก้วกาแฟ
- ฉากธรรมชาติ: ระลอกคลื่น, เมฆที่ลอย, ใบไม้ที่แกว่งไกว ธรรมชาติให้อภัยสิ่งแปลกปลอมเล็กน้อย
- สถาปัตยกรรม: พารัลแลกซ์และการเปลี่ยนแปลงแสงที่นุ่มนวล อย่าบิดเสา
สิ่งที่ไม่ควรสร้างภาพเคลื่อนไหว (มากนัก)
- ท่าทางมือที่ซับซ้อน: มือเป็นเรื่องยาก รักษาสภาพให้คงที่
- รูปแบบที่ดี: ลูกไม้, ตาข่าย, ข้อความเล็กๆ ขอให้โมเดลรักษาสภาพ ไม่ใช่สร้างภาพเคลื่อนไหว
- ดวงตาและปาก: เว้นแต่คุณจะจงใจสร้างเอฟเฟกต์ภาพถ่ายที่พูดได้ ให้ตรึงไว้
ห้าโปรเจกต์แรกของคุณ (การบ้านที่คุณจะชอบจริงๆ)
- ภาพถ่ายต้นไม้บนเดสก์ท็อป: ขอการเคลื่อนไหวของใบไม้ที่นุ่มนวลและการส่ายกล้องเล็กน้อย 3 วินาที
- เส้นขอบฟ้าของเมือง: การเคลื่อนที่ของเมฆที่ละเอียดอ่อนและแสงระยิบระยับในการสะท้อนในหน้าต่าง 4 วินาที
- แก้วกาแฟ: ไอน้ำที่ลอยขึ้นและบรรยากาศร้านกาแฟที่นุ่มนวล 3 วินาที
- ภาพรวมชายหาด: ระลอกคลื่นและลม ไม่มีการเปลี่ยนแปลงทางสีหน้า 4 วินาที
- ถนนกลางคืน: การกะพริบของนีออนและฝนตกปรอยๆ พร้อมระลอกคลื่น 5 วินาที
แต่ละอย่างสอนทักษะให้คุณ การแยกการเคลื่อนไหว, บรรยากาศ, พารัลแลกซ์, การรักษาสภาพใบหน้า และจังหวะลูป
สมุดงาน Prompt ขนาดเล็ก
- จำกัดโมเดล: “สร้างภาพเคลื่อนไหวเฉพาะ .
- โมเดลเต็มรูปแบบสำหรับรอบชิงชนะเลิศ: ความสอดคล้องของเวลาที่ดีขึ้น ข้อผิดพลาดน้อยลงในการถ่ายภาพระยะไกล
หากคุณชนกำแพง
- ลดความซับซ้อนของพรอมต์ของคุณ ลบคำคุณศัพท์ รักษากริยาและคำนามไว้
- ลดจำนวนภูมิภาคที่มีภาพเคลื่อนไหวลงเหลือหนึ่ง
- ลองใช้อัตราส่วนภาพที่แตกต่างกัน (แนวตั้งสามารถซ่อนสิ่งแปลกปลอมพื้นหลังได้)
บทสรุปย่อหน้าเดียว
การสร้างภาพเคลื่อนไหวจากภาพนิ่งด้วย Veo 3.1 ในพื้นที่ทำงานสไตล์ Flow เป็นสิ่งที่น่าติดตาม ในทางที่ดี ให้ภาพที่สะอาดแก่โมเดล, พรอมต์ที่แม่นยำและมีขอบเขตขนาดเล็ก และความยาวสั้นๆ แล้วคุณจะได้วิดีโอเล็กๆ น้อยๆ ที่น่ารื่นรมย์พร้อมการเคลื่อนไหวที่สอดคล้องกันและบรรยากาศเสริม Veo 3.1 และ 3.1 Fast ของ Gemini ทำให้ลูปการทำซ้ำรวดเร็ว ในขณะที่การตั้งค่าโมเดลของ AI Studio ทำให้ผลลัพธ์เป็นประโยชน์สำหรับโปรเจกต์ในโลกแห่งความเป็นจริง กฎทอง: ขอน้อยลง ได้มากขึ้น เริ่มต้นเล็กๆ น้อยๆ กระตุ้น ไม่ใช่ผลักดัน และเมื่อคุณต้องการคำที่ถูกต้อง Sider.AI ช่วยจัดระเบียบพรอมต์ของคุณ เพราะบางครั้งความแตกต่างระหว่าง “ว้าว” กับ “เห้อ” ก็คือประโยคเดียว คำถามที่พบบ่อย
Q1:ฉันจะสร้างภาพเคลื่อนไหวจากภาพนิ่งด้วย Veo 3.1 ใน Flow ได้อย่างไร?
โหลดรูปภาพของคุณลงในพื้นที่ทำงานสไตล์ Flow, เลือก Veo 3.1 หรือ 3.1 Fast, เลือกอัตราส่วนภาพ และเขียนพรอมต์ที่แม่นยำซึ่งอธิบายว่าอะไรควรเคลื่อนไหว เริ่มต้นด้วยคลิปสั้นๆ 3–5 วินาทีแล้วทำซ้ำจนกว่าการเคลื่อนไหวจะดูเป็นธรรมชาติ จากนั้นเปลี่ยนไปใช้ Veo 3.1 เต็มรูปแบบสำหรับการเรนเดอร์ขั้นสุดท้าย
Q2:อะไรคือความแตกต่างระหว่าง Veo 3.1 และ Veo 3.1 Fast สำหรับการแปลงรูปภาพเป็นวิดีโอ?
Veo 3.1 Fast เหมาะสำหรับการร่างอย่างรวดเร็ว เหมาะสำหรับการทดสอบพรอมต์และขอบเขตการเคลื่อนไหว Veo 3.1 ให้ผลลัพธ์ที่สอดคล้องกันและขัดเกลามากขึ้นสำหรับการส่งออกขั้นสุดท้ายของคุณ โดยเฉพาะอย่างยิ่งสำหรับภาพเคลื่อนไหวที่ยาวขึ้นหรือมีรายละเอียดมากขึ้น
Q3:ฉันควรใช้อัตราส่วนภาพใดสำหรับภาพถ่ายเคลื่อนไหว?
ใช้แนวนอน 16:9 สำหรับ YouTube และงานนำเสนอ และแนวตั้ง 9:16 สำหรับ Reels, Shorts และ Stories เลือกอัตราส่วนตามตำแหน่งที่คุณจะเผยแพร่ก่อน เพื่อให้การเคลื่อนไหวของคุณอยู่ในส่วนของเฟรมที่ผู้คนมอง
Q4:ฉันจะป้องกันการบิดเบือนใบหน้าเมื่อสร้างภาพเคลื่อนไหวภาพบุคคลได้อย่างไร?
บอก Veo 3.1 ให้รักษาสภาพใบหน้าไว้เหมือนเดิมและจำกัดการเคลื่อนไหวไว้ที่ผม พื้นหลัง หรือแสง ลดความยาว ลดการส่ายของกล้อง และหลีกเลี่ยงการสร้างภาพเคลื่อนไหวของมือและลักษณะใบหน้า เว้นแต่ว่านั่นคือประเด็นทั้งหมด
Q5:Veo 3.1 สามารถเพิ่มเสียงให้กับภาพนิ่งเคลื่อนไหวของฉันได้หรือไม่?
ได้ Veo 3.1 รองรับเสียงในตัว ดังนั้นคุณสามารถขอเสียงรอบข้างที่ละเอียดอ่อนซึ่งตรงกับฉากของคุณได้ เก็บไว้ในระดับต่ำเพื่อให้การเคลื่อนไหวยังคงเป็นดาวเด่น และดูตัวอย่างบนลำโพงโทรศัพท์และหูฟังก่อนเผยแพร่