ปัญหาของ “Prompt Engineering” ไม่ใช่แค่ตัวพรอมต์
กับ Sora 2 prompt engineering สิ่งที่เกิดขึ้นคือทุกคนจะแกล้งทำเป็นเข้าใจ—จนกว่าวิดีโอของพวกเขาจะดูเหมือนฝันร้ายที่ถ่ายด้วยกล้องคุณภาพต่ำ กลไกตอบสนองคือใส่คำมากขึ้น โรยคำศัพท์สลับซับซ้อน แล้วหวังว่าระบบจะรู้ใจคุณ แต่มันไม่ใช่แบบนั้น Sora 2 ฉลาดในแบบที่ autocomplete ดีๆ ฉลาดอย่างน่าทึ่งแต่ก็เป็นตัวหนังสือตามตรง พูดให้ชัดเจน อย่าซ่อนใจความสำคัญไว้ในพจนานุกรมคำเหมือน
เครื่องจักรโฆษณาในวงการอยากให้ prompt engineering เป็นเหมือนลัทธิเล่นแร่แปรธาตุ แต่มันไม่ใช่ มันคือการแก้ไข มันคือการชี้นำ มันคือคุณที่รับผิดชอบในการบอกเครื่องจักรว่าคุณต้องการอะไร ด้วยภาษาที่มันไม่สามารถเข้าใจผิดได้ สิ่งอื่นๆ — “คาถาลับ,” การก็อป-วางเวทมนตร์ — มันใช้ได้จนกว่าจะใช้ไม่ได้ Sora 2 ดีกว่านั้น จงปฏิบัติกับมันเหมือนเพื่อนร่วมงานที่รับทุกสิ่งที่คุณพูดแบบตรงไปตรงมา และไม่เคยดูตัวอย่างดิบ
สิ่งที่เรากำลังพูดถึงจริงๆ
ขอเจาะจง: Sora 2 prompt engineering คือศิลปะการเขียนข้อความพรอมต์ (และเมื่อมี ให้ใส่ข้อมูลอ้างอิงและการควบคุม) ที่ทำให้ได้วิดีโอที่สมเหตุสมผลและควบคุมได้ ไม่ใช่ “แรงบันดาลใจ” หรือ “บรรยากาศ” คุณกำลังเขียนกรอบเงื่อนไข—หัวข้อ, การกระทำ, กล้อง, แสง, สไตล์, ระยะเวลา, จังหวะ และความต่อเนื่อง—เพื่อป้องกันไม่ให้โมเดลจินตนาการถึงม้าเปอร์เพิลกลางเมืองของคุณ
วิธีคิดที่ดีที่สุดคือ คุณกำลังร่างสตอรี่บอร์ดด้วยคำพูด ยิ่งพรอมต์ของคุณอ่านเหมือนรายการช็อตที่เฉียบคมพร้อมจุดยืนเท่าไหร่ Sora 2 ก็จะยิ่งทำตามมากขึ้นเท่านั้น แต่ถ้าพรอมต์ฟุ้งเฟ้อ—คำคุณศัพท์มือโยน, สไตล์ศิลปะห้าสไตล์แข่งกัน, ความไม่แน่นอนของช่วงเวลาในวัน—ผลลัพธ์ก็จะเหมือนคอลลาจของสิ่งที่โมเดลจำได้ครึ่งๆ กลางๆ
กรอบการทำงานที่เข้าใจง่ายสำหรับ Sora 2 prompts
แม้ว่าผมจะไม่ชอบกรอบการทำงานเหมือนกัน แต่กรอบนี้คุ้มค่าที่จะใช้ ให้คิดว่าพรอมต์ของ Sora 2 คือ 5 ชั้นเรียงกัน คุณสามารถละเว้นชั้นไหนก็ได้ที่ไม่จำเป็น แต่ถ้าชั้นนั้นหายไป โมเดลจะเติมเต็มด้วยคำพูดธรรมดาๆ
- หัวข้อและเจตนา (“อะไร” และ “ทำไม”)
- มีเพียงหัวข้อหลักหนึ่งหัวข้อ อาจมีหัวข้อรองเพิ่มได้แค่นั้น
- เจตนา: สิ่งที่ผู้ชมควรรู้สึกหรือเข้าใจ
- ตัวอย่าง: “นักปั่นคนเดียวข้ามสะพานหมอกในรุ่งอรุณ เพื่อสื่อถึงความมุ่งมั่นและความเงียบสงบที่เข้มแข็ง”
- ข้อเท็จจริงของฉาก (“ที่ไหน” และ “เมื่อไร”)
- ช่วงเวลาในวัน, สภาพอากาศ, รายละเอียดสถานที่ ชื่อเฉพาะที่ชัดเจนดีกว่าคำคุณศัพท์แบบกวี
- “ชั่วโมงทอง” ดีกว่า “แสงสวยงาม” “พื้นถนนเปียกสะท้อนนีออน” ดีกว่า “ไซเบอร์พังค์”
- กล้องและการเคลื่อนไหว (“อย่างไร”)
- ประเภทช็อต, บรรยากาศเลนส์, การเคลื่อนไหวกล้อง, จังหวะ
- “ดีดกล้องช้าๆ ด้วยเลนส์เทียบเท่า 50 มม.; การสั่นเล็กน้อยของมือถูกลดให้น้อยที่สุด” ดีกว่า “เป็นภาพยนตร์”
- สไตล์ภาพและข้อจำกัด (“ลักษณะ”)
- เลือกแนวสไตล์หนึ่งอย่าง: ภาพสมจริง, ฟิล์ม 16 มม., เซลแอนิเมชัน, สีน้ำ การผสมสามสไตล์คือการชวนให้เกิดความยุ่งเหยิงของเวลา
- จำกัดพาเล็ตต์, พื้นผิว, และยุคสมัย
- ความต่อเนื่องและสิ่งที่ห้าม (“รักษาเสถียรภาพ”)
- ล็อกคุณลักษณะตัวละคร, อุปกรณ์ประกอบฉาก, และรายละเอียดของจักรวาล
- ข้อห้ามที่ชัดเจน: “ห้ามเปลี่ยนชุด; ห้ามข้อความทับซ้อน; ห้ามวัตถุเปลี่ยนรูปร่าง”
Sora 2 prompt engineering ไม่ใช่การยัดคำเพิ่ม แต่มันคือการปิดช่องโหว่ คุณกำลังเขียนสัญญากับเพื่อนร่วมงานที่ยึดตามคำพูดอย่างเคร่งครัด ปิดช่องโหว่ให้หมด
คำสั้นๆ ที่พาคุณไปสู่ปัญหา
- “ภาพยนตร์” หมายถึงทุกอย่างและไม่มีความหมายแท้จริง เปลี่ยนเป็นคำอธิบายกล้อง เลนส์ และการเคลื่อนไหวที่คุณต้องการจริงๆ
- “มหากาพย์” เป็นคำแทนความหมายว่า “ฉันยังตัดสินใจไม่ได้”
- “สมจริงเกินจริง” เน้นไปที่รูขุมขน ลืมองค์ประกอบภาพ
- “บรรยากาศ” ถ้าคุณบอกบรรยากาศไม่เป็นคำนาม คุณก็ไม่มีบรรยากาศ
- “สไตล์ AI ของ [ชื่อนักศิลป์]” นอกจากจะมีปัญหาเด่นชัดแล้ว มันยังทำให้โมเดลสับสนระหว่างสไตล์ผิวเผินกับโครงสร้าง ใช้วัสดุอ้างอิง ไม่ใช่การลอกเลียนแบบ
Sora 2 ไม่เคารพเจตนา แต่มันเคารพคำสั่ง ถ้าพรอมต์ของคุณฟังดูเหมือนเสียงบรรยายตัวอย่างคอนเทนต์ เตรียมรับคลิปสั้นที่รวบรัดและไม่ต่อเนื่องได้เลย
แนวคิดเปรียบเทียบ: กระชับ versus ความเฉพาะเจาะจง
- พวก “พรอมต์สั้น” เชื่อว่า Sora 2 ทำงานดีที่สุดเมื่อปล่อยตามธรรมชาติ—ให้โมเดลเป็นผู้ตัดสิน บางครั้งเป็นจริง พรอมต์สั้นเหมาะเมื่อไอเดียของคุณชัดเจนและภาพชัดเจนจนแทบจะเล่าเรื่องได้เอง เช่น “พายุมืดครึ้มกราดไปบน Monument Valley ตอนพลบค่ำ ช็อตกว้าง” Sora 2 เห็นเรื่องนี้นับครั้งไม่ถ้วน ฐานข้อมูลช่วยได้มาก
- พวก “พรอมต์ยาว” ใส่คำสั่งมากมาย บางครั้งก็จำเป็น หากคุณต้องการความต่อเนื่อง 8 วินาที—เสื้อแจ็คเก็ตเดียวกัน, สุนัขตัวเดียวกัน, แก้วกาแฟเดียวกัน—ความกระชับในที่นี้กลายเป็นปัญหา ต้องกำหนดหรือทนทุกข์
บทสังเคราะห์: ใช้คำสั้นเมื่อข้อมูลพื้นฐานแข็งแรง (ฉากทั่วไป, ฟิสิกส์ที่คุ้นเคย) และใช้รายละเอียดครบถ้วนเมื่อข้อมูลพื้นฐานอ่อน (พร็อพใหม่, การจัดท่าเต้นซับซ้อน, แสงผสม, รายละเอียดแบรนด์) ถ้าคุณไม่รู้ว่าคุณอยู่ในกลุ่มไหน แปลว่าคุณอยู่ในกลุ่มที่สอง
รูปแบบพรอมต์ Sora 2 ที่ใช้งานได้จริง
ใช้เหมือนสูตรอาหาร ไม่ใช่คำสอน เติมในวงเล็บ; ตัดคำฟุ่มเฟือย
- แอ็กชันหัวข้อเดียวกับกล้องควบคุม
พรอมต์: “วิดีโอภาพสมจริง 8 วินาที [หัวข้อ] [ทำการกระทำเดียว] ใน [สถานที่] เวลา [ช่วงเวลาในวัน] กล้องตรึงบนขาตั้ง กลางช็อต จังหวะธรรมชาติ แสงนวลจากฟ้าครึ้ม ระยะชัดตื้น ชุดคงที่: [คำบรรยาย]. ไม่มีการตัด ไม่มีข้อความ ไม่มีเร่งเวลา”
เหตุผล: จำกัดการเคลื่อนไหว ล็อกความต่อเนื่อง ป้องกันโมเดลอยากทำมอนแทจ
- จากภาพรวมสู่รายละเอียดโดยไม่ตัดต่อฉับพลัน
พรอมต์: “10 วินาที เริ่มด้วยช็อตกว้างของ [สถานที่]; ดีดกล้องเข้า 5 วินาที ช่วงวินาทีที่ 6 ค่อยเปลี่ยนเป็นช็อตกลางของ [หัวข้อ] รักษากรอบหน้าจอซ้าย แสงหลังในชั่วโมงทอง แสบตาเลนส์อย่างละเอียดอ่อน โทนสีอุ่นส้มกับน้ำเงินจาง หลีกเลี่ยงการไล่โฟกัสและเปลี่ยนมุมกะทันหัน”
เหตุผล: สอน Sora 2 การจัดลำดับโดยไม่ให้วุ่นวาย
- แอนิเมชันสไตล์มีระเบียบเวลา
พรอมต์: “แอนิเมชันแบบเซลมือ, 12 เฟรมต่อวินาที สีแบน ขอบหนา พาเล็ตต์จำกัด [ระบุ 4 สี] [ตัวละคร] เดินจากซ้ายไปขวาผ่าน [ฉาก] กล้องด้านข้าง มีพารัลแลกซ์เฉพาะฉากหลัง ห้ามหมุนกล้องหรือเปลี่ยนมุม ม้วนจบเล่นซ้ำได้: ตัวละครออกจากด้านขวาของจอ”
เหตุผล: แอนิเมชันรับรู้ระยะเวลาแต่ไวต่อการเปลี่ยนกล้อง ล็อกความราบเรียบไว้
- ให้สภาพอากาศและพื้นผิวเป็นตัวนำ
พรอมต์: “มาโครโคลสอัพ [พื้นผิว] 6 วินาที ติดตั้งขาตั้งกล้อง หยดน้ำฝนก่อตัวและรวมตัวแบบเรียลไทม์ แสงนุ่มจากด้านบน ฉากหลังมืด เสียงมีนัยแต่ไม่แสดง ไม่มีการตัด ไม่มีตัวบุคคล ไม่มีเงากล้อง”
เหตุผล: พื้นผิวเป็นสิ่งที่โมเดลคุ้นเคยดี การจำกัดช่วยป้องกันความผิดปกติ
- ไมโครดราม่าไม่มีบทสนทนา
พรอมต์: “ภาพสมจริง 9 วินาที [ตัวละคร ก], [อายุ/เพศ], ชุด [รายละเอียด], รอที่ [สถานที่] ตรวจข้อความ ยิ้มเล็กน้อย เก็บโทรศัพท์ ช็อตกลางมุมไหล่ ระยะชัดตื้น, แสงเมืองเบลอ การเคลื่อนไหวมือธรรมชาติ ไม่มีขยับปาก ความยาวผม [เท่าที่ระบุ], สวมแหวนที่นิ้วชี้ซ้ายตลอด ไม่มีการเปลี่ยนแบบตัวละครพื้นหลัง”
เหตุผล: ช็อตเล็กในระดับมนุษย์ ล็อกความต่อเนื่องป้องกันเปลี่ยนของกลาง หรือใบหน้าในวิดีโอกลางคลิป
ปัญหาความต่อเนื่อง (และวิธีหยุดการแพ้)
กลเม็ดที่ยิ่งใหญ่ที่สุดของ Sora 2 คือ จุดอ่อนของมัน: มันสร้างเรื่องขึ้นมาเอง นั่นดีจนกว่าถ้วยกาแฟจะย้ายที่ไปมาในแต่ละเฟรม ความแตกต่างของความต่อเนื่องฝังอยู่ในโมเดลเหล่านี้ มันเดาแต่ละช่วงเวลาด้วยโมเมนต์สุดท้ายเป็นหลัก เมื่อพรอมต์ไม่ชัดเจน การเดาจะคลาดเคลื่อน
คำแนะนำที่ไม่ใช่เวทมนตร์:
- ล็อกคำนามเอกพจน์: “แก้วเซรามิกรูปทรงแดงหนึ่งใบ ขอบเก่า อยู่ด้านตะวันออกของโต๊ะ” ไม่ใช่แค่ “แก้ว”
- ล็อกชุด: “แจ็คเก็ตยีนส์สีน้ำเงิน มีสองกระเป๋าหน้า กระดุมทองแดง ไม่มีแพตช์ ห้ามเปลี่ยน”
- กำหนดช่องว่างลบ: “โต๊ะว่าง ไม่มีอย่างอื่นนอกจากแก้ว” หากไม่ห้าม โมเดลจะเติม
- จำกัดการเคลื่อนไหวกล้อง เพิ่มแกนเคลื่อนที่ = โอกาสแตกความต่อเนื่อง
- ใช้จังหวะยึด: “วินาทีที่ 3 หัวข้อเหลือบมองลง; วินาทีที่ 6 หัวข้อหายใจออก” เมื่อเวลาชัดเจน การคลาดเคลื่อนจะน้อย
Sora 2 prompt engineering คือการจัดการความต่อเนื่อง รับเรื่องนี้ และคุณจะได้ผลงานที่ดีกว่า
สไตล์ไม่ใช่เครื่องแต่งกาย แต่มันคือข้อจำกัด
คนมักอยากได้ “Wes Anderson” เหมือนอยากดื่ม “เอสเปรสโซ” ที่จริงหมายถึงอยากใส่น้ำตาล สไตล์ไม่ใช่ชุดใส่ให้หัวข้อใดๆ ใน Sora 2 สไตล์คือชุดกฎที่โมเดลใช้: สี, องค์ประกอบภาพ, การเคลื่อนไหว, แม้แต่พฤติกรรมเลนส์
เลือกอย่างใดอย่างหนึ่ง:
- ภาพสมจริง: รูขุมขน, ความผิดเพี้ยนของเลนส์, ฟิสิกส์สมจริง ดีสำหรับสินค้าและอารมณ์มนุษย์ เข้มงวดกับพรอมต์ผิดพลาด
- เลียนแบบฟิล์ม (16 มม., 35 มม.): เม็ดฟิล์มหยาบ, เงารอบนุ่ม, อิ่มตัวต่ำ ใช้น้อย ระบุยุคฟิล์ม และแสงเรียบง่าย
- แอนิเมชัน (เซล, สต็อปโมชั่น, สีน้ำ): เน้นเส้นชัดเจน, ขอบสม่ำเสมอ, ระนาบกล้องล็อก รายละเอียดเยอะเกินไปทำลายความต่อเนื่องเวลา
- กราฟิก/ภาพวาด: โทนแบน, คอนทราสต์สูง, รูปร่างทรงเรขาคณิต เหมาะกับการเคลื่อนไหวน้อยและจงใจ
ผิดพลาดเวลาขอแสงแบบภาพสมจริง แต่ใช้เส้นภาพวาดอย่างกราฟิก อาจเกิดเสียงรบกวนเชิงเวลา เพราะโมเดลต่อต้านตัวเอง
ตำนาน “ยิ่งมีคำคุณศัพท์เยอะ = วิดีโอดีขึ้น”
ถ้าคุณต้องการผลลัพธ์เฉพาะ จงใช้คำนามและคำกริยาเฉพาะ คำคุณศัพท์เป็นเพียงเครื่องปรุง
- ไม่ดี: “ช็อตภาพยนตร์, มหากาพย์, สมจริงเกินจริง ของรถสวยวิ่งเร็วในเมืองไซเบอร์พังค์อนาคต”
- ดี: “ช็อตภาพสมจริง 6 วินาที รถ Datsun 240Z สีส้มปี 1971 วิ่งในชิบูย่า ในคืนฝนเบา กล้องติดฝากระโปรง 24 มม.เบลอเคลื่อนไหวเล็กน้อย พื้นเปียกสะท้อนสัญญาณนีออน ระดับการจราจรปานกลาง ห้ามตำรวจ ห้ามโลโก้ชัดเจน”
พรอมต์ดีไม่ตะโกน แต่บอกอย่างชัดเจนว่าเกิดอะไรขึ้นที่ไหนอย่างไรและห้ามทำอะไรบ้าง
เมื่อไหร่ควรใช้พรอมต์ยาวจริงๆ
- แอ็กชันหลายช่วงในช็อตเดียว ถ้ากล้องหรือหัวข้อต้องเปลี่ยนพฤติกรรมตามช่วงเวลา ให้บอกให้ชัดเจน
- เนื้อหามีแบรนด์หรือข้อกำหนดที่เข้มงวด ห้ามเกิดภาพโลโก้ลอยหรือพฤติกรรมไม่ปลอดภัย ต้องใช้การพรอมต์เชิงลบไม่ต่อรองได้
- ของหรือโลกที่ประดิษฐ์ขึ้น หากคุณสร้าง “ร่มแก้วที่หักเหแสงไฟถนน” ให้กำหนดโครงสร้างและการทำงาน
- ร่วมกับงานหลังถ่ายภาพ หากคุณรู้ว่าต้องคอมโพส ต้องกำหนดแสง, เบลอการเคลื่อนไหว, และความสะอาดของพื้นหลัง
อย่างอื่น ให้ใช้การพูดยาวเหมือนเกลือ คือใส่เพิ่มได้ แต่เอาออกไม่ได้
การทดลองซ้ำ: ความลับที่น่าเบื่อ
คนสร้างสรรค์มักคิดว่าครั้งแรกต้องตื่นเต้น Sora 2 เร็วจนคุณสามารถทำงานแบบเบสิกและเป็นระบบ:
- เริ่มแบบกลางๆ หนึ่งหัวข้อ, การกระทำเดียว, กล้องเดียว ให้แน่นเรื่องความต่อเนื่อง
- เปลี่ยนทีละอย่าง ถ้าเปลี่ยนแสงและกล้องพร้อมกัน คุณจะไม่รู้ว่าปัญหามาจากไหน
- เก็บบันทึกการเปลี่ยนพรอมต์และผลลัพธ์ อย่างน้อยก็ Google Doc คุณของอนาคตจะขอบคุณ
- ใช้เมล็ดพันธุ์เดิมถ้าใช้ได้ การควบคุมทำให้คาดเดาได้
ความสนุกอยู่ในร่างที่สามเมื่อวิดีโอเรียบร้อยและคุณแทบไม่ต้องทำอะไรเลย ที่จริงแล้วคุณทำคือหยุดให้ข้อแก้ตัวกับโมเดล
หลักประกันที่ช่วยประหยัดเวลา
- ภาษาที่เจาะจงเวลาสำคัญ “วินาทีที่ 4” ดีกว่า “ทีหลัง”
- จุดยึดทางอวกาศสำคัญ “ซ้ายของหน้าจอ” ดีกว่า “ทางซ้าย”
- ฟิสิกส์สำคัญ อย่าขอห้าสิ่งที่ขัดกับการเคลื่อนไหวพื้นฐาน โมเดลเรียนรู้ฟิสิกส์จากโลกจริง อย่าใช้ข้อมูลแย้ง
- หน้าคนยาก ควรล็อกมุมหัว, แสง และระยะถ้าต้องการความเสถียร หลีกเลี่ยงการซูมเร็วไปหน้าเว้นแต่คุณอยากให้หลอมละลาย
- ฝูงชนคือความวุ่นวาย ถ้าต้องใช้ เบลอด้วยระยะชัดตื้นหรือแสงต่ำ อย่าทำให้นักแสดงสมทบกลายเป็นคนสำคัญ
เทมเพลตทำงานสำหรับ Sora 2 Prompt Engineering
ก็อปแล้วแก้ไข ตัดบรรทัดที่ไม่จำเป็นออก
ชื่อ/แท็ก: Sora 2 prompt engineering — [ชื่อโปรเจ็กต์]
เจตนา: [สิ่งที่ต้องการให้ผู้ชมรู้สึกหรือคิดในประโยคเดียว]
ระยะเวลา: [X] วินาที ช็อตเดียวต่อเนื่อง ไม่มีตัดต่อหากไม่ระบุ
หัวข้อ: [หัวข้อชัดเจนหนึ่งหัวข้อ], [อายุ/คำอธิบาย], [รายละเอียดชุด]
ฉาก: [สถานที่], [ช่วงเวลาในวัน], [สภาพอากาศ] อุปกรณ์สำคัญ: [คำนาม] ช่องว่างเชิงลบ: [ที่ต้องว่าง]
กล้อง: [ประเภทช็อต], [บรรยากาศเลนส์], [การเคลื่อนไหว], [จังหวะ] รักษาระดับเส้นขอบฟ้า [ตรง/เอียง] กรอบภาพ: หัวข้ออยู่ [ตำแหน่งจอ]
แสง: [แหล่งแสง], [คุณภาพ], [ทิศทาง] หลีกเลี่ยง [ข้อผิดพลาดของแสงที่ไม่ต้องการ]
สไตล์: [ภาพสมจริง / ฟิล์ม / เซลแอนิเมชัน / อื่นๆ], พาเล็ตต์ [ระบุสีไม่กี่สี] พื้นผิว/เม็ดฟิล์ม [ถ้ามี]
ไทม์ไลน์การกระทำ:
ล็อกความต่อเนื่อง: [รายละเอียดชุด], [สถานะพร็อพ], [สีผม/ตา], [ห้ามข้อความทับ], [ห้ามเปลี่ยนโลโก้]
ข้อห้าม: ห้ามเปลี่ยนรูปร่าง, ห้ามตัดกระโดด, ห้ามเร่งเวลา, ห้ามเปลี่ยนป้ายหลอก, ห้ามสะท้อนกล้อง
การตรวจสอบความเป็นจริง: เครื่องมือไม่สามารถทดแทนรสนิยมได้
แม้จะเขียนพรอมต์ Sora 2 ที่ชัดเจนที่สุดบนโลก แต่ถ้ารสนิยมของคุณไม่ดี วิดีโอที่ได้ก็ยังดูไม่ได้ องค์ประกอบภาพ จังหวะ แสง เหล่านี้ไม่ใช่แฟชั่นแต่คือกฎ Sora 2 ไม่ได้ยกเว้นให้คุณต้องเรียนรู้เรื่องนี้ “prompt engineering” ส่วนใหญ่คือการออกแบบเรื่องที่ละไว้ไม่ทำ: อย่าให้โมเดลทำสิ่งที่ดูตลก อย่าให้มันหมุนกล้องเมื่อความรู้สึกต้องนิ่ง
ถ้ามีพลังลับของ Sora 2 prompt engineering นั่นคือการยับยั้ง ต้องการน้อยได้มาก ต้องการมากได้ซุป
จุดที่ Sider.AI ช่วยได้จริง (และไม่ได้)
Sider.AI ใช้งานได้จริง—อย่างน้อยเมื่อใช้ในงานที่มันถนัด ซึ่งน่าสนใจคือไม่ใช่สิ่งที่ใครๆ โอ้อวด มันไม่ใช่ปุ่ม “สร้างงานศิลปะ” แต่มันเป็นผู้ช่วยที่เตือนให้ไม่ลืมข้อจำกัดพื้นฐาน ร่างพรอมต์ Sora 2 ของคุณ แล้วปล่อยให้ Sider.AI ตรวจสอบเหมือนโปรแกรมตรวจโค้ด: แจ้งเตือนคำคุณศัพท์ที่ไม่มีขอบเขต, การเคลื่อนไหวกล้องที่ขัดแย้งกัน, การขาดล็อกความต่อเนื่อง มันคือนิ้วชี้ที่บอกว่า “คุณขอให้กล้องถือมือและขาตั้งในเวลาเดียวกัน” จุดที่มันช่วยไม่ได้: การสร้างรสนิยม หรือแก้ปัญหาการตัดสินใจ ถ้าคุณไม่รู้ว่าคลิปของคุณควรใช้กล้องเลื่อนหรือกล้องนิ่ง เครื่องมือใดๆ ก็ไม่ตอบได้ แต่เมื่อคุณตัดสินใจแล้ว Sider.AI ช่วยทำพรอมต์ให้ไม่คลุมเครือ ทำซ้ำได้ และกระชับ ตัวอย่างที่ผ่านการปรับแก้: ก่อนและหลัง
ตัวอย่าง 1: ช็อตฮีโร่สินค้า
- ก่อน: “ช็อตภาพยนตร์ มหากาพย์ ของสมาร์ตวอทช์ใหม่เรา บนโต๊ะหินอ่อน แสงจัด น้ำหยด รายละเอียดสูงสุด”
- หลัง: “มาโครภาพสมจริง 6 วินาที สมาร์ตวอทช์ของเรา (41 มม., อะลูมิเนียมสีเงิน, สายฟลูโอโรเอลาโซเมอร์สีดำ) บนหินอ่อนพื้นผิวด้าน ขาตั้งกล้องนิ่ง ดีดกล้องช้าๆ 2% ไม่ใช่ถือมือ กล่องไฟนุ่มแบบบนชัด หน้าจอดับ เม็ดมะยมชี้ตำแหน่ง 3 นาฬิกา ไม่มีโลโก้นอกจากของเรา ห้ามข้อความทับทิม”
สิ่งที่เปลี่ยน: กำหนดทุกตัวแปร ปราศจากคำว่า “มหากาพย์” ผลลัพธ์เหมือนรายการช็อต ไม่ใช่บอร์ดบรรยากาศ
ตัวอย่าง 2: ฉากถนนกับจังหวะมนุษย์
- ก่อน: “ฉากเมืองไซเบอร์พังค์เจ๋งๆ มีคนเดินในบรรยากาศนีออน เป็นภาพยนตร์”
- หลัง: “8 วินาที ภาพสมจริง ซอยข้างชินจูกุกลางคืน ฝนเบา พื้นเปียกสะท้อนนีออน มีคนเดียว: ผู้หญิงวัย 30 ปี เสื้อโค้ททรงเทรนช์สีน้ำเงินเข้ม รองเท้าผ้าใบขาว ตัดผมทรงบ็อบดำ ช็อตกลางกว้าง ระดับตา กล้องกันสั่นนิ่ง ตัวละครอยู่ขวาจอ เดินเข้าหากล้อง โทนโฟรเย็นน้ำเงินผสมม่วงแดงจาง ห้ามป้ายภาษาอังกฤษ ห้ามร่ม ห้ามเปลี่ยนเลนส์”
สิ่งที่เปลี่ยน: หัวข้อหนึ่ง การกระทำหนึ่ง ภาษาแฝงความหมาย คลิปจับจุดได้
ตัวอย่าง 3: วนลูปสไตล์มีเสน่ห์
- ก่อน: “วนลูปแอนิเมชันสนุกๆ แมวในป่ามหัศจรรย์ บรรยากาศ Studio Ghibli”
- หลัง: “แอนิเมชันเซล 12 เฟรมต่อวินาที แมวลายสามสี นั่งบนไม้ตอในลานเล็กๆ หิ่งห้อยล่องลอย กล้องล็อก ด้านข้าง ผสมสีจำกัด: เขียวป่า เหลืองอ่อน น้ำตาลอบอุ่น ครีม ลมพัดเบาใบไม้ แมวกระดิกหางทุก 2 วินาที จบเล่นซ้ำ: ลมและหิ่งห้อยกลับตำแหน่งเริ่มต้น ไม่มีการสั่นของกล้อง”
สิ่งที่เปลี่ยน: ไม่มีการกล่าวอ้างชื่อสไตล์ สไตล์ถูกกำหนดด้วยกฎ ไม่ใช่การอ้างอิง
Prompt Engineering สำหรับทีม Sora 2
ถ้าคุณทำงานกับผู้มีส่วนได้เสีย ศัตรูใหญ่คือการเห็นด้วยด้วยคำคุณศัพท์ ทุกคนอยากได้ “พลังมากขึ้น” และ “ภาพยนตร์มากขึ้น” เหมือนมันเป็นปุ่มหมุน แทนที่คำคุณศัพท์ด้วยทางเลือกที่ชัดเจน
- สร้างสเปคพรอมต์ไม่เกินหนึ่งหน้า เป็นรายการช็อตในประโยค
- เพิ่มเช็คลิสต์อนุมัติ: ระยะเวลา, จำนวนหัวข้อ, กล้อง, แสง, สไตล์, ล็อกความต่อเนื่อง, ข้อห้าม หากยังไม่ผ่านบางส่วน แปลว่ายังไม่เสร็จ
- เก็บพรอมต์ พร้อมผลลัพธ์และบันทึก เวอร์ชันไว้ พรอมต์ทองคำของคุณจะเป็นทรัพย์สิน
ทีมที่วางพรอมต์ Sora 2 เหมือนเอกสารการผลิต จะได้งานที่ดูเหมือนผลิตขึ้นจริง ไม่ใช่แค่ถูกค้นพบ
การแก้ไขปัญหาโดยไม่ต้องใช้ไพ่ทาโรต์
- ภาพตัดต่อโดยไม่คาดคิด มักเกิดจากการที่คุณสื่อถึงการตัดต่อ (เช่น “ในขณะเดียวกัน,” “ทันใดนั้น,” การกระทำหลายอย่าง) หรือใช้ภาษาแบบตัดต่อ ให้บังคับใช้ “ภาพต่อเนื่องเดียว” และลบจังหวะที่ไม่จำเป็นออก
- ใบหน้ามีการเปลี่ยนแปลงอยู่เสมอ ล็อกทิศทางศีรษะ ระยะห่าง และแสง ลดการเคลื่อนไหวและห้ามการซูมเข้าอย่างรวดเร็ว ใช้นามธรรมเกี่ยวกับอารมณ์ให้น้อยลง เน้นการกระทำทางกายภาพมากขึ้น
- อุปกรณ์ประกอบฉากหายตัวไป ระบุชื่ออุปกรณ์ประกอบฉาก กำหนดตำแหน่งสัมพัทธ์กับเฟรมหรือฉาก และห้ามการเคลื่อนไหวเว้นแต่จะระบุไว้ ใช้คำว่า “ยังคงอยู่ที่ [ตำแหน่ง] ตลอดเวลา”
- ภาพดูรก คุณปล่อยให้แบบจำลองเติมเต็มพื้นที่ว่าง กำหนดพื้นที่ว่างและลดการเคลื่อนไหวของพื้นหลัง
- สไตล์มีการเปลี่ยนแปลง คุณขอสองลุค เลือกอย่างใดอย่างหนึ่ง หรืออนุญาตให้เปลี่ยนในช่วงเวลาที่ระบุ
คำแนะนำเกี่ยวกับจริยธรรมและที่มา
การออกแบบพรอมต์ไม่ได้ยกเว้นคุณจากการคิดถึงแหล่งที่มา หากคุณตั้งเป้าที่จะเลียนแบบรูปลักษณ์ของศิลปินที่มีชีวิตอยู่ ให้ถามตัวเองว่าทำไม หากคำตอบคือ “เพราะเป็นที่นิยม” คุณก็หลงทางไปแล้ว ให้ใช้ข้อมูลเชิงลึกเชิงโครงสร้าง เช่น การบล็อกสี ความไม่สมมาตร DOF ที่ตื้น และอธิบายสิ่งเหล่านั้น คุณจะได้สิ่งที่สะอาดกว่า สอดคล้องกันมากขึ้น และเป็นของคุณเอง
บทสรุปที่เงียบสงบ
การออกแบบพรอมต์ของ Sora 2 ในระดับที่ดีที่สุด ดูน่าเบื่อบนกระดาษและน่าประทับใจอย่างน่าประหลาดใจบนหน้าจอ ไม่ใช่เพราะคุณพบคำวิเศษ แต่เป็นเพราะคุณไม่ได้ปล่อยให้เครื่องมือปรับปรุงในส่วนที่สำคัญ สิ่งที่ตลกเกี่ยวกับการกำกับแบบจำลองคือมันให้รางวัลวินัยเช่นเดียวกับฉากจริง: รู้จักหัวข้อของคุณ ล็อกภาพของคุณ จัดแสงด้วยความตั้งใจ ป้องกันไม่ให้พื้นหลังขโมยซีน
หากคุณต้องการคติพจน์ นี่คือ: ใช้นามให้น้อยลง ใช้นามมากขึ้น ใช้ความรู้สึกให้น้อยลง ใช้กริยามากขึ้น พูดในสิ่งที่คุณหมายถึง แบบจำลองจะทำเช่นนั้นอย่างแน่นอน ไม่มากและไม่น้อย ซึ่งเป็นประเด็น
หมายเหตุคำหลัก (สำหรับผู้ที่สนใจ)
บทความนี้ครอบคลุมถึงการออกแบบพรอมต์ของ Sora 2 รวมถึงวิธีการเขียนพรอมต์ที่ชัดเจนสำหรับ Sora 2 ตัวอย่างของพรอมต์วิดีโอ Sora 2 การล็อกความต่อเนื่อง คำแนะนำเกี่ยวกับกล้อง และข้อจำกัดด้านสไตล์ หากคุณอ่านมาถึงตรงนี้ ขอแสดงความยินดี: ตอนนี้คุณรู้แล้วว่าทำไม “cinematic” ถึงเป็นคำที่ไม่ cinematic ที่สุดในธุรกิจนี้
คำถามที่พบบ่อย
คำถามที่ 1: การออกแบบพรอมต์ของ Sora 2 คืออะไร
คือการเขียนคำแนะนำที่ถูกต้องแม่นยำสำหรับ Sora 2 ได้แก่ หัวเรื่อง กล้อง แสง สไตล์ และความต่อเนื่อง เพื่อให้แบบจำลองไม่อ่านผิดพลาด ยิ่งมีช่องโหว่น้อยลงในพรอมต์ Sora 2 ของคุณ วิดีโอก็จะยิ่งดีขึ้น
คำถามที่ 2: ฉันจะเขียนพรอมต์ Sora 2 ให้ดีขึ้นได้อย่างไรโดยไม่ฟังดูเหมือนกวี
ใช้คำนามและคำกริยา: ใครทำอะไร ที่ไหน และอย่างไร สำหรับการออกแบบพรอมต์ของ Sora 2 ให้แทนที่ “cinematic” ด้วยเลนส์ การเคลื่อนไหว และจังหวะเวลา แทนที่ “vibe” ด้วยข้อเท็จจริงของฉากและพื้นที่ว่าง
คำถามที่ 3: ทำไมวิดีโอ Sora 2 ของฉันถึงเปลี่ยนชุดและอุปกรณ์ประกอบฉากกลางฉาก
ความต่อเนื่องคลาดเคลื่อน ล็อกตู้เสื้อผ้า ตำแหน่งอุปกรณ์ประกอบฉาก และลักษณะตัวละครอย่างชัดเจนในพรอมต์ Sora 2 และห้ามการสลับ หากคุณไม่ได้ห้าม แบบจำลองจะถือว่าสามารถทำได้
คำถามที่ 4: พรอมต์ Sora 2 ควรสั้นหรือยาว
สั้นเมื่อคุณพึ่งพาความรู้เดิมที่แข็งแกร่ง (ฉากที่เรียบง่ายและเป็นสัญลักษณ์) ยาวเมื่อคุณต้องการรายละเอียดใหม่หรือจังหวะเวลา ในการออกแบบพรอมต์ของ Sora 2 การใช้คำมากเกินไปเป็นเครื่องมือ ไม่ใช่คุณธรรม
คำถามที่ 5: วิธีที่เร็วที่สุดในการปรับปรุงผลลัพธ์ของ Sora 2 ในวันนี้คืออะไร
ตัดคำคุณศัพท์ ล็อกกล้อง และระบุหัวเรื่องและการกระทำเดียว เพิ่มการล็อกความต่อเนื่องและค่าลบ การออกแบบพรอมต์ของ Sora 2 ส่วนใหญ่เกี่ยวกับการปิดช่องโหว่