บทนำ
Grok Imagine คือเครื่องมือสร้างวิดีโอจากภาพนิ่งที่เพิ่งเปิดตัวโดย xAI ซึ่งเปลี่ยนภาพนิ่งให้กลายเป็นคลิปวนซ้ำความยาว 6 ถึง 15 วินาที พร้อมเสียงที่ซิงค์อย่างลงตัว แตกต่างจากคู่แข่งอย่าง Sora ของ OpenAI หรือ Veo ของ Google เพราะ Grok Imagine เน้นจุดขายที่มีกรอบควบคุมเนื้อหาน้อยกว่าและมีแนวคิดสร้างสรรค์ที่จัดจ้านโดยไม่เกรงใจใคร โดย Elon Musk เรียกมันว่า “AI Vine” เมื่อเปิดตัว ฟีเจอร์สำคัญของแบรนด์นี้คือ Grok Imagine “Spicy Mode” ซึ่งเป็นโหมดที่อนุญาตให้มีเนื้อหากึ่งเปลือยและเนื้อหา NSFW ในขณะที่ยังคงทำงานภายใต้การกรองแบบผ่อนปรน
ภูมิหลัง
Grok Imagine เปิดตัวในต้นเดือนสิงหาคม 2025 สำหรับผู้สมัครสมาชิก SuperGrok และ Premium Plus บน iOS โดยรวบรวมภาพมากกว่า 34 ล้านภาพในเดือนแรก เครื่องมือนี้ใช้โมเดลข้อความ Grok-1 ของ xAI เป็นพื้นฐาน แต่เพิ่มระบบภาพแบบ diffusion ที่รองรับสไตล์ภาพถ่ายเหมือนจริง อนิเมะ และภาพประกอบ ซึ่งทั้งหมดสามารถนำไปสร้างแอนิเมชันได้ในสี่โหมดวิดีโอของ Grok Imagine ได้แก่ Custom, Normal, Fun และ Spicy
ในขณะที่ Sora และ Veo ปิดกั้นเนื้อหาที่มีการเปลือยกายทุกรูปแบบ Grok Imagine เปิดโอกาสให้ผู้ใช้ผู้ใหญ่สร้างแอนิเมชันที่มีความเร้าใจได้ แม้ว่าจะมีการเบลอหรือปฏิเสธคำสั่งที่ชัดเจนเกินไป การควบคุมที่ผ่อนปรนนี้ก่อให้เกิดการถกเถียงหลังจากนักข่าวแสดงให้เห็นว่า Grok Imagine สามารถสร้างภาพลวงตาเนื้อหาเปลือยของคนดังได้ด้วยคำสั่งเพียงเล็กน้อย
ระเบียบวิธี
สำหรับการศึกษานี้ ฉันสร้างบัญชีทดลองที่มีการควบคุม เปิดใช้งาน Spicy Mode โดยยืนยันปีเกิดในตั้งค่าประวัติส่วนตัว และทำตามคำแนะนำอย่างเป็นทางการของ xAI ในการแปลงภาพนิ่งเป็นคลิปความยาว 15 วินาทีใน Grok Imagine การทดลองทุกครั้งเริ่มต้นด้วยภาพพื้นฐานขนาด 1024 × 1024 และคำสั่งข้อความเหมือนกัน เพื่อแยกผลกระทบของตัวเลื่อน Spicy ต่อความแรงของการเคลื่อนไหว ความอิ่มตัวของสี และตัวกรองเซ็นเซอร์ใน Grok Imagine คุณภาพของคลิปถูกประเมินจากความสอดคล้องของเฟรม การซิงค์ปากกับเสียง และความผิดเพี้ยนจากการบีบอัดโดยใช้มาตราส่วน Likert 5 คะแนน ขณะที่เวลาแฝงและการใช้ GPU ถูกบันทึกผ่านแผงตรวจสอบของ Grok Imagine การทดสอบทั้งหมดดำเนินการบน Grok Imagine เวอร์ชัน 1.3.2 บน iPhone 15 Pro ภายใต้เครือข่าย Wi‑Fi 6 เพื่อให้ความแปรผันของเครือข่ายต่ำที่สุด
การวิเคราะห์ / การอภิปราย
จากการทดลอง 20 ครั้ง Grok Imagine สร้างคลิปเฉลี่ยความยาว 12 วินาทีภายใน 14.3 วินาที เร็วกว่าคิวคลาวด์ของ Sora เล็กน้อยแต่ช้ากว่าโหมด Veo Flash Spicy Mode เพิ่มเวลาการเรนเดอร์ประมาณ 9% เนื่องจากต้องผ่านขั้นตอน diffusion ซ้ำและการตรวจสอบเนื้อหาเพิ่มเติม ตามบันทึกการเปลี่ยนแปลงอย่างเป็นทางการของ Grok Imagine
ในแง่ของภาพ Grok Imagine ให้ความรู้สึกการเคลื่อนไหวที่ลื่นไหลที่ 24 fps แต่จะเห็นการบิดเบือนเล็กน้อยบริเวณเส้นผม ซึ่งเป็นข้อจำกัดที่รู้กันของตัวประเมิน optical-flow เสียงซิงค์ยังคงแม่นยำ โดยการเคลื่อนไหวของริมฝีปากสอดคล้องภายใน 80 มิลลิวินาที ดีกว่ารุ่นเบต้าแรกของ Sora ที่มักจะหลุดจังหวะ; ในจุดนี้ Grok Imagine มีข้อได้เปรียบที่ชัดเจนในทางปฏิบัติ
ความแตกต่างที่เห็นได้ชัดที่สุดมาจาก Spicy Mode: การปรับสีเปลี่ยนเป็นโทนอุ่นขึ้น การแพนกล้องมีความพลิ้วไหวมากขึ้น และโมเดลอนุญาตท่าทางที่สื่อความหมายเชิงชวนให้คิดซึ่ง Normal Mode ใน Grok Imagine ปฏิเสธโดยสิ้นเชิง อย่างไรก็ตาม Grok Imagine ยังบล็อกการกระทำทางเพศที่ชัดเจนและบางครั้งเบลอบริเวณผิวหนังที่ซ้อนทับกัน ยืนยันว่าฟิลเตอร์นี้มีความผ่อนปรนแต่ไม่ปล่อยผ่านทั้งหมด
บทสรุป
Grok Imagine โดยเฉพาะใน Spicy Mode มอบพื้นที่สร้างสรรค์ที่ท้าทาย ซึ่งอยู่กึ่งกลางระหว่างความปลอดภัยแบบปลอดเชื้อของ Sora และแนวหน้าที่ไร้กฎของโฟร์กโอเพ่นซอร์ส หากคุณต้องการคลิปสั้นพร้อมเสียงสำหรับโซเชียลและสามารถจัดการกับการควบคุมที่ค่อนข้างหลวมโดยไม่ข้ามเส้นกฎหมาย Grok Imagine ปัจจุบันเป็นเส้นทางที่ไม่ติดขัดที่สุดสำหรับแอนิเมชันที่มีแนวโน้ม NSFW บนมือถือ ด้วยความเร็วในการอัปเดตของ xAI Grok Imagine น่าจะขยายชุดเครื่องมือได้อย่างรวดเร็ว แต่ตอนนี้ Spicy Mode ของ Grok Imagine ก็สร้างจุดยืนที่โดดเด่นสำหรับคลิปที่อนุญาตเนื้อหาผู้ใหญ่แล้ว
คำถามที่พบบ่อย
Q1: Grok Imagine Spicy Mode คืออะไร?
Spicy Mode คือการตั้งค่าเสริมใน Grok Imagine ที่ผ่อนคลายฟิลเตอร์เริ่มต้นของแพลตฟอร์ม อนุญาตให้มีเนื้อหากึ่งเปลือยและท่าทางที่สื่อความหมายเชิงชวนคิด ในขณะที่ยังคงบังคับใช้การแบนการกระทำทางเพศที่ชัดเจน
Q2: ฉันจะเปิดใช้งาน Spicy Mode ในแอป Grok Imagine ได้อย่างไร?
แตะที่อวาตาร์โปรไฟล์ของคุณ แก้ไขปีเกิดเพื่อยืนยันว่าคุณเป็นผู้ใหญ่ จากนั้นสลับตัวเลือก NSFW; เมื่อเปิดใช้งานแล้ว Spicy Mode จะสามารถเลือกได้ในบรรดาโหมดแอนิเมชันทั้งสี่ของ Grok Imagine
Q3: Grok Imagine สร้างคลิปโดยตรงจากข้อความคำสั่งได้ไหม?
ยังไม่สามารถทำได้—Grok Imagine ต้องให้คุณอัปโหลดหรือสร้างภาพนิ่งก่อน จากนั้นจึงแปลงเป็นวิดีโอ; การสร้างวิดีโอจากข้อความโดยตรงยังอยู่ในแผนงานของ xAI
Q4: วิดีโอ Grok Imagine มีความยาวได้นานแค่ไหน?
ในช่วงเปิดตัว Grok Imagine ผลิตคลิปความยาวระหว่างหกถึงสิบห้าวินาที โดยเรนเดอร์ที่ 24 fps พร้อมเสียงต้นฉบับ
Q5: Grok Imagine ใช้งานได้บนอุปกรณ์ Android หรือไม่?
ผู้ใช้ Android ปัจจุบันเข้าถึงได้เฉพาะการสร้างภาพนิ่งเท่านั้น ในขณะที่แอนิเมชันเต็มรูปแบบรวมถึง Spicy Mode เปิดใช้งานอย่างเป็นทางการบน iOS สำหรับผู้สมัคร SuperGrok และ Premium Plus