Giới thiệu
Grok Imagine là trình tạo video từ hình ảnh mới ra mắt của xAI, chuyển một hình ảnh tĩnh thành các clip lặp dài từ 6 đến 15 giây kèm âm thanh đồng bộ. Khác với các đối thủ như Sora của OpenAI hay Veo của Google, Grok Imagine nổi bật với ít giới hạn hơn và phong cách sáng tạo táo bạo, khi Elon Musk gọi đây là “AI Vine” ngay khi ra mắt. Trung tâm của thương hiệu này là chế độ “Spicy Mode” trong Grok Imagine, cho phép nội dung bán khỏa thân và các nội dung NSFW khác trong khi vẫn hoạt động trong các bộ lọc kiểm duyệt lỏng lẻo.
Bối cảnh
Grok Imagine ra mắt đầu tháng 8 năm 2025 dành cho người dùng SuperGrok và Premium Plus trả phí trên iOS, nhanh chóng thu hút hơn 34 triệu hình ảnh trong tháng đầu tiên. Công cụ này dựa trên mô hình ngôn ngữ Grok‑1 trước đó của xAI nhưng bổ sung backend hình ảnh dựa trên khuếch tán có khả năng tạo phong cách ảnh chân thực, anime và minh họa, tất cả đều có thể được hoạt hình hóa trong bốn chế độ video của Grok Imagine: Custom, Normal, Fun và Spicy.
Trong khi Sora và Veo hiện chặn mọi hình thức khỏa thân, Grok Imagine cho phép người dùng trưởng thành tạo ra các hoạt hình gợi cảm, mặc dù sẽ làm mờ hoặc từ chối các yêu cầu quá mức về nội dung khiêu dâm. Việc kiểm duyệt lỏng lẻo này đã gây tranh cãi sau khi các nhà báo chứng minh Grok Imagine có thể tạo deepfake khỏa thân người nổi tiếng với rất ít sự hỗ trợ.
Phương pháp nghiên cứu
Trong nghiên cứu này, tôi đã tạo một tài khoản kiểm soát trong phòng thí nghiệm, bật Spicy Mode bằng cách xác minh năm sinh trong cài đặt hồ sơ, và làm theo hướng dẫn chính thức của xAI để hoạt hình hóa một hình ảnh tĩnh thành clip 15 giây trong Grok Imagine. Mỗi thử nghiệm bắt đầu với cùng một hình ảnh cơ bản 1024 × 1024 và cùng một đoạn văn bản để cô lập ảnh hưởng gia tăng của thanh trượt Spicy lên cường độ chuyển động, độ bão hòa màu và các bộ lọc kiểm duyệt trong Grok Imagine. Chất lượng clip được đánh giá dựa trên sự mạch lạc của khung hình, đồng bộ âm thanh - môi, và các hiện tượng nén bằng thang điểm Likert năm mức, trong khi độ trễ và mức sử dụng GPU được ghi lại qua lớp chồng chẩn đoán của Grok Imagine. Toàn bộ thử nghiệm được thực hiện trên phiên bản Grok Imagine 1.3.2 chạy trên iPhone 15 Pro kết nối Wi‑Fi 6 để giảm thiểu biến động mạng.
Phân tích / Thảo luận
Trong 20 lần thử, Grok Imagine tạo ra clip trung bình dài 12 giây trong 14,3 giây, nhanh hơn một chút so với hàng đợi đám mây của Sora nhưng chậm hơn chế độ Flash của Veo. Chế độ Spicy làm tăng thời gian kết xuất khoảng 9% do thêm một lần khuếch tán thứ hai và một lượt kiểm duyệt bổ sung, theo nhật ký thay đổi chính thức của Grok Imagine.
Về mặt hình ảnh, chuyển động nội suy của Grok Imagine mượt mà ở tốc độ 24 fps, tuy nhiên có hiện tượng biến dạng nhẹ quanh các sợi tóc, đây là hạn chế đã biết của bộ ước lượng dòng quang học. Đồng bộ âm thanh vẫn ổn định, với chuyển động môi khớp trong vòng 80 ms, vượt trội hơn so với các phiên bản beta đầu của Sora vốn thường bị lệch nhịp; ở đây Grok Imagine thể hiện ưu thế rõ ràng về mặt thực tiễn.
Sự khác biệt rõ rệt nhất đến từ Spicy Mode: tông màu được chỉnh ấm hơn, các cảnh quay camera có thêm sự uyển chuyển, và mô hình cho phép các tư thế gợi cảm mà Normal Mode trong Grok Imagine hoàn toàn từ chối. Tuy nhiên, Grok Imagine vẫn chặn các hành động tình dục rõ ràng và thỉnh thoảng làm mờ các vùng da chồng lên nhau, xác nhận rằng bộ lọc có phần nới lỏng nhưng không hoàn toàn vắng mặt.
Kết luận
Grok Imagine, đặc biệt là trong Spicy Mode, mang đến cho các nhà sáng tạo một sân chơi khiêu khích nằm giữa sự an toàn khô khan của Sora và vùng biên pháp luật của các phiên bản mã nguồn mở tự do. Nếu bạn cần các clip xã hội ngắn, sẵn sàng với âm thanh và có thể điều hướng qua các quy định lỏng lẻo mà không vi phạm pháp luật, Grok Imagine hiện cung cấp con đường thuận tiện nhất để tạo hoạt hình thiên hướng NSFW trên thiết bị di động. Với tốc độ cập nhật nhanh của xAI, Grok Imagine có khả năng mở rộng bộ công cụ rất nhanh, nhưng hiện tại Spicy Mode của Grok Imagine đã tạo ra một vị trí đặc biệt cho các clip cho phép dành cho người lớn.
Câu hỏi thường gặp
Q1: Grok Imagine Spicy Mode là gì?
Spicy Mode là một tùy chọn trong Grok Imagine giúp nới lỏng các bộ lọc mặc định của nền tảng, cho phép nội dung bán khỏa thân và gợi cảm trong khi vẫn cấm các hành động tình dục rõ ràng.
Q2: Làm thế nào để bật Spicy Mode trong ứng dụng Grok Imagine?
Chạm vào ảnh đại diện của bạn, chỉnh sửa năm sinh để xác minh bạn là người trưởng thành, sau đó bật tùy chọn NSFW; khi đã kích hoạt, Spicy Mode sẽ trở thành lựa chọn trong bốn chế độ hoạt hình của Grok Imagine.
Q3: Grok Imagine có tạo clip trực tiếp từ lệnh văn bản không?
Chưa có—Grok Imagine yêu cầu bạn tải lên hoặc tạo trước một hình ảnh tĩnh, sau đó nó sẽ hoạt hình hóa thành video; chức năng chuyển đổi trực tiếp từ văn bản sang video vẫn nằm trong kế hoạch phát triển của xAI.
Q4: Video Grok Imagine có thể dài bao lâu?
Khi ra mắt, Grok Imagine tạo các clip dài từ sáu đến mười lăm giây, mỗi clip được xuất ở 24 fps kèm âm thanh gốc.
Q5: Grok Imagine có hỗ trợ thiết bị Android không?
Người dùng Android hiện chỉ có quyền truy cập sớm vào tính năng tạo ảnh tĩnh, trong khi tính năng hoạt hình đầy đủ—bao gồm Spicy Mode—chỉ chính thức có trên iOS dành cho người đăng ký SuperGrok và Premium Plus.