Veo 3 Texto a Video: Cómo Escribir Guiones + *Prompts* Que Consigan Escenas Cinemáticas
Si has probado Veo 3 y has terminado con clips que se sienten planos (demasiado genéricos, demasiado flotantes, demasiado "IA") no estás solo. El secreto no es solo el modelo; es el guion. El lenguaje *prompt* correcto, la gramática visual y la planificación de tomas pueden transformar Veo 3 en un motor cinematográfico.
Esta guía es práctica y directa, diseñada como el manual de un cineasta en activo. Aprenderás a escribir guiones y *prompts* para Veo 3 que produzcan una composición impactante, un movimiento coherente y escenas emocionalmente resonantes, de manera consistente.
Vale la pena señalar: si haces un *storyboard*, iteras y comparas variantes, un copiloto como Sider.AI puede acelerar tu flujo de trabajo en Veo 3 organizando los *prompts*, guardando las plantillas con mejor rendimiento y haciendo pruebas A/B de los cortes uno al lado del otro. Es un "laboratorio de *prompts*" útil para una iteración rápida. ¿Qué Hace Que Un Clip de Veo 3 Se Sienta "Cinemático"?
Lo cinematográfico no se trata de filtros. Se trata de decisiones:
- Encuadre intencional: primer plano/plano medio/fondo, líneas guía, espacio negativo.
- Lenguaje de la lente: la distancia focal implica intimidad o alcance.
- Movimiento controlado: movimiento de la cámara y del sujeto con un propósito.
- Luz + color: fuentes motivadas, relaciones de contraste, armonía de color.
- Ritmo temporal: la edición implícita dentro de una sola toma.
Veo 3 responde bien al lenguaje concreto, nativo del cine. Cuando especificas la lente de la cámara, el tamaño de la toma, el movimiento, la hora del día y la dirección de arte, reduces la ambigüedad y mejoras la coherencia. La guía reciente de la comunidad se hace eco de esto: comienza con la toma, añade movimiento, establece el tono y, a continuación, especifica los detalles. Los creadores también comparten técnicas de *prompt* como listas de tomas estructuradas y verbos cinematográficos para empujar a Veo 3 hacia una intención visual más fuerte.
El Plan de *Prompt* Cinemático (Funciona Para La Mayoría de Las Escenas)
Utiliza este andamio repetible para escribir *prompts* de Veo 3 que parezcan sacados del cuaderno de un director de fotografía.
- Tamaño de la toma: "plano general extremo", "plano general", "plano medio", "primer plano", "macro"
- Lente + profundidad: "anamórfica de 35 mm", "DOF superficial de 85 mm", "macro de 100 mm"
- Posición de la cámara: "ángulo bajo", "vista cenital", "a la altura del hombro"
- "lento *dolly-in*", "balanceo firme en mano", "grúa hacia abajo", "orbita en el sentido de las agujas del reloj", "enfoque selectivo"
- Lo que hace el personaje/objeto; las micro-acciones hacen que el movimiento sea creíble.
- "luz de borde de la hora dorada", "rebote de neón", "cielo suavemente nublado", "claroscuro sombrío"
- Época, paleta, texturas, vestuario, decoración del escenario, ambiente de los efectos visuales.
- "sombrío y contenido", "crescendo esperanzador", "tenso y silencioso"
- Controles de Movimiento y Física
- "física realista", "simulación de tela con peso", "viento sutil desde la izquierda de la cámara"
- "sin texto, sin logotipos, sin marcas de agua; personaje consistente; relación de aspecto cinematográfica 2.39:1"
- "8–10 segundos", "ritmo lento", "detenerse en el sujeto antes del movimiento"
- Consistencia de la Salida
- Si creas una secuencia, fija los *tokens* de estilo: "paleta consistente: verde azulado-naranja con grano de película suave; vestuario consistente: impermeable rojo; peinado consistente: *bob* ondulado"
Primero el Guion, Segundo el *Prompt*: Construye un Micro-*Storyboard*
Antes de escribir un *prompt*, escribe un micro-guion. Una estructura simple de 3 a 5 tomas crea un impulso narrativo incluso en un solo clip de 10 segundos.
Plantilla de estructura:
- Compás 1 (Establecer): lugar, hora, tono del ambiente
- Compás 2 (Involucrar): acción del personaje, un indicio de conflicto o deseo
- Compás 3 (Revelar): un detalle o cambio que modifica la emoción
- Compás 4 opcional (Escalar): la cámara o el sujeto se aceleran
- Compás 5 (Resolver): el encuadre descansa o se mantiene en una imagen fuerte
Ejemplo (Corredor Urbano, 12 segundos en total):
- Toma 1 (4s): Plano general extremo, horizonte al amanecer, empuje lento. Tono: tranquilo, expectante.
- Toma 2 (4s): Plano medio siguiendo al corredor, DOF superficial, respiración condensándose.
- Toma 3 (4s): Primer plano del zapato golpeando un charco; gotas en cámara lenta; la música "se eleva".
Luego transforma cada compás en un *prompt* específico. Si Veo 3 admite multi-segmento, mantén los *tokens* de estilo constantes en todas las tomas.
Patrones de *Prompt* Que Funcionan Consistentemente
Utiliza estos como puntos de partida e intercambia detalles.
Patrón 1: Toma de Establecimiento Épica
"plano general de establecimiento, anamórfica de 35 mm, horizonte de la ciudad en ángulo bajo al amanecer, grúa lenta hacia arriba, niebla sutil que rueda por las calles, luz dorada que besa las fachadas de vidrio, sombras largas, volumetría realista, contraste cinematográfico, tono tranquilo y esperanzador, duración 6 segundos, 2.39:1, sin texto ni logotipos"
Patrón 2: Retrato de Personaje en Movimiento
"plano medio de una mujer con un impermeable rojo, lente de 85 mm con poca profundidad de campo, a la altura del hombro, *dolly-in* constante, gotas de lluvia en el abrigo, mechones de pelo atrapando la luz de fondo, cielo suavemente nublado, paleta de colores fríos con tonos de piel cálidos, viento suave desde la izquierda de la cámara, física realista para la tela y las gotas de lluvia, tono melancólico íntimo, 7 segundos"
Patrón 3: Detalle Macro Táctil
"lente macro de 100 mm sobre el vapor que se eleva de una taza de cerámica, DOF superficial, *bokeh* delicado de luces de hadas prácticas, enfoque selectivo lento desde el borde hasta el vapor arremolinado, clave de tungsteno cálido con relleno azul frío de la ventana, ambiente acogedor y contemplativo, micro-vibraciones mínimas, 6 segundos"
Patrón 4: Seguimiento de Acción
"plano general de un *skateboarder* deslizándose por una piscina vacía, lente de 24 mm, seguimiento dinámico en el sentido de las agujas del reloj, ligero balanceo manual para dar energía, luz dura de la tarde creando sombras gráficas, partículas de polvo en el aire, contraste nítido y contundente, movimiento cinético pero legible, 8 segundos"
Patrón 5: Naturaleza con Escala
"vista aérea extrema de un bosque de pinos en la hora dorada, niebla suave en los valles, deslizamiento lento hacia adelante, destellos de sol suaves, bandada de pájaros cruzando el encuadre de izquierda a derecha, ciencia del color naturalista, tono sereno e impresionante, 8 segundos"
Gramática de la Toma: Lente, Luz y Movimiento Que Señalan "Cine"
- 24–35 mm: ambiente y dinamismo; la ligera distorsión se lee como "inmersiva".
- 50 mm: perspectiva natural; diálogo o retratos.
- 85–135 mm: compresión; fondos íntimos, elegantes y aislantes.
- Menos es más. Comienza con un *dolly* lento o una grúa suave. Añade paralaje a través de objetos en primer plano para vender la profundidad.
- El movimiento en mano insinúa urgencia; utiliza una descripción de pequeña amplitud como "balanceo sutil del hombro".
- Lenguaje de la Iluminación
- Iluminación motivada: describe de dónde "viene" la luz y qué hace.
- Relaciones: "alto contraste", "envoltura suave", "luz de borde" son indicaciones claras.
- Armonía de color: combina una clave cálida con un relleno frío para una separación cinematográfica.
- La niebla, el polvo, la lluvia y el vapor añaden profundidad, pero especifica "volumetría realista" para evitar una neblina turbia.
Escribir Un Guion Ajustado Para Veo 3: Un Ejemplo Práctico
Escenario: Revelación de Callejón de Ciencia Ficción (10 segundos)
Compases del guion
- Establecer (3s): Callejón de neón, suelo resbaladizo por la lluvia, sirena distante.
- Involucrar (4s): El protagonista sale de la sombra, el HUD de la visera parpadea.
- Revelar (3s): Un dron pasa por encima; los reflejos bailan en los charcos.
*Prompt* unificado (estilo de secuencia única)
"callejón de ciencia ficción de neón por la noche, adoquines resbaladizos por la lluvia que reflejan letreros, anamórfica de 35 mm, ángulo bajo, *dolly-in* lento, respiraderos de vapor sutiles, brillo de sirena distante, protagonista con visera reflectante sale de la sombra hacia la luz de borde, parpadeo del HUD de la visera, física de la lluvia realista y reflejos en los charcos, silueta de dron se desliza por encima con un brillo rojo suave debajo, paleta dominante azul-frío con acentos magenta, contraste cinematográfico, 2.39:1, 10 segundos, sin texto, sin logotipos, personaje consistente"
Si Veo 3 admite la composición de múltiples tomas, divide en 3 *prompts* y mantén los *tokens* "callejón de ciencia ficción de neón", "visera reflectante" y la paleta idénticos.
Modos de Fallo Comunes—y Cómo Solucionarlos Con El *Prompt*
- Narración Demasiado Extensa
- Problema: Enfoque difuso y estilo inconsistente.
- Solución: Una acción central por toma; limita los adjetivos a aquellos que se asignan a las imágenes.
- Personajes Inestables Entre Tomas
- Problema: Cambios de vestuario/rostro.
- Solución: Bloquea los *tokens* de estilo: "impermeable rojo, pelo ondulado hasta los hombros, pendiente de aro plateado" en cada toma.
- Problema: Movimiento a la deriva sin intención.
- Solución: Especifica la metáfora del *rig*: "*dolly-in* constante", "trípode bloqueado", "grúa suave hacia abajo". Evita el vago "cámara suave".
- Problema: Aspecto sobreiluminado, parecido al vídeo.
- Solución: Enfatiza la luz motivada: "clave de una sola ventana", "letreros de neón prácticos", "borde de luz de fondo". Añade "contraste cinematográfico" o "sombras suaves".
- Problema: La neblina o el *bokeh* abruman al sujeto.
- Solución: Limita la intensidad: "neblina sutil", "*bokeh* ligero", "volumetría equilibrada".
- Problema: La ropa y las partículas se comportan de forma extraña.
- Solución: "física realista", "tela con peso", "gotas de lluvia con gravedad y salpicaduras".
Biblioteca de Plantillas: Copiar, Pegar, Personalizar
- Diálogo Interior Sombrío
"conversación de dos personas en una mesa de cocina, solo luces prácticas de noche, lente de 50 mm, encuadre por encima del hombro, poca profundidad de campo, clave de tungsteno suave de una lámpara, relleno de ventana azul, acercamiento lento al oyente a medida que la emoción aumenta, tonos de piel naturales, grano de película sutil, 7 segundos, 2.39:1, sin texto"
- Transición de *B-roll* de Viaje
"paralaje manual de la calle del mercado, lente de 24 mm, frutas en primer plano pasando rápidamente por el encuadre, vendedores en el plano medio, templo de fondo, luz cálida de la tarde, látigo rápido hacia la derecha en el desenfoque de movimiento que se resuelve en la fachada del templo, enérgico pero legible, 8 segundos"
- Macro de Producto Estrella
"macro en un *gadget* de aluminio cepillado sobre una superficie de pizarra, lente de 100 mm, deslizador lento a la izquierda, reflejos de los bordes con luz superior suave, especulares controlados, telón de fondo oscuro y sombrío, paleta fría con borde de acento cálido, sensación *premium*, 6 segundos"
- Cambio de Tiempo en la Naturaleza
"plano general de acantilados costeros al amanecer, grúa lenta hacia arriba, niebla baja entrando, gaviotas cruzando el encuadre, la luz dorada calienta las rocas, olas suaves, tono sereno y majestuoso, volumetría realista, 8 segundos"
- Compás de Energía Deportiva
"seguimiento medio de un boxeador golpeando almohadillas en un gimnasio oscuro, lente de 35 mm, balanceo rítmico en mano, partículas de polvo y tiza atrapando la luz superior dura, gotas de sudor, contraste contundente, tono intenso determinado, 7 segundos"
Cómo Construir Secuencias de Múltiples Tomas en Veo 3
- Repite los *tokens* exactos para el vestuario, la paleta, la lente y el aspecto en todas las tomas.
- Escala el Lenguaje de la Cámara
- Comienza estático o lento. Aumenta la densidad de movimiento en cada toma (acercamiento → seguimiento → grúa/órbita) para crear impulso.
- Un accesorio recurrente (paraguas rojo) o un motivo de luz (magenta neón) ayuda a la continuidad.
- Dale a la última toma un momento de quietud para un "punto de edición" implícito.
Atajos de Color y Ambiente
- Cálido Dramático: "clave dorada, relleno suave, sombras profundas, acentos verde azulado"
- Tensión *Noir*: "clave lateral dura, luces prácticas, negros profundos, reflejos de lluvia"
- Acogedor Íntimo: "tungsteno suave, grano ISO alto, textura cercana, DOF superficial"
- Limpio Futurista: "cian frío dominante, reflejos especulares, superficies reflectantes"
- Épico Natural: "hora dorada, rayos de dios volumétricos, sombras frías, escala amplia"
Utiliza tríadas cortas y descriptivas como "clave cálida + relleno frío + luz de borde". Se asignan limpiamente a los resultados de renderizado.
Flujo de Trabajo de Rendimiento: Itera Como Un Cineasta
- Previsualiza con Miniaturas
- Dibuja fotogramas o utiliza una lista de tomas antes de escribir el *prompt*.
- Genera tres variaciones por toma con una variable cambiada (lente, hora o movimiento). Elige la mejor.
- Mantén Una Biblia de *Prompts*
- Guarda frases y *tokens* de alto rendimiento. Etiqueta por estado de ánimo, lente y movimiento.
- Compara Cortes Lado a Lado
- Por cierto, Sider.AI puede ayudar aquí: organiza los *prompts*, almacena los *tokens* de estilo y realiza secuencias A/B para que iteres más rápido y mantengas la continuidad entre las tomas.
- Si los reflejos se recortan o los negros se aplastan, ajusta: "contraste equilibrado", "rango dinámico natural", "desplazamiento suave de los reflejos".
Avanzado: Dirigir la Física, el Clima y las Partículas
- Lluvia: "física de la lluvia realista, viento direccional desde la izquierda de la cámara, salpicaduras visibles en los charcos"
- Nieve: "copos suaves, tamaño variado, deriva lenta, se pega al pelo y al abrigo"
- Niebla/Humo: "ejes volumétricos sutiles; evita el sobrellenado; luz de fondo para la silueta"
- Fuego/Chispas: "brasas controladas; parpadeo cálido; interactúa con el sujeto"
- Tela/Pelo: "tela pesada con inercia; el pelo se levanta ligeramente con las ráfagas de viento"
Añade una sola frase sobre la interacción: "las gotas de lluvia se acumulan en la chaqueta de cuero, ruedan y gotean del dobladillo".
*Anti-Patrones de Prompt* a Evitar
- Apilar demasiados estilos: "cinematográfico + anime + acuarela" diluye la intención.
- Adjetivos no visuales: "hermoso", "genial"; reemplaza con señales compositivas.
- Cronogramas demasiado largos: Mantén 6–10s. Claridad > complejidad.
- Verbos de movimiento vagos: Utiliza metáforas de *rig*; cuantifica la velocidad como "lenta", "suave" o "rápida".
Hoja de Trucos de Inicio Rápido (Copiable)
- `. Los creadores también enfatizan el uso de listas de tomas, llamadas de lentes y verbos de movimiento para lograr resultados "cinemáticos de IA", junto con la iteración lado a lado.
Próximos Pasos: Del *Prompt* Al Mini-Film
- Redacta un micro-guion de 3 a 5 compases para una sola secuencia de 8 a 12 segundos.
- Bloquea tu aspecto: *tokens* de lente, paleta, vestuario.
- Genera trillizos de cada toma; elige el mejor y mantén los *tokens*.
- Reúne y revisa el ritmo; ajusta la densidad de movimiento por toma.
- Itera la iluminación y la atmósfera para refinar el ambiente.
Conclusiones clave
- Sé concreto: lente, movimiento, luz > adjetivos.
- Una acción por toma; escalar a través de las tomas.
- Bloquea los *tokens* de estilo para la continuidad.
- Itera en lotes controlados y compara las variantes.
- Utiliza herramientas como Sider.AI para organizar los *prompts* y realizar pruebas A/B de tus cortes.
FAQ
P1: ¿Cómo escribo *prompts* de Veo 3 para escenas cinematográficas?
Utiliza una estructura nativa de cine: tamaño de la toma, lente, ángulo, movimiento de la cámara, acción del sujeto, iluminación y tono. Mantén cada toma centrada en una acción clara y especifica las duraciones y la relación de aspecto para la coherencia.
P2: ¿Cuáles son las mejores palabras clave de *prompt* para Veo 3 texto a vídeo?
Apóyate en términos concretos como "anamórfica de 35 mm", "*dolly-in* lento", "luz de borde", "poca profundidad de campo", "volumetría realista" y "2.39:1". Evita los adjetivos vagos y apila las señales visuales en su lugar.
P3: ¿Cómo puedo mantener la coherencia de los personajes en las tomas de Veo 3?
Repite los *tokens* de estilo exactos (vestuario, pelo, paleta de colores y accesorios clave) en cada *prompt*. Mantén la lente, la relación de aspecto y los motivos de iluminación consistentes para minimizar la deriva del modelo.
P4: ¿Qué duración funciona mejor para las salidas cinematográficas de Veo 3?
Apunta a 6–10 segundos por toma. Los clips más cortos mantienen la claridad y le dan a Veo 3 suficiente tiempo para renderizar el movimiento, los cambios de iluminación y los efectos atmosféricos sin que se deshaga.
P5: ¿Puede Sider.AI ayudar con la creación de guiones y *prompts* de Veo 3?
Sí. Vale la pena señalar que Sider.AI puede almacenar tus plantillas de *prompt* de mejor rendimiento, organizar listas de tomas y comparar variantes una al lado de la otra para que puedas iterar más rápido y mantener la continuidad visual.