Saltar al contenido

Google presenta VideoPoet, una herramienta para crear vídeo desde texto  

Uno de los grandes avances en inteligencia artificial generativa ha sido la función de “texto a vídeo”. Este concepto se ha venido incorporando en algunos servicios ya disponibles. Este atributo permite, entre otras cosas, obtener una imagen en movimiento a partir de una instrucción o “prompt”. Con ello, se anima un objeto estático. No siempre es consistente. Pero supone un paso hacia delante en este campo en el que Google también ha presentado sus credenciales.

Se trata de VídeoPoet, una herramienta de lenguaje avanzado diseñado para generar vídeos sin guía previa. Puede obtener vídeos en alta calidad a partir de una simple indicación de texto. También cuenta con otras funciones interesantes. Por ejemplo, también es posible producir una secuencia a partir de una imagen que se carga directamente al servicio, pero también pintar o editar ese mismo vídeo. Incluso es capaz de introducir audio coincidiendo con el vídeo de entrada.

Estas funciones multimodales son: de texto a vídeo, de texto a imagen, de imagen a vídeo, continuación de fotogramas de vídeo o relleno de vídeo. Estas tareas se pueden combinar para capacidades de generación sin guía adicional. Además, admite una generación de vídeo en orientación cuadrada o retrato. Y se adapta a contenidos de formato corto. 

El servicio todavía no es accesible para los usuarios, pero los primeros resultados obtenidos muestran un buen avance. Este tipo de herramientas puede ser útil para la obtención de material gráfico para una campaña de publicidad o ilustrar un contenido de “branded content” o contenidos de marca. Esto va a permitir crear ilustraciones animadas de tal manera que llamarán poderosamente la atención en distintas campañas. 

Producir y ensamblar la secuencia 

De esta manera, esta herramienta puede ayudar a obtener recursos a la hora de contar historias en las que se combina texto y vídeo. De hecho, para demostrar su capacidad, la compañía ha producido un corto titulado “Rookie the Racoon”, donde se utilizaron sugerencias de texto en cada escena. A posteriori, se ensamblaron las secuencias resultantes.

La metodología de VideoPoet incluye un “tokenizador” de vídeo preentrenado (llamado MAGVIT V2) y un “tokenizador” de audio (que han venido a llamarlo SoundStream), que transforman imágenes, videos y clips de audio en código. Este código es compatible con los actuales modelos de lenguaje basados en texto. El modelo, además, “aprende” a predecir secuencialmente las próximas ideas de video o audio en la secuencia.

  • Aquí van algunos ejemplos:

Prompt: a astronaut riding a horse in a lush forest

Prompt: «Adventure game concept art of a sunrise over a snowy mountain by a crystal clear river”


Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

1 comentario en «Google presenta VideoPoet, una herramienta para crear vídeo desde texto  »

  1. Este tipo de herramientas son divertidas pero habrá que ver cómo evolucionan. En cualquier caso es interesante porque permite ahorrar algún tiempo en producción audiovisual. Lo veo práctico para un video de comunicación interna

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *