Saltar al contenido

Cómo crear un vídeo con inteligencia artificial a partir de un texto 

Es una de las tecnologías más interesantes del momento: las herramientas de inteligencia artificial generativa en su capacidad de generar vídeo a partir de un texto. Sus resultados, al menos por ahora, distan mucho de ser perfectos. Pero evidencian un paso importante en la creación de contenidos audiovisuales. Empiezan a surgir muchas alternativas, cada cual en su especialidad, y nos permite aplicarlas en nuestros procesos internos durante la elaboración de campañas de publicidad, acciones de comunicación interna y, sobre todo, como contenedora de recursos para proyectos de contenidos. 

¿Son perfectas? No, por supuesto. En muchas ocasiones el resultado es difícil de gobernar, incluso aunque seas un experto en la definición de las instrucciones o “prompts”. Pero con un poco de maña e imaginación se pueden crear algunas propuestas interesantes, ahorrando con ello mucho tiempo. Con ello no quiero decir que se vaya a sustituir a muchos creativos digitales, pero, por ejemplo, sí puede atajar la fase que va de desarrollo de la propuesta hasta su producción. Lo veo útil para diseñar un “storytelling” para una marca de cara a presentarlo a la marca y evitamos, de esta manera, perder dinero en su ejecución técnica. Así que, ¿te imaginas las posibilidades que esto puede ofrecer a los profesionales de la comunicación? 

Vamos a ver unas cuantas herramientas accesibles para cualquier usuario, algunas de pago, pero con la versión gratuita o de pruebas te puedes hacer una pequeña idea de su potencial. Te las dejo por aquí pero lo ideal es que veas el vídeo tutorial para que veas su interfaz y las opciones. 

Leonardo AI y su función “Image2Motion”

La conocida herramienta de IA generativa de imagen LeonardoAI cuenta con una función interesante llamada “Image2Motion”, que permite pasar de texto a vídeo fácilmente. Dispone de varias opciones, entre las que destaca la posibilidad de equilibrar la “imaginación” que le confiere el software. Las imágenes se pueden hacer públicas o, por el contrario, guardarlas en tu librería privada para trabajar con ella con discreción. 

Stable Diffusion Video

El popular modelo de IA generativa de imágenes Stable Diffusion también ha introducido recientemente una opción para pasar de texto a vídeo fácilmente. Este servicio, sin embargo, requiere de unos conocimientos técnicos algo más elevados que otras plataformas y un equipo potente. Puede generar entre 14 y 24 frases por segundo para unas secuencias animadas. La duración del clip está en torno a los 5 segundos, suficientes para trazar un plano de una secuencia. 

RunwayML

Otra propuesta interesante es RunwayML, bastante conocida en el mercado y extendida entre los amantes de este tipo de herramientas. Dispone de varias funciones, como un modo de dirección para controlar ligeramente el clip obtenido. Además, el resultado que obtenemos está bastante conseguido. Yo he logrado hacer un tráiler de una película y sospecho que en un tiempo se perfeccionará hasta límites insospechados. 

Pika

A partir de una descripción, Pika la traduce en cuestión de unos segundos para devolvernos un clip bastante curioso. También ofrece la posibilidad de cargar una imagen estática y animarla fácilmente. Entre sus funciones, además de dejarle más o menos libertad al sistema, cuenta con la posibilidad de controlar más o menos el tiro de cámara. Y, por supuesto, podemos descargar la secuencia obtenida. Es también útil la opción para elegir la relación de aspecto, aunque si vas a utilizarlo para YouTube te recomendaría hacerlo en el estándar 16:9. 

Genmo

Llamada Genmo, esta particular y completa herramienta presenta varias opciones. Una de ellas es la posibilidad de producir vídeo. Es bastante fácil e intuitiva utilizarla. Con solo un “Prompt” vas a recibir una secuencia. Al igual que otras también deja la opción para subir una imagen desde tu equipo para animarla. Si vas a utilizara para crear objetos o animales el resultado es bastante prometedor. 

InvideoAI, apropiado para crear un documental

Me gusta especialmente esta herramienta, que a su vez ha apostado por ser multiplataforma. Es un editor de imágenes que dispone de un espacio para producir vídeo. A diferencia de otras herramientas generativas de texto a vídeo, InvideoAI tiene más inventiva. Y me explico. Lo que hace es generar un vídeo de larga duración a partir de recursos visuales inventados o tomados prestados desde proveedores como iStock y, a partir de ahí, le dota de cierta entidad y añade voz en off de manera automática para tener a disposición una especie de documental. Por supuesto, se pueden editar algunos aspectos. 

LucasAI

Esta es similar a la anterior. Lo que hace es producir una secuencia a partir de una descripción. Así, LucasAI es un recurso para ganar tiempo si lo que queremos es presentar una idea rápidamente o, incluso, para incentivar tu imaginación a partir de una descripción. Por ejemplo, si queremos hacer una campaña para una marca de coches, añadimos brevemente la instrucción lo más precisa y exhaustiva posible y, en cuestión de segundos, vamos a conseguir un pequeño documental.

Lumen5, ideal para presentaciones 

Esta herramienta, en cambio, está más dirigida a profesionales del marketing y la comunicación. Lo que hace Lumen5 es crear unas diapositivas, unas presentaciones, de cierta calidad que pueden ser utilizadas para presentaciones de producto, proyectos de marca o comunicaciones internas. ¿Controlable? Bueno. Se pueden cambiar las diapositivas y los textos que escoge a partir de un texto que se le introduce previamente. En este espacio hay otras alternativas. 

D-iD y sus avatares

Bien. Llegados a este punto, toca conocer a D-iD. Un servicio generativo que está pensado para crear un avatar. Lo que hacemos es elegir el personaje que queremos (deja opción de crear de manera automática un protagonista por medio de la IA), añadir el texto que queremos que narre y elegir la voz y el tono con el que queremos que lo cuente. La voz en español no es totalmente natural, pero se puede utilizar para acciones formativas y comunicaciones internas. O, por qué no, a modo de recurso para ilustrar y acompañar un proyecto de “branded content”. 


Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *