Saltar al contenido

Trucos para Elevenlabs, la Ia de texto a audio

Elevenlabs es una de las herramientas de inteligencia artificial generativas más interesantes que nos podemos encontrar. Nos permite crear audio a partir de un texto. Cuenta con diversas voces a escoger y funciones para ajustar algunos de los matices con los que las voces sintéticas creadas narran los textos. Además, podemos usar determinados trucos para sacarle más partido.

Hay algunas formas de introducir una pausa e influir en el ritmo y la cadencia de la IA. La forma más coherente es mediante la descripción. Para ello, lo que vamos a utilizar es la sintaxis <break time=»1.5s» />. Si añadimos esta fórmula va crear una pausa exacta y natural en la frase. No se trata solo de añadir un silencio entre las palabras, sino que la herramienta utiliza una comprensión real de esta sintaxis.

Eso sí, la manera en la que la IA gestiona estas pausas puede variar. Así, algunas voces que han sido entrenadas con interjecciones del tipo “uh” o “ah” han demostrado que a veces insertan esos gestos vocales durante las pausas como lo puede hacer un narrador real. Para tenerlo en cuenta: el tiempo de silencio se describe en segundos y la IA puede utilizar pausas de hasta 3 segundos de duración.

La empresa creadora advierte a sus usuarios que es importante evitar el uso de una cantidad excesiva de etiquetas de interrupción, ya que se ha demostrado que puede provocar inestabilidad. Hay un truco, sin embargo, para lograr un resultado más consistente. Y es usar un guión simple o largo. Incluso se puede utilizar dos guiones para crear pausas más prolongadas. 

Otro truco que nos indica ElevenLabs es usar los puntos suspensivos. También pueden funcionar para añadir una pausa entre palabras, pero generalmente también incorporan algo de “nerviosismo” a la voz, que no siempre encaja con el objetivo que pretendemos de comunicación.

Si deseas, por el contrario, que la IA exprese una emoción específica, el mejor truco es escribir en un estilo similar al de un libro. Es decir, para introducir buenas indicaciones puedes tirar de ejemplos procedentes de libros e identificar palabras y frases que transmitan la emoción deseada. Veamos:

Persona 1: “Cada sorbo de esta leche es como un abrazo matutino, llena de energía y frescura que despierta mis sentidos”, dijo exultante. 
Persona 2: “¡Totalmente de acuerdo! Es como un impulso de vitalidad en cada vaso. ¡Nuestra leche es la clave para empezar el día con emoción y bienestar!”, gritó con convicción 

Este tipo de indicaciones van a ayudar a que la IA comprenda el tono emocional deseado e intentar generar una voz en off que lo refleje con precisión. 

Para controlar el ritmo de la herramienta, puedes utilizar el mismo esquema que si queremos darle emoción, es decir, escribir en un estilo similar al de un libro. Si bien no es una solución perfecta, nos dicen desde la compañía, sí puede ayudar a mejorar el ritmo y garantizar que la IA genere una voz en off a la velocidad adecuada. Con esta técnica, puedes crear locuciones de alta calidad, personalizadas y fáciles de escuchar. Probemos. 


Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

1 comentario en «Trucos para Elevenlabs, la Ia de texto a audio»

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *