Saltar al contenido

Las mejores herramientas para transcribir un audio en un texto

Una de las tareas más ingratas de los profesionales de la comunicación es la transcripción de entrevistas. Los que os hayáis enfrentado a esto sabréis de lo tedioso que supone perder unas horas “picando” el texto de un audio. Se malgasta demasiado tiempo. En los últimos años han surgido servicios de audio que convierten la conversación en formato escrito, pero con la explosión de las funcionalidades impulsadas por inteligencia artificial (IA) podemos hacerlo más rápido, más eficiente y de manera más precisa. Para algunos, incluso, es vivir el infierno en la tierra.

Es cierto que ninguna, por el momento, son perfectas. Incluso las herramientas que generan subtítulos logran la ansiada perfección, pero ya sabemos, o al menos desde Verbaliza insistimos siempre, en que la revisión y supervisión humana debe ser continua. Aún así, podemos utilizar algunos servicios para que nuestro trabajo en el departamento de comunicación y marketing sea más agradable y podamos dedicar más tiempo a lo importante: pensar. Eso sí, nos adelantamos a una realidad: es difícil encontrar una herramienta gratuita que sea potente. En su mayoría son de pago.

Good Tape: Es una herramienta accesible, intuitiva y rápida. Una vez registrado, tan solo hay que cargar el audio en formato digital, proveniente de una grabadora de audio o desde el móvil, y lo convierte en texto, el cual se puede copiar y pegar en un documento de texto (Word o Docs) y trabajar sobre él. Es bastante veloz, aunque como resulta obvio todo depende de la duración del contenido. Para un archivo de unos 20 minutos suele tardar unos cuatro o cinco minutos en procesarlo, lo cual no está nada mal. Con ello, podríamos coger el texto y pasarlo por una herramienta de traducción y pasarlo a otro idioma, por ejemplo, del inglés al español, que suele ser una de las tareas diarias a las que nos enfrentamos los profesionales de la comunicación. Uno de sus mejores aspectos es que es gratuito.

Trint: Esta es otra herramienta interesante que permite transcribir entrevistas a partir de un archivo de audio. Es un servicio de pago, pero puede valer la pena pagar si se va a usar con cierta periodicidad. La transcripción es quizás algo lenta. Una vez obtenida la transcripción lo que se puede hacer es descargar la información en un archivo de Google Docs para retocar y modificar los aspectos que consideraremos.

Otter AI: Completa, competente y profunda. Este servicio, que cuenta con funcionalidades impulsadas por IA, permite crear un espacio de trabajo, grabar y transcribir las reuniones a través de herramientas de videollamadas como Zoom. Funciona en inglés. Cuenta con algunas opciones interesantes como subrayar las ideas principales.

WhisperAI: Desarrollado por OpenAI, la compañía detrás de ChatGPT, este servicio es bastante preciso. Cuenta con un modelo basado en código abierto y desde una página de Github se puede instalar. No requiere demasiados conocimientos pero hay que seguir unos pasos para poder hacerlo funcionar. Por el contrario, desde la web Replícate se puede utilizar también.

SpeakAI: Esta herramienta cuenta con varias opciones interesantes más allá de la transcripción. Es capaz de traducir a un idioma el audio cargado, aunque a través de un pago extra. También ofrece la posibilidad de descargar el texto fácilmente para poder utilizarlo en algún procesador que nos permita editar y darle forma a un artículo editorial. Además de ello se recogen datos y analíticas muy útiles para que puedas hacerte una idea de los asuntos importantes, tales como las palabras clave más utilizadas durante la conversación.

Pinpoint: Este es un recurso que ofrece Google para los periodistas. El sistema de procesamiento es algo lento pero bastante preciso a la hora de convertir el audio en texto. Te da garantías y seguridad por ser el gigante de internet quien lo pone en marcha. También se puede editar la transcripción fácilmente para que tenga más sentido. Con ello, lo que haríamos, sería pasarlo a un documento de texto y editarlo.

TurboScribe: Es un servicio bastante rápido. Cuenta con una versión gratuita, que permite transcribir hasta 3 audios por día. Es muy interesante las funciones para exportar, ya que se puede desde traducir con Google Translator, llevarlo a ChatGPT para ordenar las ideas o hacer un sumario de las ideas principales, descargarlo en distintos formatos (doc, PDF, TXT…) y, por supuesto, editar la información.

Sonix.AI: Esta es otra herramienta muy interesante, aunque también requiere de un pago para sacarle todo el provecho. Además de poder transcribir el audio en formato texto, para que puedas exportarlo y crear un artículo periodístico. Se puede editar directamente desde la plataforma y subrayar las ideas principales. Como aspecto importante, el servicio es capaz de traducirlo a otro idioma. De esta forma, si has hecho una entrevista en inglés ya puedes directamente pasarla al castellano en cuestión de segundos. Esto te va a ahorrar mucho tiempo. Los servicios impulsados por IA llevan a esta web a poder hacer resúmenes del contenido, hacer un análisis del sentimiento (por si fuera necesario) y detectar los temas más relevantes.

Cockatoo: Este servicio cuenta con una opción de pago bastante accesible, que permite, entre otras cosas, ampliar la duración del archivo que se carga y los distintos formatos de exportación. La versión gratuita solo acepta hasta 15 minutos de duración como máximo, aunque lo que se podría hacer es partir una entrevista en varios trozos y obtener el texto. La transcripción es bastante precisa, aunque como seguimos insistiendo, hay que revisar a posteriori el resultado porque se aprecian fallos gramaticales y semánticos.

ScriptMe: Esta herramienta funciona muy bien y el resultado que se obtiene es bastante cercano. Hay que corregir algunas expresiones pero lo hace francamente bien. Incluye la opción de traducir directamente para que el proceso de conversión sea rápido. Se puede exportar en distintos formatos como en .doc o .txt. Es de pago, pero bastante accesible.

Transkriptor: Fantástica herramienta que permite transcribir fácilmente un audio. Además, incluye un asistente impulsado por IA que nos ofrece la posibilidad de preguntar sobre el contenido para entender, por ejemplo, la idea que más se repite en la entrevista que hemos protagonizado. Esto puede ayudar a extraer un titular si es necesario. Se puede exportar en distintos formatos.

Skeleton Fingers: A pesar de su extraño y particular nombre, este servicio ayuda a transcribir un archivo de audio en unos minutos. También se puede insertar una URL y que haga lo propio. Tan solo hay que cargar el archivo sonoro y dejar que el software haga el resto. Con ello podemos obtener el texto con el que copiaríamos y pegaríamos en un documento de Word para poder darle forma, ahorrando con ello un tiempo precioso de nuestra jornada laboral.

Pictory.AI: Este servicio es muy completo y se puede convertir a distintos formatos. Funciona en un entorno de escritorio por lo que puede limitar su uso. La versión para una empresa pequeña cuesta unos 19 euros al mes para un usuario, pero vale la pena utilizarlo.

Descript: Este servicio incluye varias opciones, entre ellas, transcribir audio a texto. Está muy orientado al mundo podcast y ofrece numerosas capacidades. Es bastante interesante para utilizarlo como asistente en los procesos de creación de contenido.

Happyscribe: La versión gratuita de este servicio solo ofrece la posibilidad de transcribir 10 minutos, pero la versión de pago se amplía. El resultado es muy preciso e incluye la opción de traducir. A través de su asistente IA, puedes editar el texto, hacer un resumen, generar capítulos por si lo vas a utilizar para un podcast o crear trivials. Es muy interesante.

Notta: Esta herramienta es bastante completa aunque la opción gratuita solo deja transcribir hasta 3 minutos. Las opciones más interesantes requieren de un pago, que por lo general va a ser anual, y el precio es quizás algo elevado. Hay que pensárselo muy bien para justificar esta inversión. También se puede optar por adquirir una licencia y compartirla. También permite traducir, aunque de nuevo esta opción está capada de inicio.

Sincode.ai: Esta alternativa también ofrece buenas sensaciones, aunque la construcción inicial del resultado deja algo de qué desear. Es también de pago, pero incluye funcionalidades inteligentes para reescribir el texto o resumirlo. Esto sirve para adaptarlo a la maqueta que vamos a utilizar en un artículo editorial. Desde su espacio para editar se pueden usar distintas herramientas para dejarlo bonito. Por supuesto, no es perfecto, pero te ahorra mucho tiempo.

Speechnotes: La web incluye una función para dictar el texto por voz y lo va a transcribir, tanto vídeo como audio. Se puede exportar en distintos formatos, tales como .doc y se puede añadir un link procedente de TikTok o YouTube para obtener la información.

Writeout.ai: Este servicio es de pago pero funciona bastante bien. Permite transcribir archivos de audio por 5 euros. 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *