Saltar al contenido

Scarlett Johansson, OpenAI y el problema de la IA

Sonaba sensual, atractiva. Incluso flirteaba. La voz denominada “Sky” que recientemente nos mostró OpenAI en su nuevo modelo de lenguaje de gran tamaño (LLM) llamado GPT-4o resultaba demasiado realista. Tanto, que muchos pensábamos que la inteligencia artificial que se recreaba en la magnífica película “Her” estaba cerca de ser real. Y así ha sido.

Desde hace mucho tiempo escucho las películas en versión original. Mi memoria guarda muchos tonos, matices y timbres de voz de los actores que suelo ver. Así que, al igual que se le pasó por la cabeza a unos cuantos, relacionamos una de las nuevas voces de ChatGPT con Scarlett Johansson, actriz que prestaba su voz y conquistaba al personaje que interpretaba Joaquín Phoenix.

Que no, que no, que no

Pregunta seria: ¿tenía su consentimiento? Ahora sabemos que no. La actriz ha reconocido que está “conmocionada” y “enfadada” por el uso de su voz por parte de OpenAI, ya que considera que es “muy similar” a la suya. El giro de guión ha ido a más. La empresa estadounidense fundada por Sam Altman contactó con Scarlett Johansson en noviembre para que prestara su voz a su nuevo chatbot. Tras su negativa, se decidió utilizar una voz muy parecida para “entrenar” al nuevo modelo. Y a raíz de una denuncia por parte de los abogados de la intérprete, la empresa ha confirmado que eliminará esta voz en GPT-4o, aunque no reconocen que se trate de la actriz sino de otra profesional del doblaje. Es decir, OpenAI la imitó contra su voluntad. Pero lo retiran “por respeto” y sin asumir que hayan hecho nada malo.

Esto, tal vez, es una simple anécdota. Pero este escenario postapocalíptico ha derivado en un enorme debate alrededor de la protección de datos. ¿De dónde se extraen las bases de datos para “entrenar” estos desarrollos tecnológicos? Esta es una gran cuestión, pero por ahora las empresas detrás de la inteligencia artificial generativa están actuando en muchas ocasiones como aspiradoras de información que se encuentran en internet.

La voz, según el artítulo 4.1 del Reglamento General de Protección de Datos (RGPD), se considera un dato biométrico. Se considera un dato a proteger siempre y cuando pueda identificar a una persona, como cuando realizamos una llamada telefónica a un proveedor o a una empresa. Esta polémica no viene sino a reforzar las dudas acerca del futuro de la IA tal y como está planteada en estos momentos. Por el momento, muchas empresas, sobre todo, grupos editoriales (Prisa Media, Le Monde, Axel Springer) han alcanzado acuerdos para que sus noticias puedan ayudar a “entrenar” a los modelos de lenguaje de empresas como OpenAI.

“La voz al final es un dato relativo a la propia imagen de la persona, un tema que ya se trata con las cesiones de derechos para audiolibros y similares. Una voz identifica claramente a una persona, más cuando es famoso como es el caso de Scarlett, o como podría pasar con otros famosos cuyas voces son conocidas como Morgan Freeman”, asegura a Verbaliza Sergio Carrasco, experto en derecho digital. En esa misma línea ahonda Borja Adsuara, abogado experto en derecho digital, quien asegura que la voz “es un dato y, al mismo tiempo, forma parte del derecho de imagen”. A su juicio, “esta protegido por el derecho a la propia imagen (artículo 18 de la Constitución Española) y como un dato personal, de los que nos identifica personalmente, con lo que nadie puede captarla y utilizarla sin nuestro permiso para hacer con ella luego, por ejemplo, ‘deepfakes’ de vídeo o de audio en los que nos hacen decir cosas que no hemos dicho.

¿Y la propiedad intelectual?

Estamos ante, posiblemente, un cambio de paradigma en la distribución de la información. A medida que avancen los servicios generativos, la búsqueda de enlaces a través de la web va a ser distinta. Esto, sin duda, va a repercutir en las audiencias masivas que han acumulado muchos medios en los últimos años gracias a los motores de búsqueda y sus estrategias de posicionamiento SEO. Pero, yendo más allá, la protección a la propiedad intelectual se ha quedado en un plano secundario en las distintas regulaciones, como la Ley de Inteligencia Artificial, aprobada recientemente en Europa. Un muro fundamental que reivindican creadores y artistas.

En junio del pasado año, OpenAI recibió una demanda colectiva acusándole de robar datos personales de forma ilegal para potenciar el entrenamiento de ChatGPT. Se le acusó de violar múltiples leyes de privacidad después de utilizar, supuestamente, una técnica conocida como “web scraping” para recopilar los datos necesarios. “Sobre el entrenamiento, hay dos cuestiones. Una es el entrenamiento en sí, y otra lo que se pueda obtener como resultado. En el caso de Scarlett, es que el entrenamiento tenía como objetivo clave el duplicar precisamente esa voz. En temas de propiedad intelectual es bastante más complejo, porque habría que ver si el uso para entrenamiento y su almacenamiento en los diferentes modelos realmente vulnera alguno de los derechos de autor. Un tema complejo, y que no es tan fácil de determinar a priori”, añade Carrasco.

Los distintos acuerdos a los que están llegando otras empresas en internet están modificando la forma de localizar los contenidos. ¿Se ha acabado la privacidad? Los usuarios de Reddit, por ejemplo, pueden interpretarlo así, ya que el conocido foro de internet ha alcanzado un acuerdo con la firma de IA. Y también utilizó más de mil horas de vídeos procedentes de YouTube para mejorar el entrenamiento de GPT-4. ¿El motivo? Se agotaron las fuentes de datos y de textos en inglés.

Imagen: Remix. Prompt: Scarlett Johansson, realistic Photo, get angry, side angle

Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *