Saltar al contenido

OpenAI se revoluciona con GPT-4o, su nuevo modelo que habla con chatgPT al estilo de Siri

Tenía claro Sam Altman que lo “nuevo” de OpenAI no iba a ir de ningún buscador (que seguro que llega pronto). Esto iba a ir de voz. Y la voz ha sido la protagonista de su último anuncio. La compañía estadounidense ha anunciado la llegada de GPT-4o, su nuevo modelo de lenguaje de gran tamaño que “razona a través de la voz, el texto y la imagen al mismo tiempo”. “Es natural y muy fácil de usar”, explicó Mira Murati, CTO de OpenAI durante la presentación, donde también se ha desvelado la versión de escritorio. 

Puede razonar a través del audio, la visión y el texto en tiempo real. A diferencia de GPT-4, el nuevo modelo será gratuito. Según las estimaciones de la compañía, este modelo será mucho más rápido en todas las posibilidades y tendrá hasta 5  veces de velocidad que GPT-4 Turbo. Funciona como una especie de asistente de voz al estilo de Siri, Alexa o Assistant. Se ha bautizado como GTP-4o por “omnimodel” al entender distintos formatos (texto, imagen, audio). Bajo esta nueva versión los usuarios podrán subir archivos en distintos formatos.

Así, el usuario puede mostrar una imagen o un vídeo y, automáticamente, el sistema va a comenzar a conversar. Se trata de una función similar a lo que Google ha querido hacer con su modelo Gemini. Además, aprovechará  la función memoria para aplicarlo en otras conversaciones en el futuro. Entenderá 50 idiomas diferentes.

“Es un paso hacia una interacción humano-ordenador mucho más natural”, añadió. Acepta como entrada cualquier combinación de texto, audio e imagen y genera cualquier combinación de salidas de texto, audio e imagen. Según sus estimaciones, puede responder a las entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humana en una conversación.

En los últimos años la manera de acceder a la información a través de los motores de búsqueda ha cambiado. Hemos pasado de introducir las palabras clave pertinentes, una manera que han perfeccionado los equipos SEO desde los medios para aparecer los primeros, a realizar búsquedas semánticas a través de un lenguaje natural. Esta manera de interactuar por parte de los usuarios ha ido a más gracias a la popularización de servicios de reconocimiento de audio y la llegada de los asistentes de voz (Siri, Alexa, Assistant…).

Un cambio en la manera de hacer búsquedas

Ahora, y desde hace un tiempo, los usuarios han dejado de escribir en su teclado “Mundial MotoGP resultados” para acceder a los contenidos que aparecen en Google a “Quién ha ganado el campeonato de Cheste de MotoGP”. Esta dinámica, que parece una tontería, no es tanto si comparamos el esfuerzo de los medios de comunicación para posicionarse en este buscador para lograr ser los primeros, lo que todos sabemos qué ocurre: recibir un torrente de tráfico orgánico.

Con la llegada de asistentes como ChatGPT se está generalizando una nueva manera de interactuar, más natural y coloquial si cabe, por la que nos dirigimos a las máquinas como si fuera un amigo, como un colega. Como un asistente que nos acompaña. Esto está repercutiendo notablemente en la forma de elaborar contenidos y buscarlos. Las técnicas SEO tradicionales dejaron de servir hace ya mucho tiempo y me temo que irá a más.

OpenAI ha alcanzado varios acuerdos con grupos editoriales para “entrenar” su chatbot gracias a sus informaciones. Ahí han aparecido desde Axel Springer, que ha sido uno de los primeros en secundar la propuesta del gigante de la tecnología. Pero por el camino han aparecido otras marcas de primer nivel como “Le Monde”, “Financial Times” o Prisa Media. Lo que se ha conseguido es que se suministren las noticias a través de ChatGPT.

Según reveló recientemente “Red de periodistas”, se ha creado una especie de “cláusula ChatGPT” por la cual los medios que alcancen un acuerdo con la empresa de inteligencia artificial tendrán un mejor posicionamiento en el futuro buscador GPT. Esto, que puede ser cuestionable por el impacto directo en la neutralidad en la red, va a cambiar radicalmente la manera de consumir noticias en caso que se generalice.

Las claves de GPT-4o

  • Mejor creatividad

    El nuevo modelo puede generar textos más creativos y narrativas más complejas

  • Comprensión del contexto

    El modelo lograr conversaciones más largas y una mayor coherencia, permitiendo la traducción en tiempo real hasta en 50 idiomas.

  • Interacciones más naturales

    También logra respuestas más humanas y coherentes, permitiendo adaptarse al tono y el estilo del usuario

  • Resolución de problemas complejos

    Además de todo ello, el modelo ha mejorado la capacidad para resolver problemas técnicos y complejos con mayor precisión y rapidez.


Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *