Saltar al contenido

ChatGPT o Google gemini: cuál es el mejor

Un robot

La carrera por el control de los chatbots está siendo muy entretenida. OpenAI, firma detrás de ChatGPT, se marcó el triple del año desde que liberó su versión pública en noviembre del 2022. Durante este tiempo ha marcado la pauta en este sector en expansión. Veía por el retrovisor a otras empresas que, tradicionalmente, habían invertido muchos recursos en el área de “Machine learning” o aprendizaje automático: Google. Y ahí, con la virtud del que tiene el dinero, el gigante de internet se ha puesto las pilas gracias a Bard. O, mejor dicho, Gemini, que es como se llama desde ahora.

Ambas compañías están rivalizando en un sector muy goloso. Un informe de McKinsey estimaba que en 2023 la inteligencia artificial iba a generar un valor de mercado en torno a los 44.000 millones de dólares. ¿Se han cumplido los pronósticos? Todavía no lo sabemos, pero la verdad es que la IA en su vertiente generativa tiene un enorme potencial para producir valor económico. Es el pastel que se nos pasa por la cara, por lo que hay demasiado dinero en juego.

En ese contexto, Google ha lanzado recientemente una gran actualización de Bard, su chatbot, aún en fase de pruebas. Ahora ya empieza a tener sentido. Mientras, OpenAI sigue manteniendo un enorme nivel pero las posiciones ahora entre ambas empresas están más reñidas que nunca. Veamos algunas diferencias y puntos fuertes de cada plataforma. 

En cuanto al diseño

ChatGPT tiene la ventaja adicional de ser una plataforma a la que ya estamos acostumbrados desde hace tiempo. Esto produce un efecto ancla en la mente del consumidor ante cualquier cambio estético que se produzca en la competencia. La manera de organizar las entradas anteriores me parece mucho más lógica que en el caso de Bard, que aparece en forma de historial. Aún así, la herramienta de OpenAI cuenta con una estética más ordenada y refinada. 

Debido a su estrategia para potenciar las propuestas personalizadas, el servicio de OpenAI incluye en su menú de opciones el acceso directo a la tienda GPT Store. Esto nos permite tener a disposición y de una manera clara las propiedades de esta característica tan diferencial sobre el resto de competidores.

Por su parte, el desarrollo de Google está dentro de los cánones y la imagen de marca para sus productos. No sorprende, pero es a su vez intuitivo. Una de las opciones más interesantes de Bard es la posibilidad de consultar otras versiones, con lo que se amplían las posibilidades de recibir los resultados más adecuados. 

En cuanto a la base de datos…

Esta es la gran característica que más interés suscita entre los usuarios, la posibilidad de conectar a internet y recibir información actualizada. En este caso, le hemos pedido que nos indique la lista de nominadas a mejor película del año en la próxima gala de los Oscars y, en efecto, nos entrega el resultado, aunque con diferencias: en el caso de GPT-4 añade una pequeña descripción de cada propuesta, que ayuda a una mejor comprensión. En el caso de Gemini, el usuario tiene la ventaja de recibir el “comprobador” de la información y la posibilidad de consultar las fuentes, lo que le confiere una mayor credibilidad a los resultados. Y eso hay que tenerlo en cuenta, máxime a un entorno de “alucinaciones”. 

Sobre el precio

Esto es, sin lugar a dudas, uno de los aspectos que rompe la baja. Mientras que ChatGPT en su versión Plus ofrece un plan de suscripción por valor de 20 dólares al mes, Bard es, por ahora, gratuito. Todavía no se sabe bien cómo piensa Google monetizar esta plataforma. Puede que en un tiempo lo veamos, pero la intención de la compañía es extenderlo por el resto de sus productos digitales para mejorar la experiencia. El precio es elevado, pero hay que valorar bien el uso que se le va a dar. Si lo utilizas para mejorar algunos procesos de tu agencia o tu negocio vale la pena. Es posible, sin embargo, usar esta versión desde Copilot, el servicio conversacional de Microsoft. Aunque luego lo cuento, Bard permite navegar por internet de manera gratuita. 

Sobre los resultados

Los resultados son los aspectos determinantes si enfrentamos ambas herramientas. Si le pedimos a ChatGPT, por ejemplo, la elaboración de un plan de negocio de una marca de coches, la información que nos entrega está bien estructurada. Es directa y organizada. Sin embargo, Bard, que desde ahora cuenta con el modelo de lenguaje de gran tamaño GeminiPro, presenta una notable evolución en su manera de entender las peticiones del usuario. En este caso, se desenvuelve bastante bien y entrega una propuesta amplia en la que, incluso, añade detalles menos genéricos.

Ahora le introducimos un ejercicio de 4 de primaria: “Estoy aprendiendo a cocinar y hoy es el primer día que he hecho un guiso. Por eso, me he equivocado y he echado 30 cucharadas de aceite, 10 menos de las que indica la receta. Con estas pistas que te he dado… ¿Cuántas cucharadas de aceite indica la receta?”. En ambos casos lo resuelve bien, 40 cucharadas, pero en el caso de Bard se desglosan los pasos, mientras que en GPT-4 se añade la respuesta, aunque se sugiere que es una cantidad excesiva y, tal vez, de una manera más escueta. 

En cuanto a problemas de lógica, probamos ahora con: “La nota media conseguida en una clase de 20 alumnos ha sido de 6. Ocho alumnos han suspendido con un 3 y el resto superó el 5. ¿Cuál es la nota media de los alumnos aprobados?”. En ambos casos da el resultado esperado, 8, aunque con distintas explicaciones. 

A bote pronto, podríamos decir que Bard parece más enfocado a ayudar en labores de investigación y planificación, mientras que ChatGPT creo que logra un mejor resultado a la hora de escribir. Otro punto a favor de la plataforma de Google es que permite compartir la información a uno de los servicios de la compañía muy fácilmente, ayudando en tu trabajo diario. Por el contrario, ChatGPT es mucho más poderosos en la integración de plataformas de terceros y el uso de complementos. 

Arriba, Bard; abajo, ChatGPT

Adaptabilidad y optimización 

La gran ventaja que empieza a tener Bard con Gemini es su capacidad para comprender y lograr un contexto a tus conversaciones. Esto permite mejorar parte del razonamiento en esa búsqueda por la eficiencia. El modelo de lenguaje de gran tamaño (LLM por sus siglas en inglés) de Google está diseñado para generar contenidos de todo tipo y es capaz de adaptarse a varios formatos de datos, incluidos textos, imágenes y vídeos. Si lo aprovechan para el asistente tenemos ante nosotros un gran potencial, ya que va a ayudar a mejorar el razonamiento modal. 

Esto se debe al empleo de una arquitectura basada en transformadores (diseñados para generar texto con un estilo conversacional) que pueden comprender mejor los patrones complejos de los datos. En concreto, Bard es capaz de facilitar una modificación de preguntas y respuestas. Es decir, si a ChatGPT le pides que quieres cambiar una respuesta puede que tengas que volver a añadir detalles adicionales para facilitarle el trabajo. 

ChatGPT, por su parte, es muy versátil a la hora de gestionar distintas tareas. También ha mejorado la integración con Microsoft, que le sirve de aliado para ir mejorando su sistema de procesamiento y la cohesión con otras herramientas de ofimática como Excel o Word, logrando así mejores prestaciones para usuarios del mundo del marketing. 

En cuanto a otras posibilidades, Bard puede traducir texto en 100 idiomas y ha mejorado gracias a la última versión la capacidad de razonamiento. Según la documentación proporcionada por Google, el modelo Gemini presenta un rendimiento alto en 30 de los 32 puntos de referencia académicos utilizados en los grandes modelos de lenguaje. El modelo Gemini Ultra (que todavía no es accesible de manera gratuita desde Google Gemini) logra cifras más altas en comparación con GPT-4 en varios puntos de referencia de razonamiento, como Big-Bench Hard, GSM8K y MATH. Esto quiere decir que es capaz de comprender y solucionar problemas complejos de matemáticas. 

Generador de imágenes de manera directa 

Otra de las ventajas de GPT-4 es que permite, con las instrucciones adecuadas, generar imágenes a partir de una instrucción. Esta solución todavía no está disponible en la versión con GeminiPro de Bard, pero posiblemente en los próximos meses estará también para el territorio europeo. Lo que sí es capaz el primero de hacer es analizar una imagen: puedes subir un archivo de una fotografía y pedirle que te haga una descripción. Esta posibilidad tampoco está disponible en la herramienta de Google.

A simple vista, sin embargo, ambos chatbots cuentan con algunas características similares, tales como los formatos de texto (con negritas, títulos…), el historial, los botones de acción rápida (los “me gusta”, por ejemplo). Hay algunas diferencias notables acerca de la atribución de las fuentes. En el caso de Bard, el servicio proporciona un listado enlaces relevantes, mientras que ChatGPT solo cita las fuentes en su versión 4 y de una manera más residual. Este último, además, permite interactuar por medio de comandos de voz pero de una manera bidireccional. 


Ahora CHATGPT es mejor siendo gratuito: trucos para aprovecharlo

Te enseñamos a aplicar las capacidades de GPT 4o, el nuevo modelos de lenguaje de OpenAI que es grat…

Voces sensuales, la sumisión se quiere apoderar de la IA

A pesar de los esfuerzos, el desarrollo de los sistemas basados en inteligencia artificial continúan…

Scarlett Johansson, OpenAI y el problema de la IA

OpenAI retira una voz empleada para su nuevo modelo ChatGPT-4o por su parecido con la de la actriz S…

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *