Buscar
Cerrar este cuadro de búsqueda.

Gemini AI de Google y la batalla por destronar a Chat GPT

A finales del 2023, la introducción de Google Gemini, un conjunto de grandes modelos de lenguaje (LLM) que incorporan técnicas inspiradas en AlphaGo, marcó la respuesta estratégica de Google a ChatGPT. Con capacidades multimodales y acceso potencial a los extensos datos de entrenamiento patentados por Google de varios servicios, Gemini busca desafiar el dominio de ChatGPT en el espacio de la inteligencia artificial generativa.

Y no nos sorprende en lo absoluto, este movimiento subraya el compromiso de Google con la innovación y competencia en el mercado en rápido crecimiento de la inteligencia artificial generativa que se espera que, tan pronto como en el 2032, tenga un valor de $1.3 billones.

Recordemos el lanzamiento de ChatGPT en noviembre de 2022, que sacudió los cimientos de Google. El popular chatbot representaba una amenaza tan significativa para el negocio que la compañía tuvo que declarar un código rojo e invertir en ponerse al día en el ámbito de la inteligencia artificial generativa. Este esfuerzo no solo ha resultado en el lanzamiento de Google Bard, sino también en Google Gemini.

Esto ocurre meses después de que Google combinara sus laboratorios de inteligencia artificial Brain y DeepMind para crear un nuevo equipo de investigación llamado Google DeepMind, y en mayo del pasado año, Sundar Pichai, CEO de Google y Alphabet, publicó una entrada de blog ofreciendo una visión general de la misma. “Gemini fue creado desde cero para ser multimodal, altamente eficiente en integraciones de herramientas y API, y construido para permitir futuras innovaciones, como la memoria y la planificación.”

Pichai también señaló que “aunque todavía es temprano, ya estamos viendo impresionantes capacidades multimodales no vistas en modelos anteriores. Una vez afinado y rigurosamente probado para la seguridad, Gemini estará disponible en varios tamaños y capacidades, al igual que PaLM 2.” Por otro lado, en una reciente entrevista con la revista Wired, el CEO de Google DeepMind, Demis Hassabis, señaló que Gemini “combinará algunas de las fortalezas de los sistemas tipo AlphaGo con las increíbles capacidades lingüísticas de los grandes modelos”.

Sin lugar a dudas, una de las mayores conversaciones en torno al lanzamiento de Gemini es si este modelo de lenguaje tiene lo necesario para destronar a ChatGPT, que en solo un año alcanzó más de 100 millones de usuarios activos mensuales.

Analicemos los datos. Inicialmente, Google usaba la capacidad de Gemini para generar textos e imágenes como diferenciador respecto a GPT-4, pero el pasado 25 de septiembre, OpenAI anunció que sus usuarios podrían ingresar también consultas de voz e imágenes en ChatGPT. Así lograron un empate temporal pues OpenAI está experimentando con un enfoque de modelo multimodal y ha conectado ChatGPT a Internet —quizás la diferencia más amenazante entre los dos sea la vasta gama de datos de entrenamiento patentados de Google—.

Por su parte, Gemini puede procesar datos tomados de servicios como Google Search, YouTube, Google Books y Google Scholar.

En este artículo exploramos la épica confrontación entre Gemini AI de Google y el consolidado ChatGPT. Descubre cómo la inteligencia artificial redefine sus límites en esta batalla tecnológica. ¿Quién liderará la revolución de los modelos de lenguaje? 

El uso de estos datos patentados en el entrenamiento de los modelos Gemini podría resultar en una ventaja distintiva en la sofisticación de las ideas y deducciones que puede extraer de un conjunto de datos. Esto es especialmente cierto si los informes iniciales de que Gemini está entrenado en el doble de tokens que GPT-4 son correctos.

Además, la asociación entre los equipos de Google DeepMind y Brain este año no puede subestimarse, ya que pone a OpenAI cara a cara con un equipo de investigadores de inteligencia artificial de clase mundial, incluido el cofundador de Google, Sergey Brin, y el científico senior de inteligencia artificial y experto en aprendizaje automático de DeepMind, Paul Barham.

Sin lugar a dudas, este equipo posee una vasta experiencia y un conocimiento profundo sobre la implementación de técnicas avanzadas, como el aprendizaje por refuerzo y la búsqueda de árboles. Utilizan estas herramientas de manera magistral para desarrollar programas de inteligencia artificial capaces de recopilar retroalimentación y perfeccionar su capacidad de resolver problemas con el tiempo. Este enfoque ha demostrado ser altamente efectivo, como se evidenció cuando el equipo de DeepMind empleó estrategias similares para capacitar a AlphaGo, logrando que venciera a un campeón mundial de Go en 2016.

Los datos de entrenamiento son el factor clave; después de todo, la organización que gane la carrera de LLMs se decidirá en gran medida según quién entrene sus modelos en el conjunto de datos más grande y rico.

No queríamos cerrar este articulo sin preguntarle a Chat GPT si se sentía amenazado por Gemini y esta fue su respuesta: “Como modelo de lenguaje desarrollado por OpenAI, no tengo emociones ni opiniones propias. Mi objetivo es proporcionar información y asistencia de manera imparcial. En cuanto a si Gemini de Google podría representar una amenaza para mí, es importante entender que soy una herramienta de procesamiento de lenguaje natural, mientras que Gemini se centra en grandes modelos de lenguaje con capacidades multimodales y técnicas avanzadas. La competencia entre modelos de lenguaje es parte del avance tecnológico en el campo de la inteligencia artificial. Si Gemini u otros modelos logran superarme en algún aspecto, eso podría impulsar la innovación y la mejora continua en este campo. Sin embargo, no tengo la capacidad de experimentar amenazas ni de evaluar el impacto de otros modelos en mi existencia. Mi propósito es proporcionar información y ayudar en la medida de mis capacidades”.

Podemos leer entre lineas que Chat GPT, si bien no se siente “amenazado” porque no tiene la capacidad de expresar emociones, conoce muy bien a Gemini. Como bien reza la frase a tus enemigos… es mejor mantenerlos cerca. 

Compartir