Lo último en IA: Google Gemini

Daniela Vidal

12 de diciembre de 2023
3 minutos de lectura

Actualizado: 2 de febrero de 2024

![gafas de IA Géminis](https://static.wixstatic.com/media/efb1e0_9e9a7abbabd0405194840b56ab79a502~mv2.png/v1/fill/w_511, h_383,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/efb1e0_9e9a7abbabd0405194840b56ab79a502~mv2.png)

La inteligencia artificial es la ciencia de fabricar máquinas que puedan pensar como humanos. Puede hacer cosas que se consideran “inteligentes”.

La tecnología de inteligencia artificial puede procesar grandes cantidades de datos de maneras diferentes a las de los humanos. El objetivo de la IA es poder hacer cosas como reconocer patrones, tomar decisiones y juzgar como humanos.

Este diciembre de 2023, Google anunció el lanzamiento de Gemini, en palabras de Demis Hassibis, director ejecutivo de Google DeepMind, Gemini es “el modelo de IA más grande y más capaz de Google.

Géminis puede comprender el mundo que nos rodea, tal como lo hacemos nosotros. así que no sólo texto sino también código, audio, imagen y vídeo”.

Según Google y Alphabet CEO Sundar Pichai_, “_La IA tiene el potencial de crear oportunidades, desde las cotidianas hasta las extraordinarias, para personas de todo el mundo. Traerá nuevas olas de innovación y progreso económico e impulsará el conocimiento, el aprendizaje, la creatividad y la productividad a una escala que no hemos visto antes.

Eso es lo que me entusiasma: la oportunidad de hacer que la IA sea útil para todos, en todo el mundo”.

Las siguientes son algunas de las características que trae Google Gemini para sorprendernos y cambiar la forma en que interactuamos con las máquinas y el conocimiento.

Literatura científica

Gemini lee y extrae datos de cientos de miles de artículos científicos relevantes en pocos minutos, puede generar tablas de información y, al ser multimodal, puede realizar, por ejemplo, gráficos. Y muy importante te puede dar la fuente de la información, un asunto muy importante que es especialmente importante en la ciencia.

Este es un trabajo que requiere mucho tiempo y que los investigadores realizan con mucha frecuencia.

Experiencia a medida

Google Gemini interactúa con el usuario para obtener información más específica sobre su búsqueda, presentando información multimodal como texto, imágenes y videos hasta que las respuestas se ajusten perfectamente a las necesidades del usuario.

Explicar el razonamiento en matemáticas y física.

Una característica de Géminis que nos sorprendió es la capacidad de leer un examen o una hoja de trabajo escrita a mano, identificar qué ejercicios están bien resueltos y cuáles no, y a partir de estos aclarar conceptos equivocados.

Además de lo anterior, podemos pedirle a Géminis que nos sugiera más ejercicios similares para seguir estudiando. Muy útil para padres que tienen que ayudar a sus hijos con sus tareas o exámenes.

Procesando audio sin procesar

Gemini puede comprender archivos de audio con matices delicados como voces o pronunciación, esto le da más riqueza a las preguntas que podemos hacer y a las respuestas que genera.

Por ejemplo, resumir un podcast que puede ser sobre un tema complicado o quizás en otro idioma, o preguntar cómo se pronuncia correctamente una palabra en otro idioma.

Gemini trabaja en conjunto con imagen, audio y texto para que podamos hacer preguntas con nuestra voz, presentar imágenes para ser más específicos o escribir otro tipo de información, Gemini navegará entre la información presentada de diferentes maneras para dar una respuesta más precisa.

Algunas diferencias entre Chat GPT y Google Gemini

A diferencia del chat GPT-4, Google Gemini nos brinda una referencia con un clic de dónde se tomó la información.

Otra diferencia es la integración que tendrá Gemini con productos de Google como Gmail, YouTube, Google Docs, Google Drive, hojas de cálculo y otros servicios.

Según Wired.com, Google dice que Gemini estará disponible para los desarrolladores a través de la API de Google Cloud a partir del 13 de diciembre. Una versión más compacta del modelo alimentará a partir de hoy las respuestas de mensajes sugeridos desde el teclado de los teléfonos inteligentes Pixel 8. Gemini se introducirá en otros productos de Google, incluida la búsqueda generativa, los anuncios y Chrome en los “próximos meses”, dice la compañía. La versión Gemini más poderosa de todas debutará en 2024.

Conclusión

Google Gemini viene a iniciar una era digital que hace apenas unos años sólo veíamos en películas de ciencia ficción, la inteligencia artificial multimodal, es decir, entiende no sólo texto sino también audio, imágenes y códigos, máquinas y programas que piensan como humanos y tan bien como los mayores expertos del mundo en cada materia.

El propósito y la visión de Google son brindar oportunidades a través de la innovación y el progreso económico. Este nuevo año 2024 llevaremos a toda la humanidad a evaluar si el grande de los buscadores lo consigue.

Si quieres leer más blogs sobre IA puedes visitar:

[Cómo ayuda la IA en las terapias biotecnológicas] (https://www.codebranch.co/post/artificial-intelligence-in-healthcare-how-ai-helps-in-biotech-therapies)

Las tecnologías de inteligencia artificial pueden mejorar las relaciones sociales que las pantallas han dañado

Blog de CB | Inteligencia artificial

92 vistas

Publicación no marcada como “me gusta”