Google anunció durante el Google I/O 2024 la disponibilidad del Gemini 1.5 Pro, un modelo más avanzado que se destaca por su ventana de contexto extremadamente amplia, de 1 millón de tokens, lo que permite el procesamiento de cantidades masivas de información de una sola vez.
Esto significa que el Gemini 1.5 Pro puede analizar videos de una hora, códigos con más de 30 mil líneas y documentos complejos con extrema precisión.
Además, el Gemini 1.5 Pro trae mejoras en áreas como generación de código, razonamiento lógico, planificación y comprensión de imágenes y audio.
En la práctica, esto significa que podrás tomar una foto de un plato en tu restaurante favorito y pedir una receta, o fotografiar un problema de matemáticas y obtener instrucciones paso a paso para resolverlo.
El Gemini 1.5 Pro forma parte del paquete Gemini Advanced, una suscripción de pago que también ha ganado otras funcionalidades interesantes.
Una de ellas es la posibilidad de crear «Gems», versiones personalizadas del Gemini que funcionan como asistentes virtuales para diversas actividades.
¡Imagina tener un entrenador personal virtual que te dé un plan de carrera diario motivacional, o un sous chef digital que te ayude en la cocina!
Extensiones y planificación inmersiva para todos los usuarios
Otra novedad anunciada por Google son las extensiones de Gemini, que permiten la integración con otras aplicaciones.
A partir de hoy, ya está disponible la extensión de YouTube Music, que permite buscar canciones mencionando un fragmento favorito o artista participante. En los próximos meses, veremos extensiones para Google Calendar, Tasks, Keep y diversas otras aplicaciones.
¡Y hay más! Todos los usuarios de Gemini tendrán acceso a una función llamada «planificación inmersiva». Imagina planificar un viaje en familia teniendo en cuenta los intereses de todos.
Basta con informar a Gemini tu destino y preferencias, y te entregará un itinerario personalizado que incluya vuelos, hoteles, atracciones turísticas, tiempo de desplazamiento y hasta sugerencias de restaurantes según tus gustos.
Gemini Flash, Gemma 2 y otras novedades para desarrolladores
Google también anunció novedades para desarrolladores. El Gemini 1.5 Flash es el modelo más rápido y versátil de la serie, ideal para usar en aplicaciones que demandan baja latencia y costo.
Mantiene la ventana de contexto de 1 millón de tokens y se entrena a través de un proceso llamado «destilación», donde el conocimiento esencial del 1.5 Pro se transfiere a un modelo más ligero.
Además, Google dio un adelanto de lo que está por venir con Gemma 2, una versión aún más poderosa del Gemini con 27 mil millones de parámetros, y anunció su nueva generación de TPU, el Trillium, un procesador especializado en tareas de inteligencia artificial con un rendimiento extremadamente alto.