Ayer, Google anunció su última innovación en inteligencia artificial, Google Gemini 1.5, y sus impresionantes avances superaron incluso al modelo de texto a video de OpenAI, Sora.
Sin embargo, aunque el lanzamiento de OpenAI ha destacado en las redes sociales debido a sus videos virales, cuando se trata de aspectos técnicos y uso práctico en la vida diaria, el Gemini 1.5 realmente se destaca y ofrece mucho más.
El Gemini 1.5 es capaz de manejar una cantidad sorprendente de información. Superando ampliamente las ventanas de contexto anteriores de alrededor de 200 mil tokens, el Gemini 1.5 puede procesar hasta 1 millón de tokens, equivalente a una hora de video o más de 700,000 palabras.
Un ejemplo notable del poder del Gemini 1.5 es su habilidad para analizar los registros de la misión Apollo 11, que constan de 402 páginas.
Basándose en este extenso documento, el Gemini 1.5 puede desglosar y razonar sobre conversaciones y eventos detallados, demostrando su competencia en el manejo de documentos complejos y extensos.
Además, el Gemini 1.5 muestra su capacidad para comprender textos extensos con el ejemplo de Los Miserables, que tiene 1382 páginas y 732 mil tokens.
Con el Gemini 1.5 Pro, es posible identificar y localizar una escena específica de una famosa serie a partir de un conjunto de palabras clave proporcionado.
Pero el punto destacado del Gemini 1.5 va más allá del análisis de documentos. Con su habilidad única para interpretar y comprender videos, pudo analizar una película muda de 44 minutos del famoso Buster Keaton.
Además, el Gemini 1.5 mostró su capacidad para encontrar palabras «ocultas» en documentales, como en una película sobre el AlphaGo.
Además, el Gemini 1.5 se destaca en el análisis de código, ofreciendo soluciones valiosas y explicaciones detalladas para problemas de desarrollo de software.
Con la capacidad de analizar más de 100,000 líneas de código de una sola vez, el Gemini 1.5 demuestra ser una herramienta poderosa para desarrolladores e ingenieros.
En el campo de la traducción de idiomas, el Gemini 1.5 ha demostrado innovaciones impresionantes.
Aprendió a traducir del inglés al Kalamang, un idioma con menos de 200 hablantes, sin necesidad de ajustes previos. Esta capacidad destaca el potencial del Gemini 1.5 en el aprendizaje y la traducción de idiomas.
Aunque el anuncio de Google fue considerado menos emocionante y más técnico, el Gemini 1.5 se destaca como un logro impresionante de Google.