Google Gemini 1.5 supera a OpenAI Sora em avances impresionantes: entiende lo que fue anunciado

Rene Fraga
3 minutos de lectura

Ayer, Google anunció su última innovación en inteligencia artificial, Google Gemini 1.5, y sus impresionantes avances superaron incluso al modelo de texto a video de OpenAI, Sora.

Sin embargo, aunque el lanzamiento de OpenAI ha destacado en las redes sociales debido a sus videos virales, cuando se trata de aspectos técnicos y uso práctico en la vida diaria, el Gemini 1.5 realmente se destaca y ofrece mucho más.

El Gemini 1.5 es capaz de manejar una cantidad sorprendente de información. Superando ampliamente las ventanas de contexto anteriores de alrededor de 200 mil tokens, el Gemini 1.5 puede procesar hasta 1 millón de tokens, equivalente a una hora de video o más de 700,000 palabras.

Un ejemplo notable del poder del Gemini 1.5 es su habilidad para analizar los registros de la misión Apollo 11, que constan de 402 páginas.

Basándose en este extenso documento, el Gemini 1.5 puede desglosar y razonar sobre conversaciones y eventos detallados, demostrando su competencia en el manejo de documentos complejos y extensos.

Imagen relacionada con Google Gemini 1.5 supera a OpenAI Sora em avances impresionantes: entiende lo que fue anunciado

Además, el Gemini 1.5 muestra su capacidad para comprender textos extensos con el ejemplo de Los Miserables, que tiene 1382 páginas y 732 mil tokens.

Con el Gemini 1.5 Pro, es posible identificar y localizar una escena específica de una famosa serie a partir de un conjunto de palabras clave proporcionado.

Imagen relacionada con Google Gemini 1.5 supera a OpenAI Sora em avances impresionantes: entiende lo que fue anunciado

Pero el punto destacado del Gemini 1.5 va más allá del análisis de documentos. Con su habilidad única para interpretar y comprender videos, pudo analizar una película muda de 44 minutos del famoso Buster Keaton.

Imagen relacionada con Google Gemini 1.5 supera a OpenAI Sora em avances impresionantes: entiende lo que fue anunciado

Además, el Gemini 1.5 mostró su capacidad para encontrar palabras «ocultas» en documentales, como en una película sobre el AlphaGo.

Además, el Gemini 1.5 se destaca en el análisis de código, ofreciendo soluciones valiosas y explicaciones detalladas para problemas de desarrollo de software.

Con la capacidad de analizar más de 100,000 líneas de código de una sola vez, el Gemini 1.5 demuestra ser una herramienta poderosa para desarrolladores e ingenieros.

En el campo de la traducción de idiomas, el Gemini 1.5 ha demostrado innovaciones impresionantes.

Aprendió a traducir del inglés al Kalamang, un idioma con menos de 200 hablantes, sin necesidad de ajustes previos. Esta capacidad destaca el potencial del Gemini 1.5 en el aprendizaje y la traducción de idiomas.

Aunque el anuncio de Google fue considerado menos emocionante y más técnico, el Gemini 1.5 se destaca como un logro impresionante de Google.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios