Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico de la línea Gemini 3

Rene Fraga
4 minutos de lectura

Principales destacados

  • Es el modelo más barato de la familia Gemini 3, pensado para alto volumen y baja latencia
  • Promete ser hasta 2,5 veces más rápido en la generación inicial de respuestas
  • Ya está disponible en versión previa a través de la API Gemini, Google AI Studio y Vertex AI

Google comenzó a desplegar el Gemini 3.1 Flash-Lite, una nueva apuesta enfocada en ofrecer inteligencia artificial a gran escala con costos reducidos.

El modelo está orientado a desarrolladores y empresas que necesitan procesar grandes volúmenes de datos con rapidez y eficiencia, sin asumir el costo de los modelos más avanzados.

La versión preliminar ya puede utilizarse mediante la API Gemini en Google AI Studio y también en Vertex AI, marcando el debut oficial de la categoría Flash-Lite dentro de la familia Gemini 3.

Velocidad y ahorro como prioridades

El Gemini 3.1 Flash-Lite fue diseñado para priorizar rapidez y eficiencia económica. Su precio es de 0,25 dólares por millón de tokens de entrada y 1,50 dólares por millón de tokens de salida. En comparación, el Gemini 2.5 Flash tenía un costo de 0,30 y 2,50 dólares, respectivamente.

De acuerdo con datos compartidos por Google, basados en evaluaciones de Artificial Analysis, el nuevo modelo reduce significativamente el tiempo hasta el primer token de respuesta, siendo hasta 2,5 veces más rápido que el 2.5 Flash.

Además, presenta un aumento del 45 por ciento en la velocidad de generación, alcanzando 363 tokens por segundo frente a los 249 del modelo anterior.

En términos prácticos, esto se traduce en respuestas más ágiles para aplicaciones como atención automatizada, clasificación de datos, traducción y sistemas de recomendación en tiempo real.

Arquitectura sólida y capacidades multimodales

Aunque se posiciona como la opción más ligera de la línea, el Gemini 3.1 Flash-Lite está basado arquitectónicamente en el Gemini 3 Pro.

Según la documentación técnica de Google DeepMind, el modelo muestra mejoras de calidad que, en diversas pruebas, se acercan al rendimiento del Gemini 2.5 Flash en tareas de razonamiento, programación, matemáticas y ciencias.

Admite entradas multimodales, incluyendo texto, código, imágenes, audio, video y documentos PDF. También ofrece una ventana de contexto de hasta un millón de tokens, lo que permite trabajar con grandes volúmenes de información en sesiones prolongadas.

Otro punto destacado es la posibilidad de elegir entre cuatro niveles de razonamiento adaptativo, que van de mínimo a alto. Esta configuración permite equilibrar la profundidad de la respuesta con la velocidad según las necesidades de cada aplicación.

Estrategia de producto y adopción temprana

Empresas como Latitude, Cartwheel y Whering ya comenzaron a integrar el modelo en sus flujos de trabajo productivos.

Los primeros usuarios destacan su capacidad para seguir instrucciones complejas y mantener coherencia contextual en interacciones largas, sin sacrificar tiempos de respuesta.

El lanzamiento también revela un ajuste estratégico en la línea Gemini 3. No existió un modelo 3.0 Flash-Lite, ya que Google pasó directamente del 2.5 Flash-Lite al 3.1.

Además, el Gemini 3 Pro original será descontinuado el 9 de marzo, lo que obliga a los desarrolladores a migrar rápidamente hacia el 3.1 Pro más reciente.

Con esta actualización, Google refuerza su estrategia de segmentar claramente su portafolio en tres niveles: Pro, Flash y Flash-Lite, cada uno enfocado en diferentes necesidades de rendimiento y costo.

Seguir
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios