Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico de la línea Gemini 3

Tópicos

Velocidad y ahorro como prioridades
Arquitectura sólida y capacidades multimodales
Estrategia de producto y adopción temprana

Principales destacados

Es el modelo más barato de la familia Gemini 3, pensado para alto volumen y baja latencia

Promete ser hasta 2,5 veces más rápido en la generación inicial de respuestas

Ya está disponible en versión previa a través de la API Gemini, Google AI Studio y Vertex AI

Google comenzó a desplegar el Gemini 3.1 Flash-Lite, una nueva apuesta enfocada en ofrecer inteligencia artificial a gran escala con costos reducidos.

El modelo está orientado a desarrolladores y empresas que necesitan procesar grandes volúmenes de datos con rapidez y eficiencia, sin asumir el costo de los modelos más avanzados.

La versión preliminar ya puede utilizarse mediante la API Gemini en Google AI Studio y también en Vertex AI, marcando el debut oficial de la categoría Flash-Lite dentro de la familia Gemini 3.

Velocidad y ahorro como prioridades

El Gemini 3.1 Flash-Lite fue diseñado para priorizar rapidez y eficiencia económica. Su precio es de 0,25 dólares por millón de tokens de entrada y 1,50 dólares por millón de tokens de salida. En comparación, el Gemini 2.5 Flash tenía un costo de 0,30 y 2,50 dólares, respectivamente.

De acuerdo con datos compartidos por Google, basados en evaluaciones de Artificial Analysis, el nuevo modelo reduce significativamente el tiempo hasta el primer token de respuesta, siendo hasta 2,5 veces más rápido que el 2.5 Flash.

Además, presenta un aumento del 45 por ciento en la velocidad de generación, alcanzando 363 tokens por segundo frente a los 249 del modelo anterior.

En términos prácticos, esto se traduce en respuestas más ágiles para aplicaciones como atención automatizada, clasificación de datos, traducción y sistemas de recomendación en tiempo real.

Arquitectura sólida y capacidades multimodales

Aunque se posiciona como la opción más ligera de la línea, el Gemini 3.1 Flash-Lite está basado arquitectónicamente en el Gemini 3 Pro.

Según la documentación técnica de Google DeepMind, el modelo muestra mejoras de calidad que, en diversas pruebas, se acercan al rendimiento del Gemini 2.5 Flash en tareas de razonamiento, programación, matemáticas y ciencias.

Admite entradas multimodales, incluyendo texto, código, imágenes, audio, video y documentos PDF. También ofrece una ventana de contexto de hasta un millón de tokens, lo que permite trabajar con grandes volúmenes de información en sesiones prolongadas.

Otro punto destacado es la posibilidad de elegir entre cuatro niveles de razonamiento adaptativo, que van de mínimo a alto. Esta configuración permite equilibrar la profundidad de la respuesta con la velocidad según las necesidades de cada aplicación.

Estrategia de producto y adopción temprana

Empresas como Latitude, Cartwheel y Whering ya comenzaron a integrar el modelo en sus flujos de trabajo productivos.

Los primeros usuarios destacan su capacidad para seguir instrucciones complejas y mantener coherencia contextual en interacciones largas, sin sacrificar tiempos de respuesta.

El lanzamiento también revela un ajuste estratégico en la línea Gemini 3. No existió un modelo 3.0 Flash-Lite, ya que Google pasó directamente del 2.5 Flash-Lite al 3.1.

Además, el Gemini 3 Pro original será descontinuado el 9 de marzo, lo que obliga a los desarrolladores a migrar rápidamente hacia el 3.1 Pro más reciente.

Con esta actualización, Google refuerza su estrategia de segmentar claramente su portafolio en tres niveles: Pro, Flash y Flash-Lite, cada uno enfocado en diferentes necesidades de rendimiento y costo.

Google lanza Gemini 3.1 Flash-Lite, su modelo más rápido y económico de la línea Gemini 3

Velocidad y ahorro como prioridades

Arquitectura sólida y capacidades multimodales

Estrategia de producto y adopción temprana

Deja una respuesta Cancelar la respuesta

Nuevas publicaciones

Google integra ProducerAI a Google Labs y refuerza su apuesta por la música con IA

Gemini en Android ahora automatiza tareas como pedir Uber y comida

Intrinsic se une a Google y refuerza la apuesta de Alphabet por la IA física en la robótica industrial

Google lanza Nano Banana 2 y acelera la generación de imágenes con mayor realismo

Google advierte que Irán está lanzando ciberataques a nivel mundial en medio de la guerra

FragaNet Media