El Google anunció recientemente el lanzamiento de Deep Think, su modelo de inteligencia artificial más avanzado hasta el momento.
Desarrollado por el equipo de DeepMind, el Deep Think es un sistema de múltiples agentes pensado para manejar tareas complejas, como la resolución de problemas matemáticos y el razonamiento lógico de alto nivel.
La novedad ya está disponible dentro de la aplicación Gemini para suscriptores del plan Google AI Ultra, en una versión optimizada para uso cotidiano.
A pesar de esto, el modelo utilizado en la versión pública es diferente del modelo completo que recientemente alcanzó un rendimiento destacado en la Olimpiada Internacional de Matemática (IMO) de 2025.
La versión accesible fue ajustada para ofrecer respuestas más rápidas y prácticas, incluso si eso significa renunciar a parte del razonamiento profundo de la versión académica.
Aun así, las pruebas muestran que esta versión supera a otros modelos populares, como Gemini 2.5 Pro y OpenAI-o3, en benchmarks de conocimiento y generación de código.
El diferencial de Deep Think está en su arquitectura con múltiples agentes de pensamiento. En lugar de seguir una única línea de razonamiento, analiza diversos caminos en paralelo, evalúa los mejores resultados y combina las ideas más prometedoras.
Es como si varios expertos analizaran un problema al mismo tiempo, con la IA eligiendo la mejor solución a partir de ese conjunto de ideas simultáneas.
Además de la versión disponible en Gemini, el Google también liberará otras variantes de Deep Think, con y sin herramientas integradas, para grupos seleccionados de investigadores y desarrolladores a través de una API.
Con esto, la empresa pretende entender mejor el uso de la tecnología y continuar mejorando el modelo, equilibrando aplicaciones comerciales y académicas.
Razonamiento y Conocimiento (Humanitys Last Exam) | Generación de código (LiveCodeBench) | Matemáticas (OMI 2025) | Matemáticas (AIME 2025) | |
---|---|---|---|---|
Géminis 2.5 Deep Think | 34,8% | 87.6% | 60,7% | 99,2% |
Géminis 2.5 Pro | 21,6% | 74,2% | 31.6% | 88,0% |
OpenAI-o3 | 20,3% | 72,0% | 16,7% | 88,9% |
Grok-4 | 25,4% | 79,0% | 21,4% | 91,7% |