Principales destacados
- Gemini 3 Deep Think alcanza resultados récord en pruebas exigentes de razonamiento y programación.
- Investigadores ya lo utilizan para detectar fallos técnicos y desarrollar soluciones científicas reales.
- El modelo está disponible en el plan premium de Gemini y también mediante API para acceso anticipado.
El Google anunció una actualización significativa de su modelo de razonamiento Gemini 3 Deep Think, presentado como su sistema de inteligencia artificial más avanzado para afrontar retos complejos en matemáticas, ciencia e ingeniería.
La compañía refuerza así su apuesta por posicionar a Gemini como una herramienta clave en investigación científica y desarrollo tecnológico.
De acuerdo con la empresa, el modelo mejorado logró un 48,4% de precisión en el desafiante Humanity’s Last Exam sin utilizar herramientas externas. En la prueba de razonamiento abstracto ARC-AGI-2, validada por la ARC Prize Foundation, alcanzó un 84,6%. En la plataforma de programación competitiva Codeforces, obtuvo una clasificación Elo de 3455, superando prácticamente a todos los programadores humanos activos, con excepción de solo siete.
Aplicaciones reales en investigación científica
Google desarrolló esta nueva versión en colaboración con investigadores que trabajan con problemas abiertos, donde no existe una única respuesta correcta y los datos pueden ser incompletos o complejos. El objetivo es ofrecer apoyo en contextos donde el análisis profundo y la lógica estructurada son esenciales.
Uno de los casos destacados involucra a Lisa Carbone, matemática de la Universidad Rutgers, quien utilizó el modelo para revisar un artículo técnico vinculado a estructuras matemáticas que conectan la teoría de la gravedad de Einstein con la mecánica cuántica. El sistema identificó una inconsistencia lógica sutil que había pasado desapercibida en la revisión por pares.
En la Universidad Duke, investigadores del Wang Lab emplearon el modelo para diseñar métodos de crecimiento de cristales semiconductores. Con ayuda del sistema, lograron desarrollar una receta precisa para películas delgadas que cumplían especificaciones técnicas que métodos anteriores no conseguían alcanzar con la misma eficacia.
Resultados de nivel olímpico
Más allá de los benchmarks tradicionales, Google resaltó el desempeño del modelo en competiciones científicas internacionales. El Deep Think alcanzó un rendimiento equivalente a medalla de oro en las pruebas escritas de la Olimpiada Internacional de Física y la Olimpiada Internacional de Química de 2025.
También demostró su capacidad en matemáticas. En 2025, una versión avanzada resolvió cinco de los seis problemas de la Olimpiada Internacional de Matemática dentro del límite oficial de 4,5 horas, operando exclusivamente en lenguaje natural. En el CMT-Benchmark de física teórica avanzada, registró un 50,5%, consolidando su presencia en áreas científicas altamente especializadas.
Estos resultados muestran que Gemini 3 Deep Think no es solo un asistente conversacional mejorado, sino un sistema diseñado para el razonamiento profundo y la resolución estructurada de problemas complejos.
Disponibilidad y competencia en el sector
El modelo ya está disponible para suscriptores del plan Google AI Ultra a través de la aplicación Gemini, con un costo mensual de 250 dólares. Por primera vez, Google también ofrece acceso mediante la API de Gemini para investigadores, ingenieros y empresas seleccionadas dentro de un programa de acceso anticipado.
El lanzamiento se produce en un contexto de creciente competencia en el ámbito de la inteligencia artificial. La Anthropic presentó recientemente Claude Opus 4.6, mientras que OpenAI continúa avanzando con sus propios modelos de razonamiento especializado.
El CEO de Google DeepMind, Demis Hassabis, mantiene una postura prudente sobre la llegada de la inteligencia artificial general, estimando que aún podrían faltar entre cinco y diez años para alcanzar ese nivel.
Con esta actualización, Google refuerza su ambición de liderar el desarrollo de sistemas capaces de colaborar activamente con científicos y profesionales en desafíos que hasta hace poco parecían exclusivos del talento humano.