Aletheia de Google DeepMind resuelve 13 problemas de Erdős

Rene Fraga
4 minutos de lectura

Principales destacados

  • Aletheia, agente de Google DeepMind basado en Gemini Deep Think, resolvió 13 problemas matemáticos abiertos vinculados a Paul Erdős
  • Cuatro de esas soluciones son consideradas descubrimientos autónomos genuinamente innovadores
  • Solo el 6,5% de las respuestas evaluadas fueron clasificadas como significativamente correctas

El Google DeepMind presentó esta semana un avance que podría marcar un antes y un después en la investigación matemática asistida por inteligencia artificial.

La compañía dio a conocer Aletheia, un agente especializado construido sobre Gemini Deep Think, capaz de analizar y proponer soluciones para problemas matemáticos que llevaban años sin respuesta.

En artículos publicados el 11 de febrero, el equipo explicó que el sistema evaluó 700 conjeturas clasificadas como no resueltas en la base de datos Erdős Problems, compilada por Thomas Bloom. Esta colección reúne desafíos propuestos por el prolífico matemático del siglo XX Paul Erdős, cuya influencia sigue siendo profunda en la matemática contemporánea.

El resultado sorprendió a la comunidad: 13 problemas fueron resueltos por el agente, y cuatro de ellos son considerados por los investigadores como descubrimientos autónomos realmente innovadores.

Cómo funciona Aletheia en la práctica

A diferencia de los sistemas que destacan en competencias matemáticas, Aletheia fue diseñada para actuar en entornos de investigación profesional. Su arquitectura se basa en un ciclo iterativo de generar, verificar y revisar, inspirado en el proceso de revisión por pares académico.

El sistema incluye un verificador en lenguaje natural que detecta posibles fallos lógicos en las soluciones propuestas. Además, cuando no logra resolver un problema, puede reconocer explícitamente esa limitación.

Entre los casos más destacados se encuentra la construcción de un contraejemplo que refutó una conjetura planteada en 2015 sobre optimización submodular en línea, un desafío que había desconcertado a investigadores durante casi una década. El agente también aportó avances en estudios relacionados con los problemas de Max-Cut y Árbol de Steiner, integrando herramientas matemáticas provenientes de campos distintos.

En otro ejemplo, la matemática Lisa Carbone, de la Universidad Rutgers, utilizó el modo Deep Think para revisar un artículo técnico, donde el sistema identificó una falla lógica que había pasado inadvertida para revisores humanos.

Resultados prometedores, pero con límites claros

A pesar del entusiasmo inicial, los propios investigadores reconocen limitaciones importantes. De las 200 soluciones evaluadas de forma definitiva por expertos humanos, solo el 6,5% fueron consideradas significativamente correctas.

Muchas respuestas presentaban errores fundamentales. En otros casos, las soluciones eran técnicamente válidas, pero abordaban interpretaciones equivocadas del problema original. Según el equipo, la IA tiende a reformular la pregunta de manera que resulte más fácil de responder, aunque eso no refleje fielmente la intención matemática inicial.

También se mencionaron preocupaciones sobre el llamado plagio subconsciente, cuando el modelo podría reproducir conocimientos adquiridos durante el entrenamiento sin atribución explícita.

Qué implica este avance para el futuro

Google DeepMind propuso una taxonomía para clasificar el nivel de contribución de la inteligencia artificial en la investigación matemática. Por ahora, la empresa no afirma haber alcanzado descubrimientos revolucionarios ni avances históricos.

Los autores subrayan que la responsabilidad final de cualquier publicación matemática debe recaer en investigadores humanos, quienes asumen la validez y la atribución del trabajo. La IA puede apoyar, sugerir caminos y detectar errores, pero aún no sustituye el rigor humano.

Aun así, el mensaje es contundente: la inteligencia artificial ya empieza a desempeñar un papel activo en problemas matemáticos de nivel profesional, y su influencia en el ámbito académico promete crecer en los próximos años.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios