Por primera vez en la historia, las inteligencias artificiales creadas por Google y OpenAI han alcanzado una puntuación de nivel oro en la Olimpiada Internacional de Matemáticas (IMO), una de las competiciones más importantes del mundo para jóvenes talentos en matemáticas.
A pesar de este logro sin precedentes para los modelos de IA, los humanos aún llevaron la mejor parte. Cinco participantes alcanzaron la puntuación máxima, algo que las máquinas aún no han logrado hacer.
El evento, celebrado este mes en Queensland, Australia, reunió a 641 estudiantes de 112 países, todos menores de 20 años. Cada uno enfrentó seis problemas matemáticos de altísima complejidad, con un tiempo total de 4 horas y 30 minutos para resolverlos, el mismo desafío impuesto a los modelos de IA.
Según el presidente de la IMO, Gregor Dolinar, el sistema de Google DeepMind, basado en Gemini, alcanzó 35 puntos de 42 posibles, suficientes para ganar una medalla de oro.
«Podemos confirmar que Google DeepMind ha alcanzado el tan deseado hito, con soluciones que fueron claras, precisas y, en muchos casos, fáciles de seguir», afirmó Dolinar. Añadió: «Es muy emocionante ver este progreso en las capacidades matemáticas de los modelos de IA».
OpenAI también anunció que su modelo experimental de razonamiento alcanzó el mismo rendimiento, validado por ex medallistas de la propia IMO.
«Nuestro resultado ha alcanzado un antiguo desafío de la IA en la competición de matemáticas más prestigiosa del mundo», destacó el investigador de OpenAI, Alexander Wei, en una publicación en redes sociales. «Cada problema fue evaluado por tres ex medallistas de la IMO de forma independiente».
El avance es notable. El año pasado, Google ya había participado en la competición, pero solo había alcanzado una puntuación de plata, y con un tiempo de resolución mucho mayor. Esta vez, el modelo Gemini resolvió cinco de los seis problemas dentro del mismo límite de tiempo que los humanos, lo que muestra un salto significativo en el rendimiento.
La IMO confirmó que las empresas de tecnología probaron sus modelos de forma privada, utilizando exactamente los mismos desafíos a los que se enfrentaron los estudiantes.
A pesar del entusiasmo, los organizadores advierten que aún no hay forma de verificar con precisión cuánta potencia computacional se utilizó o si hubo alguna intervención humana en las respostas.
En una entrevista reciente con el programa 60 Minutes de CBS, el CEO de Google DeepMind, Demis Hassabis, afirmó:
«Estamos avanzando increíblemente rápido. Creo que estamos en una curva exponencial de mejoras». Según él, la IA podría, en pocos años, no solo resolver problemas, sino también «desarrollar un sentido de imaginación».
Por ahora, los humanos siguen adelante, pero la distancia se está reduciendo rápidamente.