Un nuevo test desarrollado para evaluar el progreso de la Inteligencia General Artificial (AGI) ha mostrado que los modelos más avanzados del mundo aún tienen dificultades para manejar desafíos que son simples para los humanos.
Llamado ARC-AGI-2, el test fue creado por la Arc Prize Foundation, una organización sin fines de lucro que mide la evolución de la inteligencia artificial.
El objetivo es verificar la capacidad de los modelos de IA para reconocer patrones visuales, interpretar pistas contextuales y demostrar razonamiento lógico – habilidades esenciales para una inteligencia verdaderamente general.
Los resultados fueron sorprendentes. El modelo más avanzado de OpenAI, el o3-low, acertó solo el 4% de las preguntas. Por su parte, el Gemini 2.0 Flash de Google y el DeepSeek R1 tuvieron un rendimiento aún menor, con un 1,3% de aciertos, mientras que el Claude 3.7 de Anthropic marcó solo un 0,9%.
Este bajo rendimiento plantea dudas sobre las predicciones optimistas de algunos líderes del sector. El CEO de Anthropic, Dario Amodei, cree que la AGI podría surgir en dos o tres años, mientras que Sam Altman de OpenAI afirma que ya tenemos la tecnología necesaria para desarrollarla.
Sin embargo, expertos como Gary Marcus y Yann LeCun argumentan que aún falta mucho para que eso ocurra.
Lo que hace diferente al ARC-AGI-2 de otros tests es que no puede ser resuelto solo con memorización o análisis de grandes volúmenes de datos.
En su lugar, exige que la IA generalice información y aplique conocimientos a situaciones nuevas – algo que los humanos hacen de manera natural.
Aunque los modelos actuales ya superan a las personas en tareas específicas, como jugar al ajedrez o reconocer imágenes, aún no pueden pensar de manera creativa y adaptable.
Para quienes quieran entender mejor las limitaciones de la IA, es posible experimentar con el test ARC-AGI y ver cómo funciona. Muchos de los desafíos son similares a juegos de razonamiento lógico, como rompecabezas, Wordle o incluso crucigramas, que requieren deducción e interpretación contextual.
Estos resultados refuerzan que, a pesar de los avances en inteligencia artificial, la capacidad humana de aprendizaje y adaptación sigue siendo muy superior – al menos por ahora.