Nuevo test revela que la IA aún está lejos de la inteligencia humana

Rene Fraga
3 minutos de lectura

Un nuevo test desarrollado para evaluar el progreso de la Inteligencia General Artificial (AGI) ha mostrado que los modelos más avanzados del mundo aún tienen dificultades para manejar desafíos que son simples para los humanos.

Llamado ARC-AGI-2, el test fue creado por la Arc Prize Foundation, una organización sin fines de lucro que mide la evolución de la inteligencia artificial.

El objetivo es verificar la capacidad de los modelos de IA para reconocer patrones visuales, interpretar pistas contextuales y demostrar razonamiento lógico – habilidades esenciales para una inteligencia verdaderamente general.

Los resultados fueron sorprendentes. El modelo más avanzado de OpenAI, el o3-low, acertó solo el 4% de las preguntas. Por su parte, el Gemini 2.0 Flash de Google y el DeepSeek R1 tuvieron un rendimiento aún menor, con un 1,3% de aciertos, mientras que el Claude 3.7 de Anthropic marcó solo un 0,9%.

Este bajo rendimiento plantea dudas sobre las predicciones optimistas de algunos líderes del sector. El CEO de Anthropic, Dario Amodei, cree que la AGI podría surgir en dos o tres años, mientras que Sam Altman de OpenAI afirma que ya tenemos la tecnología necesaria para desarrollarla.

Sin embargo, expertos como Gary Marcus y Yann LeCun argumentan que aún falta mucho para que eso ocurra.

Lo que hace diferente al ARC-AGI-2 de otros tests es que no puede ser resuelto solo con memorización o análisis de grandes volúmenes de datos.

En su lugar, exige que la IA generalice información y aplique conocimientos a situaciones nuevas – algo que los humanos hacen de manera natural.

Aunque los modelos actuales ya superan a las personas en tareas específicas, como jugar al ajedrez o reconocer imágenes, aún no pueden pensar de manera creativa y adaptable.

Para quienes quieran entender mejor las limitaciones de la IA, es posible experimentar con el test ARC-AGI y ver cómo funciona. Muchos de los desafíos son similares a juegos de razonamiento lógico, como rompecabezas, Wordle o incluso crucigramas, que requieren deducción e interpretación contextual.

Estos resultados refuerzan que, a pesar de los avances en inteligencia artificial, la capacidad humana de aprendizaje y adaptación sigue siendo muy superior – al menos por ahora.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios