Mientras Google y otras empresas de tecnología trabajan para hacer sus inteligencias artificiales cada vez más poderosas, algunas pruebas acaban revelando situaciones bastante curiosas.
Un ejemplo reciente provino de un experimento realizado con el modelo Gemini 2.5 Pro, que fue desafiado a jugar a Pokémon, el clásico juego de los años 90. ¿El resultado?
La IA simplemente entró en «modo pánico» cuando sus monstruitos estaban a punto de desmayarse, afectando directamente su capacidad de razonamiento.
Este tipo de prueba, conocida como benchmarking, sirve para evaluar cómo los modelos de IA toman decisiones en situaciones que requieren planificación y estrategia.
En los últimos meses, transmisiones en vivo en Twitch llamadas «Gemini Plays Pokémon» y «Claude Plays Pokémon» han mostrado, de forma pública y divertida, cómo las inteligencias artificiales de Google y Anthropic enfrentan los desafíos del juego.
Durante las partidas, es posible seguir en tiempo real lo que la IA está «pensando», gracias a una traducción de su proceso de razonamiento en lenguaje natural.
Lo curioso es que, cuando se enfrenta a situaciones de riesgo, como casi perder una batalla, Gemini comienza a presentar un comportamiento desorganizado.
Ignora recursos importantes, deja de usar herramientas útiles y comienza a tomar decisiones poco inteligentes, de manera muy similar a lo que les sucede a los humanos bajo presión o estrés.
El informe de DeepMind explica que este comportamiento fue tan recurrente que incluso los espectadores de las transmisiones comenzaron a identificar cuándo el «modo pánico» estaba activado.
A pesar de estas fallas graciosas, el rendimiento de Gemini también sorprendió en algunos momentos.
La IA demostró mucha eficiencia a la hora de resolver los famosos rompecabezas con piedras dentro del juego, logrando encontrar soluciones rápidas y precisas basadas en instrucciones simples.
Los investigadores creen que, en el futuro, la IA podría desarrollar por sí sola herramientas para superar este tipo de desafíos y, quién sabe, incluso crear su propio «módulo anti-pánico».