Google prueba una función de Gemini para controlar apps Android sin usar las manos

Rene Fraga
4 minutos de lectura

Puntos clave

  • Google está probando una función experimental que permite a Gemini operar aplicaciones Android de forma automática.
  • La tecnología analiza lo que aparece en la pantalla y ejecuta acciones como toques, desplazamientos y llenado de formularios.
  • El usuario mantiene el control total y puede interrumpir la IA en cualquier momento.

Google está avanzando en el desarrollo de una nueva función de Gemini que podría cambiar la manera en que las personas interactúan con las aplicaciones en Android.

Detectada en la versión beta más reciente de la app Google, la novedad permite que el asistente de inteligencia artificial realice tareas completas en nombre del usuario, sin necesidad de tocar cada pantalla.

El recurso, identificado internamente como automatización de pantalla y con el nombre en clave bonobo, aparece en fragmentos de código de la versión 17.4 beta de la aplicación.

El objetivo es que Gemini pueda ejecutar acciones de varios pasos, como pedir comida o reservar un viaje, de forma casi autónoma. En un primer momento, estará disponible como función experimental a través de Google Labs.

Cómo funciona la automatización de pantalla

La base del sistema está en permisos introducidos en Android 16 QPR3. Estas autorizaciones permiten que una aplicación ayude al usuario a completar tareas interactuando con el contenido mostrado en la pantalla de otras apps.

En la práctica, Gemini podrá analizar botones, campos de texto y otros elementos interactivos visibles, realizando acciones como toques, desplazamientos y completado de datos.

Al inicio, el soporte estará limitado a aplicaciones seleccionadas, principalmente de transporte y entrega de comida, con planes de ampliarse a flujos más complejos.

Control del usuario y advertencias

Aunque el nivel de automatización es alto, Google enfatiza que el usuario conserva el control durante todo el proceso. La empresa advierte que Gemini puede cometer errores y que la responsabilidad de las acciones realizadas en su nombre recae en el propio usuario.

En cualquier momento, será posible detener la automatización y retomar el control manual. Esta postura refleja que la tecnología todavía se encuentra en una etapa experimental, aunque representa un avance importante hacia la llamada IA agéntica.

Privacidad y uso responsable

En cuanto a la privacidad, Google señala que cuando Gemini interactúa con aplicaciones, pueden analizarse capturas de pantalla.

Si la opción Mantener actividad está activada, estas imágenes podrían ser revisadas por evaluadores humanos entrenados para mejorar los servicios de la compañía.

Por ese motivo, Google recomienda no introducir credenciales de inicio de sesión ni datos de pago en las conversaciones con Gemini y evitar el uso de la automatización de pantalla para tareas sensibles o situaciones de emergencia.

Actualmente, el permiso de automatización de pantalla solo aparece en dispositivos Pixel 10 con Android 16 QPR3. Aún no está claro si la función llegará a otros modelos, pero el desarrollo refuerza la idea de que las demostraciones de IA avanzada del Google están cada vez más cerca de convertirse en funciones reales del día a día.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios