Google incorpora comandos de voz a Docs, Keep y Gmail con la ayuda de la IA Gemini

Rene Fraga
10 minutos de lectura

Principales destacados:

  • Google anunció nuevas funciones de voz para Workspace durante el Google I/O 2026
  • Los usuarios podrán crear documentos, organizar notas y encontrar información en Gmail simplemente hablando con la IA
  • La compañía apuesta por interacciones más naturales y por el crecimiento del uso de la voz como principal forma de comando digital

La inteligencia artificial está cambiando rápidamente la manera en que las personas utilizan aplicaciones en su vida diaria, y Google quiere acelerar todavía más esa transformación.

Durante el Google I/O 2026, la empresa presentó una serie de nuevas funciones para Workspace que utilizan comandos de voz integrados con Gemini. La novedad llegará inicialmente a Docs, Keep y Gmail, ofreciendo una experiencia mucho más conversacional y cercana a un diálogo humano.

La propuesta es simple, pero ambiciosa: permitir que los usuarios dejen de depender del teclado para ejecutar tareas complejas. En lugar de escribir varios comandos separados, ahora será posible hablar naturalmente con las aplicaciones, solicitando múltiples acciones al mismo tiempo, corrigiendo información durante la conversación y creando contenidos completos utilizando solo la voz.

El movimiento demuestra cómo Google está acompañando la evolución de los hábitos digitales. Con el avance de la IA generativa, los usuarios comenzaron a interactuar con los sistemas de una manera más extensa, detallada y contextual. La empresa considera que la voz será una pieza central en este nuevo comportamiento.

Create documents with Docs Live

Google Docs ahora podrá crear documentos completos con voz

La mayor novedad presentada durante el evento fue la nueva experiencia de creación en Google Docs. A partir de ahora, los usuarios podrán generar documentos enteros simplemente hablando con el sistema. La inteligencia artificial de Gemini será responsable de interpretar las solicitudes, reunir información dispersa en otras aplicaciones de Google y estructurar automáticamente el texto.

Durante una demostración, Google mostró a un usuario creando un documento profesional usando únicamente comandos de voz. El sistema logró buscar detalles del currículum almacenado en Drive, añadir información sobre un evento encontrada en un correo electrónico e incluso incluir historias personales más relajadas para darle un tono más humano al contenido.

Según Google, este proceso representa un cambio importante en la manera en que se producirán documentos en el futuro. Hasta ahora, los usuarios necesitaban escribir ideas en pequeños bloques, revisar fragmentos y realizar numerosos ajustes manuales. Ahora, la IA puede comprender solicitudes más largas y ejecutar varias tareas de forma secuencial.

Otro punto destacado por la compañía es la capacidad del sistema para entender cambios de contexto durante el habla. Si el usuario cambia de idea en medio del comando, la IA puede interpretar la corrección naturalmente sin necesidad de reiniciar toda la tarea.

El CEO Sundar Pichai afirmó que este es apenas el comienzo de la transformación. Según él, en el futuro será posible crear, editar y revisar documentos completos utilizando únicamente la voz, haciendo que el proceso sea mucho más rápido e intuitivo.

La novedad también refuerza la estrategia de Google de convertir Workspace en una plataforma cada vez más integrada con inteligencia artificial. En lugar de herramientas aisladas, las aplicaciones pasan a funcionar como un ecosistema conectado, donde la información circula automáticamente entre diferentes servicios.

Keep utiliza IA para transformar pensamientos en notas organizadas

Google Keep también recibió una actualización importante enfocada en la productividad personal. La aplicación ahora podrá escuchar pensamientos hablados por el usuario y transformarlos automáticamente en notas organizadas, listas de tareas o resúmenes estructurados.

En la práctica, esto significa que una persona podrá simplemente abrir la aplicación y comenzar a hablar espontáneamente sobre sus ideas. La inteligencia artificial será responsable de organizar todo de una forma comprensible y útil.

La función puede ser especialmente útil para quienes suelen tener ideas rápidas durante el día y no quieren perder tiempo escribiendo manualmente. En pocos segundos, el sistema puede transformar un discurso desordenado en una lista organizada de compromisos, recordatorios o tareas.

Este tipo de funcionalidad ya había comenzado a aparecer en aplicaciones independientes enfocadas en productividad y transcripción inteligente. Herramientas como Voicenotes, AudioPen y otras plataformas de dictado ganaron popularidad precisamente por ofrecer experiencias más naturales para capturar pensamientos.

En los últimos meses, las aplicaciones basadas en voz crecieron rápidamente, impulsadas por la mejora significativa de los modelos de IA. Hoy, los sistemas pueden entender contexto, intención e incluso reorganizar ideas automáticamente para crear textos más claros.

Google parece querer aprovechar exactamente esta tendencia. En lugar de limitar la IA a respuestas simples, la empresa apuesta por experiencias más fluidas, donde el usuario conversa naturalmente con las aplicaciones.

Otro detalle importante es que la IA no solo transcribe el audio, sino que también interpreta el contenido. Esto significa que Keep puede identificar tareas, temas principales y prioridades automáticamente, creando una organización mucho más inteligente que una simple grabación de voz.

Gmail tendrá búsquedas y respuestas mediante conversación natural

Gmail también recibió nuevas funciones de voz integradas con Gemini. La idea es permitir que los usuarios conversen con el correo electrónico como si estuvieran hablando con un asistente personal.

En lugar de buscar manualmente mensajes antiguos o utilizar palabras clave específicas, será posible hacer preguntas naturales como “¿cuál es el código de mi reserva de Airbnb?”, “¿a qué hora es mi consulta médica?” o “¿cuándo es mi próximo vuelo?”.

La IA entonces realizará la búsqueda dentro de la bandeja de entrada y entregará la respuesta lista de manera contextualizada.

Según Google, el objetivo es reducir el tiempo que las personas pasan navegando entre correos y facilitar el acceso rápido a la información realmente importante. En muchos casos, los usuarios saben que recibieron un dato específico, pero no recuerdan exactamente dónde está. Con la nueva función, simplemente bastará con preguntar.

El sistema también podrá manejar comandos más complejos y secuenciales. Los usuarios podrán hacer preguntas complementarias, solicitar más detalles o corregir información durante la conversación.

Este tipo de experiencia refuerza un cambio importante en el mercado tecnológico: las aplicaciones están dejando de funcionar únicamente como herramientas tradicionales y comienzan a operar como interfaces conversacionales basadas en inteligencia artificial.

La voz podría convertirse en el principal medio de interacción digital

Las novedades anunciadas por Google muestran cómo la industria tecnológica está apostando fuertemente por la voz como la próxima gran interfaz computacional.

Durante muchos años, los comandos de voz fueron considerados limitados y poco precisos. Los asistentes digitales frecuentemente cometían errores de interpretación, exigían frases específicas y tenían dificultades para comprender lenguaje natural.

Con la llegada de los modelos generativos modernos, este escenario comenzó a cambiar rápidamente. Las IA actuales pueden interpretar contexto, entender correcciones realizadas en medio de una frase e incluso identificar intención emocional en determinados casos.

Esto hace que las interacciones sean mucho más humanas y eficientes.

Google considera que la voz es especialmente útil para tareas complejas y extensas. En muchos casos, hablar es más rápido que escribir, principalmente cuando el usuario necesita explicar ideas detalladas o realizar varias solicitudes al mismo tiempo.

La empresa también destacó que los usuarios se están acostumbrando cada vez más a realizar preguntas extensas a los sistemas de IA. En lugar de comandos cortos, las personas ahora describen escenarios completos, solicitan análisis detallados e interactúan de forma más natural.

Además de Workspace, Google viene expandiendo su estrategia de voz hacia otros productos. Recientemente, la empresa lanzó Rambler, una herramienta de dictado integrada en Gboard que funciona en diferentes aplicaciones y plataformas.

La expectativa es que, en los próximos años, la interacción por voz deje de ser apenas una función complementaria y pase a ocupar un papel central en la forma en que los usuarios trabajan, investigan y producen contenido.

Con Gemini integrado en varias aplicaciones, Google demuestra que quiere liderar esta nueva etapa de la computación basada en conversaciones naturales e inteligencia artificial contextual.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios