Gemini incorpora soporte para archivos de audio

Rene Fraga
3 minutos de lectura

Destacados principales

  • Los usuarios pueden subir archivos de audio a Gemini: la versión gratuita limita la duración de los archivos a 10 minutos; los planes de pago permiten hasta 3 horas.
  • Diversidad de formatos: se pueden subir hasta 10 archivos simultáneamente, incluyendo archivos ZIP.
  • Esta función fue la más solicitada por los usuarios, según Google.

La función más esperada de Gemini

Tras meses de solicitudes, Google finalmente habilitó la función más deseada de la app Gemini: enviar archivos de audio.

Ahora, los usuarios pueden grabar una explicación, subir un podcast o incluso fragmentos de una reunión para que la inteligencia artificial los analice, resuma o utilice en el contexto de sus respuestas.

Límites según el plan:

  • Versión gratuita: archivos de hasta 10 minutos y 5 interacciones diarias.
  • Planes AI Pro y AI Ultra: audios de hasta 3 horas, ideal para estudios, entrevistas y proyectos profesionales.

¿Cómo funciona el envío de audio?

Gemini no exige un formato específico y acepta diferentes tipos de archivos de sonido. Incluso es posible enviar carpetas comprimidas en ZIP con varios audios dentro.

En todos los planes, el usuario puede adjuntar hasta 10 archivos a la vez, lo que facilita investigaciones más complejas, la edición de contenidos largos o la organización de grabaciones personales.


Otras actualizaciones del ecosistema Google

Aunque el enfoque está en el audio de Gemini, Google también anunció mejoras en otras áreas:

  • Búsqueda en Modo IA: ahora acepta preguntas en hindi, indonesio, japonés, coreano y portugués de Brasil, acercando la experiencia a más personas en todo el mundo.
  • NotebookLM: la herramienta orientada al estudio e investigación incorporó nuevos estilos de informe en más de 80 idiomas, incluyendo guías de estudio y cuestionarios, ampliando sus posibilidades de uso académico y profesional.

💡 Refuerzo estratégico

El soporte para audio consolida la estrategia de Google de hacer que Gemini sea cada vez más práctico y presente en la vida cotidiana.

Para muchos usuarios, hablar o grabar resulta más natural que escribir, y este cambio podría marcar el inicio de una nueva era en el uso de la inteligencia artificial para tareas personales y laborales.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios