SignGemma: IA de Google que traduce lenguaje de señas a texto hablado será gratuita y abierta

Durante el evento Google I/O 2025, la empresa anunció SignGemma, un nuevo modelo de inteligencia artificial creado especialmente para traducir lenguaje de señas a texto hablado, en tiempo real.

Desarrollado por el equipo de Google DeepMind, SignGemma promete transformar la comunicación de personas con discapacidad auditiva o del habla, permitiendo que se comuniquen con mayor facilidad con quienes no entienden el lenguaje de señas.

La gran novedad es que SignGemma será de código abierto (open-source), lo que significa que cualquier persona, empresa o desarrollador podrá usarlo, adaptarlo o integrarlo en otras soluciones.

Según Google, la tecnología abre puertas a una serie de aplicaciones accesibles en diversos contextos, como escuelas, servicios públicos, atenciones médicas, entre otros.

El modelo es capaz de identificar e interpretar movimientos de las manos, formas y expresiones faciales, convirtiendo estas señales en texto hablado con fluidez.

Fue entrenado con diferentes estilos de lenguaje de señas, y su mejor rendimiento en este momento es con el ASL (American Sign Language).

Además, el sistema funciona localmente, es decir, no necesita conexión a internet para operar, lo cual es ideal para lugares con conectividad limitada.

Basado en la estructura de Gemini Nano, SignGemma podría integrarse en el futuro con otras herramientas de la empresa, como Gemini Live.

Google también creó un formulario para que los interesados puedan probar la novedad antes de su lanzamiento oficial, previsto para finales de este año.

Agregue Google Discovery a su feed de Google News.

SignGemma: IA de Google que traduce lenguaje de señas a texto hablado será gratuita y abierta

Google presenta protocolo abierto para compras realizadas por agentes de IA

Google adopta un modelo de riesgo para actualizar Android y promete una protección más eficiente

VaultGemma: Google apuesta por IA de código abierto que no memoriza información personal

Alphabet alcanza un valor histórico de 3 billones de dólares en el mercado

DeepMind: «Aprender a aprender» es la clave para el futuro de la IA

Google mejora Gemini con respuestas en tiempo real en Android

Deja un comentarioCancelar respuesta

Google presenta protocolo abierto para compras realizadas por agentes de IA

Startup de exlíderes de seguridad de Google que quiere convertir el phishing en cosa del pasado

Google libera Gemini en Chrome y anuncia navegación inteligente con IA

Google adopta un modelo de riesgo para actualizar Android y promete una protección más eficiente

SignGemma: IA de Google que traduce lenguaje de señas a texto hablado será gratuita y abierta

Lea mas

Deja un comentarioCancelar respuesta