Close Menu
    Facebook X (Twitter) Instagram
    GD en Español
    • Google
    • Android
    • YouTube
    • Gmail
    • Chrome
    • Maps
    • Drive
    • Photos
    • Gemini
    • Pixel
    • 🇧🇷🇵🇹 En portugués
    GD en Español
    Home»Google»Google presenta IA capaz de identificar emociones con nuevas funciones en PaliGemma 2
    Google

    Google presenta IA capaz de identificar emociones con nuevas funciones en PaliGemma 2

    Rene FragaRene Fraga05/12/2024

    Google ha revelado la nueva familia de modelos de inteligencia artificial PaliGemma 2, que incorpora una funcionalidad intrigante y controvertida: la capacidad de «identificar» emociones humanas en imágenes.

    Además, este modelo se destaca por ofrecer avances significativos en tareas visuales y lingüísticas.

    ¿Qué es PaliGemma 2?

    Anunciado durante el Google I/O 2024 en mayo, PaliGemma 2 es la evolución del modelo PaliGemma, originalmente diseñado para casos de uso como subtitulado de imágenes y videos cortos, detección y segmentación de objetos, comprensión de texto en imágenes y respuestas visuales a preguntas.

    La nueva versión amplía estas capacidades al ofrecer «long captioning», con la habilidad de generar subtítulos detallados y contextualmente relevantes para imágenes. Esto incluye descripciones que van más allá de la identificación de objetos, capturando acciones, emociones y narrativas presentes en las escenas.

    El modelo está disponible en tamaños de 3B, 10B y 28B parámetros, con resoluciones de 224px, 448px y 896px, adaptándose a diferentes niveles de necesidades computacionales.

    Avances en OCR y otras aplicaciones

    Otra novedad es su precisión en reconocimiento óptico de caracteres (OCR) y la capacidad de comprender estructuras y contenidos de tablas en documentos. PaliGemma 2 también sobresale en tareas específicas como:

    • Reconocimiento de fórmulas químicas;
    • Reconocimiento de partituras musicales;
    • Razonamiento espacial;
    • Generación de informes de rayos X de tórax.

    Google diseñó PaliGemma 2 como un «reemplazo directo» para la versión original, prometiendo mejoras inmediatas en el rendimiento de la mayoría de las tareas, sin necesidad de grandes modificaciones en el código. Además, el modelo es fácilmente ajustable para necesidades específicas, ampliando su utilidad.

    Los modelos preentrenados y el código fuente están disponibles en plataformas como Kaggle, Hugging Face y Ollama.

    Identificación de emociones: controversias y desafíos

    A pesar de los avances técnicos, la funcionalidad de «reconocimiento emocional» ha generado debates éticos y científicos.

    Expertos como Sandra Wachter, profesora de ética en IA de la Universidad de Oxford, consideran que esta idea es problemática: «Suponer que podemos leer emociones es tan confiable como pedir consejos a una bola mágica».

    Estudios previos han cuestionado la validez científica de esta tecnología, señalando diferencias culturales en la expresión de emociones que pueden limitar la precisión de estos sistemas.

    Google asegura haber realizado pruebas rigurosas para minimizar sesgos demográficos en PaliGemma 2 y garantizar bajos niveles de toxicidad en comparación con los estándares del sector.

    Sin embargo, sistemas similares en el pasado han mostrado sesgos. Por ejemplo, un estudio del MIT en 2020 destacó discriminaciones contra grupos marginados.

    Riesgos e impacto en la sociedad

    Para muchos investigadores, la disponibilidad pública de modelos como PaliGemma 2 podría representar riesgos concretos.

    Heidy Khlaaf, científica principal del Instituto AI Now, advierte que tecnologías basadas en premisas pseudocientíficas podrían usarse para tomar decisiones injustas en áreas sensibles como seguridad, contratación y control de fronteras.

    “La innovación responsable requiere una reflexión constante sobre las consecuencias. Sin eso, corremos el riesgo de un futuro donde nuestras emociones puedan determinar nuestro acceso a derechos y oportunidades”, concluyó Sandra Wachter.

    Google Discovery no Google News

    Agregue Google Discovery a su feed de Google News.

    Rene Fraga
    • Website
    • Facebook
    • X (Twitter)
    • Instagram
    • LinkedIn

    creó el blog Google Discovery en 2006, convirtiéndose en uno de los principales blogs de tecnología en Brasil. Ha seguido de cerca a la gigante de Mountain View desde la década de 2000 y contribuyó voluntariamente a la traducción de la Búsqueda para el país. Además, fue columnista en TechTudo, de Globo.com, compartiendo su conocimiento sobre Google con una amplia audiencia.

    Lea mas

    Google quiere centros de datos alimentados por reactores de sales fundidas para 2030

    21/08/2025

    Google lanza un agente de IA que solo realiza reservas en restaurantes, pero cuesta 250 USD al mes

    21/08/2025

    Waze lleva a los conductores por el Camino de Baldosas Amarillas con una experiencia inspirada en El Mago de Oz

    21/08/2025

    Google revela cuánta energía consume cada pregunta hecha a Gemini

    21/08/2025

    Google Pixel 10: cuando el espectáculo de celebridades opaca a la tecnología

    21/08/2025

    Google presenta entrenador personal de salud con IA en Fitbit

    21/08/2025

    Deja un comentarioCancelar respuesta

    Google quiere centros de datos alimentados por reactores de sales fundidas para 2030

    21/08/2025

    Google: la protección IP68 no es para siempre en los teléfonos Pixel

    21/08/2025

    Google lanza un agente de IA que solo realiza reservas en restaurantes, pero cuesta 250 USD al mes

    21/08/2025

    Google expande Gemini Live: el asistente de IA ahora muestra lo que dice e interactúa con tus apps

    21/08/2025
    GD en Español
    Facebook X (Twitter) Instagram Pinterest
    • IA
    • Política de privacidad
    • Contacto
    © 2006 - 2025 GD en Español.
    FragaNet Media. All rights reserved.

    Type above and press Enter to search. Press Esc to cancel.