La empresa Meta reveló que está utilizando publicaciones públicas de Facebook e Instagram para entrenar su nuevo asistente de inteligencia artificial.
El presidente de asuntos globales de Meta, Nick Clegg, informó en una entrevista con Reuters que tanto el texto como las fotos de las publicaciones públicas se utilizaron como datos de entrenamiento para la IA.
Sin embargo, Clegg destacó que la IA no tuvo acceso a publicaciones privadas, es decir, aquellas compartidas solo con amigos y familiares.
Meta ha tomado medidas para garantizar que la información privada sea eliminada de los conjuntos de datos públicos utilizados para entrenar la inteligencia artificial.
Clegg no especificó qué medidas se tomaron, pero enfatizó que la empresa se esforzó por evitar el uso de conjuntos de datos con información personal en gran cantidad.
Además, afirmó que Meta no utilizó mensajes privados en sus plataformas para entrenar el nuevo modelo de IA.
La preocupación por la privacidad también llevó a la empresa a no utilizar sitios como LinkedIn para este propósito.
Meta lanzó recientemente su asistente virtual, llamado Meta AI, en una versión Beta. Este asistente tiene como objetivo ayudar a los usuarios a crear pegatinas digitales a partir de textos, editar fotos con instrucciones en texto e interactuar con personalidades de IA, como el rapero Snoop Dogg actuando como Maestro de Juego en «Dungeons & Dragons».
Meta AI se desarrolló basado en un modelo de lenguaje de IA llamado Llama 2 y también en un modelo de texto a imagen llamado Emu.
Mientras que Emu se entrenó con fotos de publicaciones públicas de Instagram y Facebook, Llama 2 utilizó otros conjuntos de datos públicos.
Aunque Meta cree que el uso de contenido protegido por derechos de autor para entrenar la IA es justo, Nick Clegg reconoce que puede haber disputas legales al respecto.
Él afirmó que espera que este asunto se resuelva a través de litigios.
Es importante destacar que, según las políticas de Meta, los usuarios de Facebook e Instagram se consideran propietarios del contenido que publican, siempre y cuando no infrinjan los derechos de propiedad intelectual de terceros.