Una revelación hecha durante un juicio en Estados Unidos llamó la atención de quienes siguen el mercado de la tecnología y, principalmente, la actuación de Google en el área de inteligencia artificial.
Un ejecutivo de la empresa afirmó que Google puede usar contenido de sitios web para entrenar sus recursos de IA orientados a la búsqueda, incluso cuando estos sitios han optado por no permitir el uso de sus datos en modelos de IA.
La explicación es técnica, pero importante: según Eli Collins, vicepresidente de DeepMind (el laboratorio de IA de Google), el sistema de exclusión que utilizan los sitios (llamado robots.txt
) solo impide el entrenamiento realizado directamente por DeepMind.
Otras áreas de la empresa, como el equipo de búsqueda, aún pueden utilizar los datos de los sitios para mejorar sus propias herramientas, como el AI Overviews, que genera respuestas con inteligencia artificial directamente en la parte superior de los resultados de búsqueda.
Naturalmente, esto generó cuestionamientos en el tribunal, ya que muchos sitios están preocupados por la pérdida de audiencia.
Si Google muestra las respuestas listas con IA, los usuarios pueden dejar de visitar los sitios originales, afectando la principal fuente de ingresos de muchas páginas: los anuncios.
Para evitar que sus datos sean utilizados por la IA de búsqueda, los editores tendrían que bloquear completamente el acceso de Google, lo que significaría desaparecer de los resultados de búsqueda, un verdadero dilema.
Durante el juicio, documentos internos mostraron que Google eliminó 80 mil millones de bloques de datos (llamados «tokens») de un total de 160 mil millones, debido a las solicitudes de exclusión realizadas por los sitios.
Aun así, la empresa continúa utilizando otras fuentes, como datos de sesiones de búsqueda de los usuarios e incluso videos de YouTube, para entrenar y mejorar sus modelos.
El caso está siendo seguido de cerca por las autoridades estadounidenses, que quieren imponer cambios en la forma en que Google opera la búsqueda, incluidas restricciones al uso de sus datos y dominio sobre otros navegadores y aplicaciones.