Google anunció el lanzamiento de Google-Extended, una nueva herramienta que permite a los editores de sitios web optar por no utilizar sus datos para entrenar los modelos de Inteligencia Artificial (IA) de la empresa.
Esta medida tiene como objetivo garantizar la privacidad de los datos de los sitios web, al tiempo que siguen siendo visibles en las búsquedas de Google.
Con Google-Extended, los sitios web seguirán siendo rastreados e indexados por los rastreadores web, como Googlebot, pero sus datos no se utilizarán para mejorar los modelos de IA actuales y futuros de Google.
Esta opción brinda a los editores un mayor control sobre el acceso al contenido de sus sitios web, permitiéndoles decidir si desean contribuir al entrenamiento de los algoritmos de IA de la empresa.
Esta nueva funcionalidad está disponible a través del archivo robots.txt, que es responsable de informar a los rastreadores web qué páginas pueden ser accesibles.
Google destacó que, a medida que las aplicaciones de IA se expandan, continuarán explorando otras formas de ofrecer más opciones y control a los editores de sitios web, buscando alternativas más eficientes y transparentes.
Esta iniciativa es una respuesta a los recientes bloqueos de rastreadores por parte de varios sitios web, incluyendo grandes medios de comunicación como The New York Times, CNN, Reuters y Medium, que buscaron evitar que sus datos se utilizaran para entrenar modelos de IA de terceros.
El desafío consiste en encontrar un equilibrio entre proteger la privacidad de los datos y permitir que Google indexe y presente resultados relevantes en sus búsquedas.