GPTBot: cómo gestionar el acceso del rastreador web de OpenAI

Última actualización: 11/08/2023 1:47 pm

2 minutos de lectura

Tópicos

Entendiendo el GPTBot:
Restringiendo el Acceso del GPTBot:

El GPTBot de OpenAI es un potente rastreador web diseñado para mejorar los modelos de IA futuros.

Sin embargo, los propietarios de sitios web tienen la opción de restringir el acceso del GPTBot a sus sitios si así lo desean.

En este tutorial, exploraremos cómo puedes controlar el acceso del GPTBot a tu sitio web.

Entendiendo el GPTBot:

El GPTBot puede ser identificado por su token de agente de usuario y la cadena completa del agente de usuario.

Busca en la web datos para mejorar la precisión, capacidades y seguridad de los modelos de IA.

Aunque evita fuentes con acceso restringido por suscripción y fuentes que violen las políticas de OpenAI o recojan información personal, puede proporcionar contribuciones valiosas al ecosistema de IA.

Restringiendo el Acceso del GPTBot:

Para evitar que el GPTBot acceda a todo tu sitio web, puedes modificar el archivo robots.txt. Incluye las siguientes directrices para bloquear por completo al GPTBot:

User-agent: GPTBot
Disallow: /

Si prefieres otorgar acceso parcial, puedes personalizar los directorios que el GPTBot puede recorrer.

Para hacerlo, agrega las siguientes directrices al archivo robots.txt:

User-agent: GPTBot 
Allow: /directorio-1/ 
Disallow: /directorio-2/

Es importante reconocer que restringir el acceso del GPTBot puede afectar la privacidad, seguridad y contribución de datos para el avance de la IA.

Mientras que algunos argumentan que OpenAI debería compartir ganancias si monetiza datos de la web, otros creen que los datos públicos de la web deben ser libremente accesibles para el desarrollo de la IA.

PorRene Fraga

Seguir:

Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).