El algoritmo de búsqueda de Google es, sin duda, uno de los sistemas más influyentes de internet, dictando qué sitios prosperan y qué contenidos reinan.
Sin embargo, la forma exacta en que Google clasifica los sitios web siempre ha sido un enigma, descifrado poco a poco por periodistas, investigadores y profesionales de SEO (Search Engine Optimization).
Ahora, una filtración inesperada, supuestamente conteniendo miles de páginas de documentos internos, parece ofrecer una visión inédita de los bastidores de Search, y sugiere que Google podría no haber sido totalmente honesto sobre su funcionamiento durante años.
Rand Fishkin, especialista en SEO por más de una década, afirma que una fuente le compartió 2,500 páginas de documentos con la esperanza de que la divulgación de la filtración desmantelara las «mentiras» propagadas por empleados de Google sobre el algoritmo de búsqueda.
Los documentos delinean la API de búsqueda de Google y detallan qué información está disponible para los empleados, según Fishkin.
El contenido de la filtración no es necesariamente una prueba de que Google usa datos y señales específicas para el ranking. En cambio, la filtración revela qué datos recopila Google de las páginas web, sitios y usuarios de la búsqueda, ofreciendo pistas indirectas a los especialistas en SEO sobre lo que parece importar para Google, como escribió el especialista en SEO Mike King en su análisis de los documentos.
Los documentos filtrados abordan temas como qué tipo de datos Google recopila y usa, qué sitios Google prioriza para temas sensibles como elecciones, cómo maneja Google los sitios pequeños y mucho más.
Aquí están algunos aspectos destacados:
- 14,000 o más factores de clasificación: El algoritmo de Google es increíblemente complejo, considerando una vasta gama de señales para determinar la relevancia de una página.
- Autoridad del sitio: Google tiene en cuenta la reputación del dominio al clasificar las páginas, recompensando a sitios ya establecidos.
- Votos de los usuarios: El tiempo que las personas pasan en una página después de hacer clic se ve como una señal positiva, indicando que el contenido es relevante y atrae la atención.
- Sandbox para sitios nuevos: Los sitios recién creados pueden enfrentar un período inicial de evaluación antes de competir con sitios más consolidados.
- La antigüedad importa: La antigüedad de un dominio es otro factor que Google considera al clasificar las páginas.
- Chrome como termómetro: Google analiza el tiempo de permanencia de los usuarios accediendo a sitios a través de Chrome para evaluar la calidad del contenido.
Algunas informaciones en los documentos parecen contradecir declaraciones públicas de representantes de Google, según Fishkin y King.
«Mentira» es una palabra fuerte, pero es la única precisa para describir la situación», escribe King.
«Aunque no necesariamente culpo a los representantes públicos de Google por proteger su información propietaria, no estoy de acuerdo con sus esfuerzos por desacreditar a personas de marketing, tecnología y periodismo que han presentado hallazgos reproducibles.»
Hasta el momento, la empresa no ha respondido a las solicitudes de comentario sobre la legitimidad de los documentos.