Google explica cómo identifica el contenido principal de una página

Última actualización: 05/08/2025 3:32 pm

3 minutos de lectura

¿Alguna vez te has preguntado cómo decide Google qué es realmente importante en una página de internet? Bueno, esta es una de esas curiosidades que pasa desapercibida, pero que marca una gran diferencia para quienes tienen un sitio web e incluso para quienes simplemente navegan por ahí.

Durante un evento reciente llamado Search Central Deep Dive, realizado en Asia, un experto de Google llamado Gary Illyes reveló detalles sobre este proceso.

Según él, Google se esfuerza por identificar lo que llama «contenido central», o centerpiece content. Esta es la parte de la página que realmente entrega lo que el usuario está buscando, ya sea un texto, una imagen, un video o incluso una herramienta interactiva. Todo lo que ayuda a cumplir el propósito de la página entra en esta categoría.

Illyes explicó que «el contenido ubicado en esta área tiene mucho más peso en el ranking que el que está en los pies de página, encabezados o barras laterales». En otras palabras, lo que está en el «corazón» de la página es lo que más cuenta para aparecer en la cima de las búsquedas.

El proceso es más técnico de lo que parece. Según Illyes, «Google analiza la página renderizada —aquella que el usuario ve en el navegador— para entender dónde está posicionado el contenido».

Con base en esto, el sistema define la importancia de cada palabra o expresión. Un término colocado en destacado en el cuerpo del texto tiene muchas más posibilidades de ayudar en el ranking que el mismo término escondido en un rincón de la página.

Para facilitar aún más este trabajo, «usar HTML semántico es una excelente forma de ayudar a Google a entender la estructura de la página», dijo él.

Error 404

Pero la parte más sorprendente llegó cuando el experto habló sobre un error que muchos cometen sin saberlo: el famoso soft 404.

Se trata de páginas que ya no existen, pero que siguen devolviendo un estado de éxito (200 OK) en lugar de informar correctamente que ese contenido ha sido eliminado.

«Una página que devuelve un 200 OK, pero muestra un mensaje de error o tiene contenido vacío, es tratada como soft 404», advirtió Illyes.

Según él, esto «desperdicia el presupuesto de rastreo y perjudica la experiencia del usuario».

Y lo más curioso: «Durante años, una página de documentación del propio Google fue clasificada como soft 404 por nuestros sistemas y por eso no podía ser indexada correctamente».