Googlebot rastrea e indexa los primeros 15 megabytes de contenido HTML

Estás leyendo la publicación: Googlebot rastrea e indexa los primeros 15 MB de contenido HTML

Una actualización del documento de ayuda de Googlebot contiene la confirmación de que rastreará los primeros 15 MB de una página web y todo lo que pase después de este límite no se incluirá en los cálculos de clasificación.

Google especifica en el documento de ayuda:

“Todos los recursos a los que se hace referencia en el HTML, como imágenes, videos, CSS y JavaScript, se obtienen por separado.

Después de los primeros 15 MB del archivo, Googlebot deja de rastrear y solo considera los primeros 15 MB del archivo para la indexación.

El límite de tamaño de archivo se aplica a los datos sin comprimir”.

esta izquierda algunos en la comunidad SEO se preguntan si esto significara que Googlebot ignoraría por completo el texto que se encontraba debajo de las imágenes en el corte de los archivos HTML.

“Es específico del archivo HTML en sí, tal como está escrito”, aclaró John Mueller, defensor de la búsqueda de Google, a través de Twitter.

“Los recursos/contenidos incrustados extraídos con etiquetas IMG no forman parte del archivo HTML”.

Lo que esto significa para el SEO

Para asegurarse de que Googlebot lo pondere, el contenido importante ahora debe incluirse cerca de la parte superior de las páginas web.

Esto significa que el código debe estar estructurado de manera que coloque la información relevante para SEO con los primeros 15 MB en un archivo HTML o basado en texto compatible.

También significa que las imágenes y los videos deben comprimirse y no codificarse directamente en HTML, siempre que sea posible.

🔥 Recomendado:  Los 7 mejores raspadores de Reddit en 2023: cómo raspar datos con Python

Las mejores prácticas de SEO actualmente recomiendan mantener las páginas HTML en 100 KB o menos, por lo que muchos sitios no se verán afectados por este cambio. El tamaño de la página se puede verificar con una variedad de herramientas, incluido Google Page Speed ​​Insights.

En teoría, puede sonar preocupante que potencialmente podría tener contenido en una página que no se utiliza para la indexación. Sin embargo, en la práctica, 15 MB es una cantidad considerablemente grande de HTML.

Como dice Google, los recursos como imágenes y videos se obtienen por separado. Según la redacción de Google, parece que este límite de 15 MB se aplica solo a HTML.

Sería difícil superar ese límite con HTML a menos que estuviera publicando el texto de un libro completo en una sola página.

Si tiene páginas que superan los 15 MB de HTML, es probable que tenga problemas subyacentes que deben solucionarse de todos modos.


Fuente: Centro de búsqueda de Google