Cómo comprobar tus páginas indexadas en Google: cómo arreglar las que no lo están

Estás leyendo la publicación: Cómo comprobar tus páginas indexadas en Google: cómo arreglar las que no lo están

Saber cómo comprobar sus páginas indexadas en Google es un proceso necesario a la hora de realizar una auditoría de un sitio.

La indexación es la forma que tiene Google de “permitirle” aparecer en los resultados de búsqueda, o incluso en los resultados de Google Discover. Si sus páginas no están indexadas, no aparecerá y no obtendrá tráfico orgánico.

Sin embargo, no todas las páginas se indexarán y no te darás cuenta hasta que lo compruebes.

Y en este artículo, le mostraré cómo y le daré algunos consejos sobre cómo indexar páginas más fácilmente.

¿Cómo comprobar qué páginas están indexadas por Google?

A continuación se muestran tres formas de saber qué páginas están indexadas.

Consola de búsqueda de Google

Hay dos formas de comprobar qué páginas están en el índice de Google mediante Google Search Console.

Usando la inspección de URL

Si tiene algunos artículos en su propio sitio o publicó algunos artículos recientemente y desea verificar si están indexados, puede usar el verificador de páginas indexadas de Google en Google Search Console como se muestra a continuación.

¿Cómo comprobar qué páginas están indexadas por Google?

Todo lo que tienes que hacer es ingresar la URL de la página en el cuadro de búsqueda y hacer clic en Enter. Si la página está indexada, recibirá la siguiente notificación.

Cómo comprobar qué páginas están indexadas por GoogleCómo comprobar qué páginas están indexadas por Google

Si no está indexado, recibirá la siguiente notificación.

¿Cómo comprobar qué páginas están indexadas por Google?¿Cómo comprobar qué páginas están indexadas por Google?

Como puede ver arriba, la página ha sido descubierta pero no indexada. Acababa de publicar ese artículo. Por eso no fue indexado. Puedes esperar unos días hasta que Google indexe automáticamente la página o solicite la indexación. Pero no se sabe cuánto tiempo llevará.

Uso de la función de cobertura

En el lado izquierdo de Google Console, verá la sección Índice de Google, que tiene Cobertura, Mapas del sitio y Eliminaciones. Haga clic en Cobertura y se mostrará el número total de páginas indexadas etiquetadas como válidas.

Las páginas que no están indexadas se etiquetan como Excluidas. Y también verás las páginas con errores. A continuación se muestra un ejemplo de cómo se ve la página;

Lo bueno de la función Cobertura es que le indica exactamente por qué las páginas no están indexadas o no aparecen en los resultados de búsqueda. Por ejemplo, podría recibir una respuesta que diga que la URL no está en Google y una etiqueta Sitemap: N/A en la Cobertura, lo que significa que la página se puede indexar, pero no está en el mapa del sitio XML.

Los problemas de Robot.txt y canónicos también se muestran en la sección Cobertura, pero discutiré qué hacer al respecto más adelante en la publicación.

Consulta del sitio de Google

Esta es otra forma sencilla de comprobar cuántas páginas están indexadas. Vaya a la Búsqueda de Google e ingrese sitio:sudominio.com. Por ejemplo, si su sitio web es ilovegardening.com, ingresará sitse:ilovegardening.com y obtendrá una lista completa de todas las páginas web que Google indexó desde su sitio. A continuación se muestra cómo se vería la página;

¿Cómo comprobar qué páginas están indexadas por Google?¿Cómo comprobar qué páginas están indexadas por Google?

También puede limitar la búsqueda de su página web agregando más parámetros al comando. A continuación hay algunos de ellos;

  • La frase de elección del sitio:misitioweb.com: este comando ayuda a encontrar todas las páginas web indexadas en su sitio que tienen una frase específica.
  • Sitio:misitioweb.com inurl:Frase de elección: a diferencia del comando anterior, este comando busca todas las páginas indexadas con una frase específica en la URL.
  • Sitio:mywebsite.com intitle:Frase: este comando resaltará todas las páginas indexadas con una frase específica en el título.

Uso de las fichas de páginas indexadas de Google

Existen varias herramientas que pueden ayudarlo a encontrar las páginas indexadas de manera más eficiente. Estas herramientas incluyen;

  • Northcutt: esta herramienta es bastante sencilla. Simplemente ingrese la URL y le indicará todas las páginas que están indexadas en su sitio web. Si conoce el total de páginas de su sitio, puede restar las páginas indexadas para saber aquellas que no están indexadas. Lamentablemente, no puede realizar más análisis para identificar qué páginas no están indexadas.
  • Pequeñas herramientas de SEO: Small SEO Tools es una colección de varias herramientas, como un verificador de plagio, un verificador de antigüedad del dominio, un verificador gramatical y un verificador de páginas indexadas. Funciona muy bien para sitios pequeños ya que sólo le permite consultar hasta 5 páginas a la vez.

El proceso de rastreo

Cuando realiza una consulta particular en Google, tarda menos de un segundo en obtener los resultados. Pero suceden muchas cosas en segundo plano, lo que puede ayudar al propietario de un sitio web a aumentar sus posibilidades de ser indexado y aparecer en los resultados de búsqueda para los usuarios. Para entender cómo funciona todo, primero definamos algunos de los términos más comunes utilizados;

  • Rastreo: este es el proceso de buscar páginas web para identificar de qué trata el contenido y encontrar más páginas a través de los hipervínculos en las páginas identificadas.
  • Índice: es una especie de directorio que almacena las páginas rastreadas con éxito que pueden aparecer en los resultados del motor de búsqueda. El proceso de guardar una página web en un índice se llama indexación (o indexación de Google). Y cuando indexa su sitio, un usuario escribe una consulta en Google, los resultados se derivan del índice de Google.
  • Web Spider: este es el software responsable del proceso de rastreo. Las arañas de los motores de búsqueda de Google se conocen como Googlebot o Goggle Crawler. Y otros motores de búsqueda tienen sus propias arañas.
  • Tasa de rastreo: esta es la cantidad de solicitudes que el robot de Google puede realizar a su sitio en un segundo.
  • Demanda de rastreo: esta métrica mide cuánto quieren los robots de Google rastrear su sitio. Está determinado por la popularidad de su sitio, ya que las URL más populares se rastrean con frecuencia. Google también rastrea sitios con frecuencia para evitar que estén obsoletos.
  • Presupuesto de rastreo: es la cantidad de páginas que los robots de Google pueden rastrear e indexar dentro de un período determinado. Si tiene demasiadas páginas, es posible que los rastreadores de búsqueda no las visiten con frecuencia.
🔥 Recomendado:  Las mejores alternativas de Mailchimp para el marketing por correo electrónico

Cómo funciona

Entonces, cuando un usuario ingresa una consulta en Google, el robot de Google rastrea todas las páginas del índice y utiliza los enlaces de esas páginas para encontrar páginas más relevantes. Este proceso continúa hasta que hay miles de millones de páginas. Luego, Google filtra estas páginas consultándolas según su relevancia para brindarle la mejor respuesta a su pregunta.

Algunos de los parámetros que verifica el robot de Google incluyen la clasificación de la página, la calidad del sitio web, la ubicación de las palabras clave y la cantidad de sitios web que enlazan a esa página.

El resultado serán todos los sitios que respondan a la consulta del usuario, la URL de la página y un breve fragmento que le ayudará a decidir qué página debe elegir.

También obtienen varias búsquedas relacionadas que pueden probar y usted, como propietario del sitio web, puede utilizar estas búsquedas relacionadas para encontrar más consultas que puedan interesar a su audiencia.

El proceso de rastreo de Google es gratuito y prácticamente automático. No es necesario que pague nada para que su sitio sea rastreado o clasificado. Todo lo que tiene que hacer es enviar el mapa del sitio XML de su sitio y asegurarse de que su sitio siga las pautas para webmasters de Google.

Como mencioné anteriormente, también puedes solicitar el rastreo solicitando la indexación. Claro, es posible que encuentre anuncios clasificados por encima de otro contenido, pero incluso los anuncios se muestran en función de la relevancia y no de cuánto pagó el anunciante.

¿Por qué Google no indexa su sitio?

Ahora que sabemos cómo funciona la indexación, descubramos por qué es posible que sus páginas no estén indexadas.

No ha enviado su mapa del sitio

Como se mencionó anteriormente, debe enviar su archivo sitemap.xml para que Google rastree su sitio web. Es fácil olvidarse de este proceso, especialmente con su primer sitio web. O puede que lo hayas enviado, pero hubo un error y no te diste cuenta.

De cualquier manera, si Google no indexa sus páginas meses después de que las creó, lo primero debe ser verificar y volver a enviar el mapa del sitio de su sitio, lo cual es fácil de hacer, especialmente para los sitios web de WordPress. Todo lo que necesitas hacer es instalar el complemento Yoast SEO, que crea automáticamente el archivo del mapa del sitio.

Sólo para estar seguro, vaya a SEO –General –Características y asegúrese de que XML Sitemaps esté activado. Luego, escribe esto: https://tudominio.com/sitemap_index.xml o https://tudominio.com/sitemap.xml en el cuadro de búsqueda de Google y debería ver el mapa del sitio de su sitio. Luego, copie esta URL y envíela a Google Search Console – Sitemaps. Y eso es.

Además de enviar su mapa del sitio, también debe asegurarse de que todas las páginas estén indexadas. Si bien Google puede encontrar fácilmente todas las páginas que deben indexarse, usted puede hacerlo aún más fácil agregando páginas que no estén en el mapa del sitio.

Errores de rastreo

Si sus páginas no se indexan, es posible que haya errores de rastreo. El rastreador de búsqueda de Google a menudo rastrea un sitio para comprobar si las páginas han cambiado o si se ha publicado contenido nuevo. Pero esto no siempre tiene éxito debido a errores de DNS, errores de servidor, errores de URL, robot.txt y muchos otros errores.

Puede inspeccionar el estado del rastreo de su sitio web yendo a Configuración – Estadísticas de rastreo, como se muestra a continuación.

Aquí obtendrá el número total de rastreos dentro de un período determinado, el tiempo de respuesta promedio y el tamaño total de la descarga. Luego puede verificar los resultados en esa página con la documentación en esta página para encontrar una manera de solucionarlos. Solucionar estos problemas ayudará a su tráfico de búsqueda orgánica.

Etiquetas Robot.txt o Noindex que bloquean algunas páginas

Uno de los errores de rastreo que puede recibir es un archivo Robot.txt que bloquea algunas páginas. En la mayoría de los casos, el bloqueo se realiza intencionalmente cuando se desea indicar a los rastreadores de Google que no indexen una página. Pero hay casos en los que bloquea páginas que deben indexarse ​​utilizando la etiqueta ‘noindex’ o los siguientes fragmentos de código.

🔥 Recomendado:  Lista completa de 701 nombres creativos y únicos de agencias de publicidad

Las etiquetas Noindex también aparecen en las metaetiquetas de su sitio. Por lo tanto, necesita una auditoría exhaustiva del sitio web para asegurarse de que las páginas que necesita indexar no estén bloqueadas.

Puede obtener esta información en la sección Cobertura de GSC, utilizando una herramienta de auditoría del sitio como ahrefs o verificando manualmente el código de su sitio y el archivo robot.txt. Y eliminarlos tampoco es tan complicado. Una vez que encuentre estas etiquetas, simplemente elimínelas manualmente del archivo y Google comenzará a rastrear esas páginas.

Contenido duplicado

Si varias páginas de su sitio devuelven contenido similar durante el rastreo, es posible que sus páginas no estén indexadas. Algunas de las razones por las que tiene páginas duplicadas incluyen;

  • Tener diferentes versiones de un sitio web. Por ejemplo, uno con prefijo www y otro sin prefijo. Lo mismo se aplica a HTTP y HTTPS.
  • Variaciones de URL
  • Alguien está robando su contenido y publicándolo nuevamente en sus sitios.

Puede eliminar contenido duplicado de las siguientes formas;

  • Puede eliminar las páginas duplicadas si son fáciles de encontrar y no agregan ningún valor a la página principal.
  • Redireccionamiento 301: los redireccionamientos 301 son algunas de las mejores prácticas de SEO. Si no puede eliminar las páginas duplicadas, rediríjalas a la página principal. Esto elimina el contenido duplicado y mejora la relevancia de la página, lo que potencialmente podría mejorar la clasificación.
  • Asigne una etiqueta noindex y siga: ¿recuerda el archivo robot.txt que mencioné antes? Así es como le dices manualmente a los rastreadores de Google que no indexen una página. Puede asignar la etiqueta noindex, seguir a todo el contenido duplicado y abandonar la página principal que debe indexarse.
  • Rel=”canonical”: esta función le permite indicar a los rastreadores que algunas páginas son duplicados reales de la página principal y que todo el poder de clasificación de la página debe ir a la página principal. Como tal, asignará las etiquetas canónicas Rel=”canonical” en cada página duplicada y colocará la URL de la página principal en la etiqueta.
  • Asigne una URL preferida en GSC y bloquee las URL que no deben rastrearse ni indexarse.
  • Asigne un rel=canonical autorreferencial a la página principal para evitar que los scrapers roben su contenido.

Velocidad del sitio

De acuerdo a este estudio, la velocidad de carga de un sitio afecta la frecuencia con la que el robot de Google lo rastrea. Querrá que Google rastree su sitio con frecuencia si actualiza constantemente el contenido de su sitio.

Pero si una página tarda más de 3 segundos en cargarse o no se carga en absoluto, el robot de Google tendrá problemas para indexarla.

Además, si las páginas tardan demasiado en cargarse, el rastreador de Google puede indexar solo unas pocas páginas de su sitio mientras usted necesita que rastree y Google indexe más páginas. También se sabe que la velocidad del sitio afecta las clasificaciones generales, donde los sitios lentos tienen una clasificación más baja que los sitios rápidos. Google incluso lanzó una actualización principal basada en Core Web Vitals en junio de 2021.

Configuración de privacidad y archivos .htaccess

Para aquellos con sitios de WordPress, alterar la configuración de Privacidad también puede afectar el rastreo y la indexación. Para descartar este problema, inicie sesión en su panel de administración de WordPress, luego vaya a Configuración – Privacidad y asegúrese de que esté desactivado.

Por otro lado, los archivos .htaccess ayudan con SSI, Mod_Rewrites, Hotlink Protection, Browser Caching y otras funciones en el servidor. Pero este archivo también puede afectar la velocidad del sitio e interferir con el proceso de rastreo.

Su sitio fue penalizado

Si no sigue las pautas para webmasters de Google, su sitio perderá ganancias, tráfico o, peor aún, sus páginas pueden ser eliminadas del índice de Google. Siempre y cuando su sitio siga las Directrices para webmasters de Google, no tienes que preocuparte por las sanciones. Y siempre recibirás una advertencia antes de que tomen medidas tan drásticas.

Cómo hacer que Google indexe sus páginas

He destacado varias veces que puedes indexar tus páginas rápidamente solicitando la indexación.

Esto se realiza enviando la URL a la herramienta de inspección de URL para verificar su estado y tendrá la opción de solicitar la indexación. Otros métodos que he mencionado incluyen;

  • Comprobando si las páginas están bloqueadas por el archivo robot.txt o etiquetas noindex
  • Eliminando contenido duplicado
  • Corrección de errores de rastreo y velocidades de carga
  • Comprobando la configuración de privacidad y el archivo .htaccess.
  • Volver a enviar el mapa del sitio

Si hizo esto y sus páginas aún tardan demasiado en indexarse, a continuación encontrará otros consejos que puede probar.

Enlace interno

Como se mencionó anteriormente, el proceso de rastreo implica seguir los enlaces que se encuentran en la página. Por lo tanto, si hay páginas “huérfanas” o páginas a las que no ha vinculado, los robots de Google pueden tener dificultades para encontrar e indexar estas páginas.

🔥 Recomendado:  Cómo construir estrategias de marketing en línea para una pequeña empresa

Realizar una auditoría del sitio con herramientas como SEMrush o Ahrefs puede ayudarle a identificar el contenido huérfano. Pero si desea obtener información más profunda sobre todo el proceso de vinculación interna y evitar contenido huérfano, debería probar Link Whisper.

Esta es una herramienta diseñada por Spencer Haws que ayuda a sugerir artículos a los que vincular según su relevancia. También es útil comenzar vinculando desde las páginas de mejor rendimiento: las páginas que Google rastrea con frecuencia.

Además de garantizar enlaces internos saludables, también debes asegurarte de que los enlaces internos no sean nofollows. ¿Por qué? Los robots de Google no rastrean enlaces nofollow. Puedes asignar una etiqueta nofollow a los enlaces salientes cuando no quieras transferir PageRank a otro sitio, pero no lo hagas con los enlaces internos.

Publique contenido de alta calidad y elimine páginas de baja calidad

La indexación no se trata solo de cuestiones técnicas. También es necesario publicar contenido que sea valioso y útil para el lector.

Los robots de Google primero escanearán la página para determinar si cumple con la intención del usuario antes de escanear los enlaces en esa página. Si se trata de una página de baja calidad, es posible que no se indexe y que otras páginas a las que enlaza la página no se puedan rastrear. Como se mencionó anteriormente, Google tiene un presupuesto de rastreo.

Si tiene varias páginas de baja calidad en su sitio, puede agotar el presupuesto de rastreo antes de que se rastreen las páginas relevantes y de alta calidad. Pero esto se aplica principalmente a sitios con miles de páginas.

Además de eliminar páginas de baja calidad, también puede mejorar la velocidad del sitio, eliminar contenido duplicado, corregir o eliminar páginas con errores y mejorar los enlaces internos (he explicado cómo puede hacer todo esto en las secciones anteriores).

Otros aspectos a los que prestar atención incluyen los encabezados, las etiquetas y los sitios a los que enlaza.

Vínculos de retroceso

Los sitios que enlazan con su sitio también son importantes. Los vínculos de retroceso le muestran a Google que su sitio tiene más valor y es probable que el robot de Google los rastree con más frecuencia que aquellos que no los tienen.

Comparta su contenido en canales de redes sociales

Compartir su contenido en las redes sociales es una excelente manera de dar a conocer su negocio, mejorar las clasificaciones, generar tráfico y clientes potenciales.

Pero lo que quizás no sepa es que compartir su contenido también crea señales sociales, que pueden ayudar a que los rastreadores de Google rastreen e indexen sus páginas. Algunos de los lugares donde puede publicar su contenido para acelerar la indexación incluyen;

  • Facebook
  • Gorjeo
  • Medio
  • Reddit
  • Quora
  • cavar
  • Compartir diapositivas
  • LinkedIn

Cómo comprobar qué páginas están indexadas por Google

Y ahí lo tienes. Si su tráfico no crece como esperaba, o ha experimentado una caída, es probable que los rastreadores de Google estén teniendo problemas para rastrear e indexar sus páginas.

He detallado todas las diferentes formas en que puede verificar qué páginas están indexadas por Google, identificar problemas de indexación y solucionarlos. Esto le ayudará a obtener una clasificación más alta en las SERP de Google para atraer a más usuarios de búsqueda.

Recuerde, no aparecer en los resultados de la Búsqueda de Google no significa que no esté indexado. Es posible que esté indexado, pero tenga una clasificación muy baja porque su sitio carece de autoridad.

Y para leer más, consulte nuestra lista de otras formas inteligentes de cómo lograr que Google indexe más páginas.

Tabla de Contenido