Estás leyendo la publicación: La respuesta 500 en Robots.txt Fetch puede afectar los resultados enriquecidos
John Mueller de Google recibió comentarios sobre un error en la forma en que Search Console valida los resultados enriquecidos. Google eliminará las imágenes de los resultados enriquecidos debido a un error en la forma en que un CDN que aloja las imágenes maneja una solicitud de un archivo robots.txt inexistente. El error que se descubrió fue cómo la consola de búsqueda y la prueba de resultados enriquecidos de Google no alertan al editor del error y, posteriormente, le dan a los datos estructurados una validación exitosa.
Un error en el contexto de la programación es cuando un programa de software se comporta de manera inesperada. Un error no siempre es un problema en la codificación pero, como en este caso, podría ser una falla al anticipar un problema que a su vez conduce a resultados no deseados, como este.
El editor que hizo la pregunta trató de utilizar las herramientas de Google para diagnosticar el motivo por el cual desaparecían sus resultados enriquecidos y se sorprendió al descubrir que no servían para este error en particular.
Si bien este problema afectaba la vista previa de la imagen de resultados enriquecidos de recetas en los resultados enriquecidos de recetas de Google, este problema también podría ser un problema para otras situaciones.
Por lo tanto, es bueno estar al tanto de este problema, ya que podría surgir de otras maneras.
Desaparecieron las vistas previas de imágenes de resultados enriquecidos de recetas
La persona que hizo la pregunta proporcionó antecedentes de lo que sucedió.
Relató lo sucedido:
“Nos topamos con una especie de trampa para tigres, diría yo, en términos de ricos resultados de recetas.
Tenemos cientos de miles de recetas que están indexadas y hay mucho tráfico proveniente de la galería de recetas.
Y luego… durante un período de tiempo se detuvo.
Y se comprobaron todos los metadatos y la consola de búsqueda de Google decía… todo esto es contenido rico en recetas, todo está bien, se puede mostrar.
Finalmente notamos que en la vista previa, cuando previsualizas el resultado, faltaba la imagen.
Y parece que hubo un cambio en Google y que si se requería un archivo robots.txt para recuperar las imágenes, entonces nada de lo que podíamos ver en las herramientas decía que algo no era válido.
Entonces, es un poco incómodo, ¿verdad? Cuando marca algo para decir “¿es este un resultado válido de receta enriquecida?” y dice sí, es genial, es absolutamente genial, tenemos todos los metadatos.
Y revisas todas las URL y todas las imágenes son correctas, pero resulta que detrás de escena, había un nuevo requisito de tener un archivo robots.txt”.
John Müller preguntó:
“¿Cómo quieres decir que tenías que tener un archivo robots.txt?”
La persona que hizo la pregunta respondió:
“Lo que encontramos es que, si solicitó el archivo robots.txt de nuestro CDN, le dio como 500.
Cuando pusimos un archivo robots.txt allí, inmediatamente las vistas previas comenzaron a aparecer correctamente.
Y eso implica rastrearlo y colocarlo en un sitio estático, creo.
Entonces, operativamente, encontramos que agregar que robots.txt hizo el trabajo “.
John Mueller asintió con la cabeza y dijo:
“Si, vale.
Entonces, desde nuestro punto de vista, no es que se requiera un archivo robots.txt. Pero tiene que tener un código de resultado adecuado.
Entonces, si no tiene activado, debería devolver 404.
Si tiene uno, obviamente podemos leerlo.
Pero si devuelve un error del servidor para el archivo robots.txt, nuestros sistemas asumirán que tal vez haya un problema con el servidor y no lo rastrearemos.
Y eso es algo que ha sido así desde el principio.
Pero este tipo de problemas, especialmente cuando estás en un CDN y está en un nombre de host separado, a veces eso es realmente difícil de detectar.
Y imagino la prueba de resultados enriquecidos, al menos que yo sepa, se enfoca en el contenido que está en la página HTML.
Entonces, el marcado JSON-LD que tiene allí, probablemente no verifique si las imágenes son realmente recuperables.
Y luego, si no se pueden recuperar, por supuesto, tampoco podemos usarlos en el carrusel.
Entonces eso podría ser algo que necesitamos descubrir cómo resaltar mejor”.
La respuesta de error 500 para CDN Robots.txt puede causar problemas
Este es uno de esos problemas de SEO que son difíciles de diagnosticar pero que pueden causar muchos problemas negativos, como señaló la persona que hizo la pregunta.
Normalmente, un rastreo de un archivo robots.txt que no existe debería generar un código de respuesta del servidor de 404, lo que significa que el archivo robots.txt no existe.
Entonces, si la solicitud de un archivo robots.txt genera un código de respuesta 500, eso es una indicación de que algo en el servidor o el CMS está mal configurado.
La solución a corto plazo es cargar un archivo robots.txt.
Pero podría ser una buena idea sumergirse en el CMS o el servidor para verificar cuál es el problema subyacente.
Código de respuesta 500 para una recuperación de Robots.txt
Las consecuencias negativas para la vista previa de resultados enriquecidos de recetas debido a que una CDN devuelve una respuesta de error 500 pueden ser un problema poco frecuente.
Un código de respuesta de error del servidor 500 a veces ocurre cuando hay algo inesperado o falta en el código y el servidor responde finalizando el procesamiento del código y lanzando el código de respuesta 500.
Por ejemplo, si edita un archivo PHP y olvida indicar el final de una sección de código, eso podría hacer que el servidor deje de procesar el código y arroje una respuesta 500.
Cualquiera que sea el motivo de la respuesta de error cuando Google intentó obtener el archivo robots.txt, este es un buen problema a tener en cuenta para esa rara situación en la que te sucede.
Citación
Error de CDN para imágenes y resultados enriquecidos de recetas
Míralo en el minuto 51:45