Estás leyendo la publicación: Cómo automatizar la creación de páginas de categorías de comercio electrónico con Python
Agrupar el inventario de productos y alinear automáticamente los SKU con la demanda de búsqueda es una excelente manera de encontrar oportunidades para crear nuevas categorías de comercio electrónico.
Las páginas de categorías de nicho son una forma comprobada para que los sitios de comercio electrónico se alineen con la demanda de búsqueda orgánica y, al mismo tiempo, ayuden a los usuarios a comprar.
Si un sitio almacena una variedad de productos y hay demanda de búsqueda, crear una página de destino dedicada es una manera fácil de alinearse con la demanda.
Pero, ¿cómo pueden los profesionales de SEO encontrar esta oportunidad?
Claro, puedes mirarlo a ojo, pero por lo general dejarás muchas oportunidades sobre la mesa.
Este problema me motivó a escribir algo en Python, que comparto hoy de una manera fácil de usar. aplicación Streamlit. (¡No se requiere experiencia en codificación!)
¡La aplicación vinculada anteriormente creó la siguiente salida automáticamente usando nada más que dos exportaciones de rastreo!
¿Observa cómo las categorías sugeridas se vinculan automáticamente a la categoría principal existente?
La aplicación incluso muestra cuántos productos están disponibles para completar la categoría.
Beneficios y usos
- Mejorar la relevancia para la alta demandaconsultas competitivas mediante la creación de nuevas páginas de destino.
- Aumentar la posibilidad de enlaces de sitios relevantes que se muestra debajo de la categoría principal.
- Reducir los CPC a la página de destino a través de una mayor relevancia.
- Potencial para informar las decisiones de comercialización. (Si hay una demanda de búsqueda alta frente a un número bajo de productos, existe la posibilidad de ampliar el rango.0
La creación de las subcategorías sugeridas para la categoría principal de sofás alinearía el sitio con 3500 búsquedas adicionales por mes con relativamente poco esfuerzo.
Características
- Crea sugerencias de subcategorías automáticamente.
- Vuelva a vincular las subcategorías con la categoría principal (¡elimina muchas conjeturas!).
- Haga coincidir un mínimo de X productos antes de recomendar una categoría.
- Compruebe la similitud con una categoría existente (X % de coincidencia aproximada) antes de recomendar una nueva categoría.
- Establezca un límite mínimo de volumen de búsqueda/CPC para las sugerencias de categorías.
- Admite volumen de búsqueda y datos de CPC de varios países.
Primeros pasos/Preparación de los archivos
Para usar esta aplicación necesitas dos cosas.
En un nivel alto, el objetivo es rastrear el sitio web de destino con dos extracciones personalizadas.
El informe internal_html.csv se exporta junto con una exportación inlinks.csv.
Estas exportaciones luego se cargan en la aplicación Streamlit, donde se procesan las oportunidades.
Configuración de rastreo y extracción
Al rastrear el sitio, deberá configurar dos extracciones en Screaming Frog: una para identificar de forma única las páginas de productos y otra para identificar de forma única las páginas de categorías.
La aplicación Streamlit comprende la diferencia entre los dos tipos de páginas al hacer recomendaciones para nuevas páginas.
El truco consiste en encontrar un elemento único para cada tipo de página.
(Para una página de producto, este suele ser el precio o la política de devoluciones, y para una página de categoría, suele ser un elemento de clasificación de filtro).
Extracción de los elementos únicos de la página
Screaming Frog permite extracciones personalizadas de contenido o código de una página web cuando se rastrea.
Esta sección puede resultar abrumadora si no está familiarizado con las extracciones personalizadas, pero es esencial para obtener los datos correctos en la aplicación Streamlit.
El objetivo es terminar con algo que se parezca a la imagen de abajo.
(Una extracción única para páginas de productos y categorías sin superposición).
Los pasos a continuación lo guiarán a través de la extracción manual del elemento de precio para una página de producto.
Luego, repita para una página de categoría después.
Si está atascado o le gustaría leer más sobre la herramienta web scraper en Screaming Frog, la documentación oficial vale la pena tu tiempo.
Extracción manual de elementos de página
Comencemos por extraer un elemento único que solo se encuentra en la página de un producto (generalmente el precio).
Resalte el elemento de precio en la página con el mouse, haga clic con el botón derecho y seleccione .
Esto abrirá la ventana de elementos con la línea HTML correcta ya seleccionada.
Haga clic con el botón derecho en la línea preseleccionada y elija > . ¡Eso es todo!
Abra Screaming Frog y pegue el selector copiado en la sección de extracción personalizada. ( > > ).
Nombre el extractor como “producto”, seleccione el menú desplegable CSSPath y elija .
Repita el proceso para extraer un elemento único de una página de categoría. Debería verse así una vez completado para las páginas de productos y categorías.
Finalmente, comience el rastreo.
El rastreo debería tener este aspecto al ver la pestaña Extracción personalizada.
¿Observe cómo las extracciones son únicas para cada tipo de página? Perfecto.
El script usa el extractor para identificar el tipo de página.
Internamente, la aplicación convertirá el extractor en etiquetas.
(Menciono esto para enfatizar que los extractores pueden ser cualquier cosa siempre que identifiquen de manera única ambos tipos de página).
Exportando los archivos
Una vez que se ha completado el rastreo, el último paso es exportar dos tipos de archivos CSV.
- interno_html.csv.
- enlaces a páginas de productos.
Vaya a la pestaña en Screaming Frog y resalte todas las URL que tienen una extracción de productos.
(Tendrá que ordenar la columna para agruparla).
Por último, haga clic con el botón derecho en las URL del producto, seleccione y luego
Ahora debería tener un archivo llamado inlinks.csv.
Finalmente, solo necesitamos exportar el archivo internal_html.csv.
Haga clic en la pestaña, seleccione HTML en el menú desplegable a continuación y haga clic en el botón Exportar adyacente.
Finalmente, elija la opción para guardar el archivo como .csv
Captura de pantalla de Screaming Frog SEO Spider, mayo de 2022
¡Felicidades! ¡Ya está listo para usar la aplicación Streamlit!
Uso de la aplicación Streamlit
Usar la aplicación Streamlit es relativamente simple.
Las diversas opciones están configuradas con valores predeterminados razonables, pero siéntase libre de ajustar los cortes para que se adapten mejor a sus necesidades.
Recomiendo encarecidamente usar un Clave API de palabras clave en todas partes (aunque no es estrictamente necesario ya que esto se puede consultar manualmente más tarde con una herramienta existente si se prefiere).
(El guión precalifica la oportunidad comprobando el volumen de búsqueda. Si falta la clave, el resultado final contendrá más palabras irrelevantes).
Si desea utilizar una clave, esta es la sección de la izquierda a la que debe prestar atención.
Una vez que haya ingresado la clave API y ajustado los límites a sus enlaces, cargue el rastreo inlinks.csv.
Una vez completado, aparecerá un nuevo mensaje junto a él, que le pedirá que cargue el archivo de rastreo internal_html.csv.
Finalmente, aparecerá un nuevo cuadro que le pedirá que seleccione los nombres de producto y columna del archivo de rastreo cargado para que se asignen correctamente.
Haga clic en enviar y se ejecutará el script. Una vez completado, verá la siguiente pantalla y podrá descargar una práctica exportación .csv.
Cómo funciona el guión
Antes de sumergirnos en el resultado del guión, ayudará a explicar lo que sucede debajo del capó a un alto nivel.
De un vistazo:
- Genera miles de palabras clave generando n-gramas a partir de los encabezados H1 de la página del producto.
- Califique las palabras clave comprobando si la palabra es en una coincidencia exacta o aproximada en un encabezado de producto.
- Califique aún más las palabras clave comprobando el volumen de búsqueda usando la API de Keywords Everywhere (opcional pero recomendada).
- Comprobar si ya existe una categoría existente usando una coincidencia aproximada (puede encontrar palabras desordenadas, diferentes tiempos, etc.).
- Utiliza el informe de enlaces internos para asignar sugerencias a una categoría principal automáticamente.
Generación de N-gramas
El script crea cientos de miles de n-gramas desde la página del producto H1, la mayoría de los cuales son completamente absurdos.
En mi ejemplo para este artículo, los n-gramas generaron 48,307 palabras, ¡así que será necesario filtrar esto!
El primer paso en el proceso de filtrado es verificar si las palabras clave generadas a través de n-gramas se encuentran al menos X veces dentro de la columna del nombre del producto.
(Esto puede ser una coincidencia exacta o aproximada).
Todo lo que no se encuentra se descarta de inmediato, lo que generalmente elimina alrededor del 90% de las palabras clave generadas.
La segunda etapa de filtrado es verificar si las palabras clave restantes tienen demanda de búsqueda.
Cualquier palabra clave sin demanda de búsqueda también se descarta.
(Es por eso que recomiendo usar la API de Keywords Everywhere al ejecutar el script, lo que da como resultado un resultado más refinado).
Vale la pena señalar que puede hacer esto manualmente después buscando en Semrush/Ahrefs, etc., descartando cualquier palabra clave sin volumen de búsqueda y ejecutando una BUSCARV en Microsoft Excel.
Más barato si tiene una suscripción existente.
Recomendaciones vinculadas a páginas de destino específicas
Una vez que se ha filtrado la lista de palabras clave, la secuencia de comandos utiliza el informe de enlaces internos para vincular la subcategoría sugerida a la página de destino.
Las versiones anteriores no hacían esto, pero me di cuenta de que aprovechar el informe inlinks.csv significaba que era posible.
Realmente ayuda a comprender el contexto de la sugerencia de un vistazo durante el control de calidad.
Esta es la razón por la que el script requiere dos exportaciones para funcionar correctamente.
Limitaciones
- No verificar los volúmenes de búsqueda dará como resultado más resultados para el control de calidad. (Incluso si no usa la API de Keywords Everywhere, le recomiendo que se preseleccione filtrando el volumen de búsqueda 0 después).
- Algunas palabras clave irrelevantes tendrán volumen de búsqueda y aparecerán en el informe finalincluso si se ha comprobado el volumen de palabras clave.
- Las palabras aparecerán típicamente en el sentido singular para el resultado final. (porque los productos son singulares y las categorías se pluralizan si venden más de un solo producto). Sin embargo, es bastante fácil agregar una “s” al final de la sugerencia.
Variables configurables por el usuario
He seleccionado lo que considero opciones predeterminadas sensatas.
Pero aquí hay un resumen si desea modificar y experimentar.
- Productos mínimos para igualar (coincidencia exacta) – El número mínimo de productos que deben existir antes de sugerir la nueva categoría en una coincidencia exacta.
- Productos mínimos para emparejar (coincidencia parcial) – El número mínimo de productos que deben existir antes de sugerir la nueva categoría en una coincidencia aproximada (las palabras se pueden encontrar en cualquier orden).
- Mínima similitud con una categoría existente – Esto verifica si una categoría ya existe en una coincidencia aproximada antes de hacer la recomendación. Cuanto más cerca de 100 = coincidencia más estricta.
- CPC mínimo en $ – El monto mínimo en dólares de la palabra clave de la categoría sugerida. (Requiere la API de Keywords Everywhere).
- Volumen mínimo de búsqueda – El volumen mínimo de búsqueda de la palabra clave de la categoría sugerida. (Requiere API de palabras clave en todas partes).
- Clave API de palabras clave en todas partes – Opcional, pero recomendable. Se utiliza para extraer datos de volumen de búsqueda/CPC. (Útil para preseleccionar categorías).
- Establecer el país del que extraer los datos de búsqueda – Los datos de búsqueda específicos del país están disponibles. (El valor predeterminado es EE. UU.).
- Establecer la moneda para los datos de CPC – Los datos de CPC específicos del país están disponibles. (USD predeterminado).
- Mantener la sugerencia de palabra más larga – Con sugerencias de palabras similares, esta opción mantendrá la coincidencia más larga.
- Habilitar coincidencia aproximada de productos – Esto buscará nombres de productos en una coincidencia aproximada. (Las palabras se pueden encontrar desordenadas, recomendadas, pero lentas y con un uso intensivo de la CPU).
Conclusión
Con una pequeña cantidad de preparación, es posible aprovechar una gran cantidad de oportunidades orgánicas mientras se mejora la experiencia del usuario.
Aunque esta secuencia de comandos se creó con un enfoque de comercio electrónico, según los comentarios, funciona bien para otros tipos de sitios, como los sitios de listas de trabajos.
Entonces, incluso si su sitio no es un sitio de comercio electrónico, vale la pena intentarlo.
¿Entusiasta de Python?
Publiqué el código fuente para una versión que no es Streamlit aquí.
Más recursos: