Una guía para la minería de reglas de asociación interpretable usando PyCaret

Estás leyendo la publicación: Una guía para la minería de reglas de asociación interpretable usando PyCaret

La minería de reglas de asociación es uno de los principales conceptos en el campo de la ciencia de datos que ayuda principalmente a tomar decisiones relacionadas con el marketing y requiere datos transaccionales. Hacer que este procedimiento sea interpretable y explicable juega un papel importante en la toma de decisiones. En este artículo, discutiremos la minería de reglas de asociación y haremos una implementación práctica de esta técnica utilizando la biblioteca PyCaret. El uso de PyCaret para esta tarea lo hace más interpretable y explicativo. Los puntos principales que se discutirán en el artículo se enumeran a continuación.

Tabla de contenido

  1. ¿Qué es PyCaret?
  2. ¿Qué es la minería de reglas de asociación?
  3. Módulo para minería de reglas de asociación
  4. Conjunto de datos para la minería de reglas de asociación
  5. Conversión de datos
  6. Reglas de asociación de modelado
  7. Visualización de la minería de reglas de asociación

¿Qué es PyCaret?

PyCaret es una de las bibliotecas de código abierto que brinda soluciones de aprendizaje automático con el objetivo de reducir la codificación en el modelado y la prueba de hipótesis. Esta biblioteca se puede utilizar en una variedad de experimentos de aprendizaje automático de extremo a extremo. Su función de codificación baja hace que el procedimiento de modelado sea muy eficiente y requiera poco tiempo. Además, una cosa que llama la atención sobre la biblioteca es que el módulo diseñado en la biblioteca es más rápido que los modelos manuales.

Con todas estas características, esta biblioteca también proporciona varias visualizaciones interactivas de modelos y datos que también se pueden usar para hacer que el procedimiento de aprendizaje automático sea altamente interpretable y explicable. En este artículo, discutiremos cómo podemos realizar la minería de reglas de asociación utilizando la biblioteca PyCaret. Podemos instalar esta biblioteca en el entorno de Google Colab usando las siguientes líneas de código:

!pip instalar pycaret

¿Qué es la minería de reglas de asociación?

La minería de reglas de asociación es un método de aprendizaje automático que genera reglas donde las reglas nos informan sobre la fuerza de la relación entre las variables en un gran conjunto de datos. Principalmente encontramos el uso de reglas de asociación en el análisis de la canasta de mercado, donde una fuerte relación positiva entre dos productos hace que el vendedor los venda juntos y obtenga más ganancias. Incluso el nombre de este método de aprendizaje automático explica lo que estamos tratando de hacer. Estamos encontrando reglas de asociación entre variables de un gran conjunto de datos.

🔥 Recomendado:  Twitter prueba las reacciones emoji e introduce un mensaje para que los usuarios lean los artículos antes de retuitear

Este método pretendía principalmente encontrar reglas sólidas a partir de un gran conjunto de datos o base de datos mediante la definición y el uso de alguna medida de interés. Por ejemplo, si {maíz, queso} → {base de pizza} se encuentra en las reglas que estamos extrayendo, indicará que es más probable que los clientes que compran queso y maíz juntos también compren pizza. La minería de reglas de asociación ayuda a tomar decisiones sobre actividades de marketing, como la fijación de precios o la colocación de productos.

En este artículo, vamos a utilizar la biblioteca PyCaret para la minería de reglas de asociación que tiene un módulo especial para el procedimiento. Echemos un vistazo al módulo.

Módulo para minería de reglas de asociación

Pycaret tiene un módulo pycaret.arules para la extracción de reglas de asociación que utiliza un método supervisado de aprendizaje automático. Este módulo se puede utilizar para encontrar medidas de relación entre las variables del conjunto de datos. Una de las cosas interesantes del módulo es que convierte automáticamente conjuntos de datos con valores de transacción en la forma que se requiere para el análisis de la cesta de la compra. Dado que PyCaret está especialmente diseñado para el aprendizaje automático de código bajo, este algoritmo también requiere código bajo para diseñar un mejor modelo.

Conjunto de datos para la minería de reglas de asociación

Encontramos principalmente el uso de la minería de reglas de asociación en el análisis de la canasta de mercado. Entonces, en este artículo también usaremos muestras del conjunto de datos minorista en línea. Este conjunto de datos contiene detalles de las transacciones que ocurrieron entre el 12/01/2010 y el 12/09/2011 en una tienda minorista en línea. Este conjunto de datos contiene las siguientes variables:

  • Factura no
  • Número de inventario
  • Descripción
  • Cantidad
  • Datos de facturación
  • Precio unitario
  • Identificación del cliente
  • País
🔥 Recomendado:  10 consejos para dominar el SEO para páginas de destino y alcanzar tus objetivos

Podemos encontrar el conjunto de datos original aquí. Usaremos el conjunto de datos que proporciona PyCaret para la práctica, podemos importar el conjunto de datos usando las siguientes líneas de códigos.

de pycaret.datasets import get_data data = get_data(‘france’)

Producción :

En esta implementación, estamos utilizando el conjunto de datos de Francia únicamente. En la salida, podemos ver algunos de los valores del conjunto de datos. Ahora estamos listos para implementar nuestro proyecto de minería de reglas de asociación.

Conversión de datos

Después de llamar a los datos, debemos importar nuestro módulo de reglas de asociación y convertir los datos de datos transaccionales a datos de canasta de mercado. Podemos hacer esto usando las siguientes líneas de códigos.

from pycaret.arules import * exp_arul101 = setup(data = data, transaction_id = ‘InvoiceNo’, item_id = ‘Description’)

Producción:

Aquí, en el resultado, podemos ver el número único de transacciones en nuestro conjunto de datos que es el recuento único del número de factura y el número único de artículos que obtenemos usando la columna Descripción. Como no hemos ignorado ninguno de los elementos, no obtenemos valores.

Reglas de asociación de modelado

Simplemente podemos instanciar un modelo usando las siguientes líneas de códigos.

modelo1 = crear_modelo()

Cuando hablamos de los parámetros de nuestra elección podemos definir los siguientes parámetros en el modelo:

  • métrico
  • límite
  • min_support
  • redondo

Imprimamos la forma de las reglas y la cabeza creadas.

Aquí en la salida podemos ver los antecedentes y los consecuentes con sus valores de apoyo, confianza, elevación, apalancamiento y convicción.

En el paso anterior, simplemente creamos un modelo. Al convertir el conjunto de datos, hemos visto una opción para ignorar elementos en la salida, en el módulo de configuración podemos definir el parámetro ignore_item para ignorar cualquier elemento de la lista. Esto lo podemos realizar usando las siguientes líneas de códigos.

exp_arul101 = configuración (datos = datos, transacción_id = ‘Número de factura’, artículo_id = ‘Descripción’, ignorar_artículos = [‘POSTAGE’])

🔥 Recomendado:  Guía paso a paso para implementar un modelo ML usando Heroku

Producción:

Aquí podemos ver que hemos ignorado el artículo FRANQUEO. Modelemos estos datos convertidos para encontrar las reglas de asociación. Vamos a crear e imprimir detalles de nuestro modelo mientras ignoramos un elemento.

modelo2 = crear_modelo() imprimir(modelo2.forma) modelo2.cabeza()

Producción:

Aquí podemos ver la diferencia entre esta salida y la salida anterior.

Visualización de la minería de reglas de asociación

La biblioteca PyCaret es famosa por una cosa más que es la interpretabilidad y la explicabilidad de los modelos. Eso significa que podemos visualizar nuestros modelos y sus resultados y comprenderlos mejor. Visualicemos nuestro modelo. Antes de visualizar modelos en Google Colab, debemos habilitar Colab para Pycaret. Esto se puede hacer usando las siguientes líneas de códigos.

desde pycaret.utils importar enable_colab enable_colab()

Producción:

Grafiquemos el modelo.

plot_model(modelo2)

Producción:

Podemos ver que la visualización que obtenemos es gráfica, lo que significa que son interactivos. No podemos publicar visualizaciones interactivas aquí. En la práctica, puedes interactuar con ellos.

También podemos trazar esta visualización en tres dimensiones.

plot_model(modelo2, plot=”3d”)

Producción:

Aquí, la salida anterior también es interactiva y tridimensional. Puede encontrar estas visualizaciones en este cuaderno.

Ultimas palabras

En este artículo, hemos repasado el proceso que se puede seguir para implementar soluciones basadas en la minería de reglas de asociación utilizando la biblioteca PyCaret. Descubrimos que al usar esta biblioteca de python podemos realizar esta importante y difícil tarea de manera muy eficiente y sencilla.

Referencias