Principales herramientas de interpretación de modelos de aprendizaje automático

Estás leyendo la publicación: Principales herramientas de interpretación de modelos de aprendizaje automático

Tan importante como es hacer modelos de aprendizaje automático, la capacidad de interpretar y explicar las decisiones tomadas por un modelo de ML es crucial para garantizar la equidad, la responsabilidad y la confiabilidad de las predicciones. Sin mencionar que también ayuda a que se vea menos como una caja negra.

Ser capaz de interpretar el modelo permite a los desarrolladores pasar de la pregunta “¿qué predijo el modelo?” a ‘¿cómo predijo esto el modelo?’ Para lograr esto, se han desarrollado muchas técnicas a lo largo de los años que varían ligeramente entre sí y se utilizan para diferentes modelos a través de diferentes enfoques.

Estas son algunas de las principales herramientas y técnicas que utilizan los desarrolladores para interpretar los modelos de aprendizaje automático.

ELI5

Acrónimo de “Explicar como si tuviera 5 años”, ELI5 es una biblioteca de Python y es bastante fácil de usar para explicar e interpretar modelos de aprendizaje automático. La técnica interpreta los modelos en un ámbito local/global, en lugar de una forma específica/agnóstica. Actualmente, requiere scikit-learn 0.18+ para ejecutarse.

La biblioteca permite la explicación de pesos y predicciones de clasificadores y regresores lineales, e imprime árboles de decisión como texto o SVG. También muestra la importancia de las características junto con la explicación de las predicciones de los árboles de decisión y los conjuntos basados ​​en árboles.

El uso principal de esto es inspeccionar los parámetros del modelo y descubrir cómo funciona el modelo globalmente, o inspeccionar las predicciones individuales del modelo y relacionarlas con el proceso de toma de decisiones del modelo. Actualmente, el modelo solo está disponible para Keras, XGBoost, LightGBM, CatBoost, lightning y sklearn-crfsuite.

🔥 Recomendado:  “AlphaFold: el método de aprendizaje profundo que revolucionó la predicción de la estructura de proteínas”

FORMA

Abreviatura de SHApley Additive exPlanations, SHAP adopta un enfoque diferente para explicar el resultado de cualquier modelo ML utilizando la teoría de juegos. Explica la predicción de una instancia mediante el cálculo de la contribución de cada característica en relación con esa predicción utilizando valores de Shapley.

Los valores de Shapley son un método derivado de la teoría de juegos de coalición e itera cómo se puede distribuir el pago entre las características. Estos valores son la contribución marginal promedio de cada valor de característica individual en todas las coaliciones posibles. Se considera que es el enfoque más intuitivo para la interpretación de modelos, aunque a menudo puede resultar complicado y abrumador para los principiantes.

La explicación SHAP se expresa matemáticamente como:

CAL

Explicaciones locales interpretables agnósticas del modelo (LIME), lo que significa que el marco analiza predicciones individuales y brinda información detallada sobre las predicciones de cualquier clasificador de ML. El repositorio se usa principalmente para Javascript y parcialmente para desarrolladores de Python.

Siendo independiente del modelo, LIME trata cada modelo como una caja negra. Esto significa que hace interpretaciones fuera del modelo y, por lo tanto, funciona en una amplia gama de modelos. LIME ofrece tres métodos dispares para la interpretación que se ocupan de diferentes tipos de datos:

  • Interpretación de Texto
  • Interpretación tabular
  • Interpretación de imágenes

anclas

Anchors es similar a SHAP y LIME para generar explicaciones locales, pero en lugar de modelos interpretables, esta herramienta expresa las explicaciones como reglas simples y fáciles de entender ‘si-entonces’. Como su nombre indica, la regla anclas la predicción para que los cambios en otros valores no afecten la predicción.

🔥 Recomendado:  ¿Cómo funciona la precisión media media (mAP) en la detección de objetos?

Esta técnica se usa idealmente para modelos de clasificación de imágenes, ya que identifica el conjunto mínimo de regiones de la imagen, denotándolas como anclas, que le permite tomar decisiones. Estos anclajes se crean mediante la identificación de regiones que tienen valores de activación de clase alta, es decir, el área donde el modelo realiza la predicción.

Una ventaja clave de la técnica de anclajes es que permite la generación de explicaciones interpretables por humanos, que pueden ser útiles para comprender cómo un modelo toma sus decisiones e identificar posibles fuentes de sesgo.

MLxtend

También conocido como Machine Learning Extensions, MLxtend es una biblioteca de Python para el análisis de datos. La biblioteca ofrece características tales como:

  • Círculo de correlación PCA: La biblioteca le permite ver los resultados al trazar un círculo de correlación PCA y luego correlacionar las características y el componente principal. Luego, estos se trazan como vectores en un círculo unitario con los componentes principales como ejes. Estos ejes muestran la varianza de los componentes principales específicos.
  • Inclinacióndescomposición de la varianza: para abordar el equilibrio entre sesgo y varianza, que consiste en evitar el ajuste insuficiente y el sobreajuste en un modelo, MLxtend obtiene una puntuación de sesgo y varianza para los modelos predictivos y descompone el error de generalización en sesgo, varianza y puntuación de error.
  • Trazado de límites de decisión y regiones del modelo: MLxtend también permite observar el límite de decisión del modelo en dos dimensiones para descubrir cómo el modelo se diferencia entre puntos de datos en diferentes clases. Aunque esto solo se puede hacer para dos características en el momento de la visualización.
🔥 Recomendado:  20 ideas de generación de leads B2B (probablemente aún no las hayas probado)

Conclusión

A medida que los modelos se vuelven cada vez más complejos, interpretarlos es el aspecto más importante para implementarlos. Se están desarrollando más técnicas y herramientas para ello y las herramientas cubiertas aquí no son las únicas disponibles, pero se encuentran entre las que se utilizan de manera más destacada.

Tabla de Contenido