Estás leyendo la publicación: Microsoft y AWS colaboran para desarrollar ‘PyWhy’: un nuevo hogar en Github para ‘DoWhy’ (una biblioteca de aprendizaje automático causal de Microsoft)
A medida que los sistemas informáticos se involucran más activamente en áreas esenciales para la sociedad, como la atención médica, la educación y el gobierno, es fundamental pronosticar con precisión y comprender las repercusiones causales de estas intervenciones. Los algoritmos tradicionales de aprendizaje automático basados en reconocimiento de patrones y análisis correlacionales son insuficientes para la toma de decisiones sin una prueba A/B.
Para llenar este vacío, los investigadores de Microsoft crearon una plataforma que ejecuta el proceso de análisis de inferencia causal de principio a fin para ayudar a los científicos de datos a comprender y aplicar mejor la inferencia causal. Desarrollaron DoWhy en 2018. Desde entonces, la biblioteca ha estado haciendo precisamente eso, cultivando una comunidad comprometida con el uso de principios de inferencia causal en la ciencia de datos. “DoWhy” es un paquete de Python que intenta fomentar el análisis y el pensamiento causal, muchas de las formas en que las bibliotecas de aprendizaje automático lo han hecho para la predicción. DoWhy proporciona una interfaz de cuatro pasos para la inferencia causal que se enfoca en modelar claramente y confirmar suposiciones causales como factibles.
Los enfoques tradicionales de aprendizaje automático tienen como objetivo anticipar un resultado. Considere una empresa de servicios públicos que desea minimizar el uso de agua de sus clientes mediante una campaña de mercadeo e incentivos. El éxito de un programa de recompensas es difícil de evaluar ya que cualquier caída en el consumo de agua por parte de los consumidores participantes queda enmascarada por su decisión de participar en el programa.
Supongamos que vemos que un miembro del programa de recompensas usa menos agua que otros. ¿Cómo sabemos si el programa motiva su menor consumo de agua o si los consumidores que ya esperaban reducir su consumo de agua eligen unirse? Dada la información sobre los determinantes del comportamiento del consumidor, los enfoques causales pueden separar variables confusas y determinar el impacto de este programa de incentivos.
Solo vemos uno de los dos resultados posibles para cada consumidor y no podemos examinar directamente el impacto del programa. No se pueden aplicar los procedimientos creados para validar los modelos tradicionales de aprendizaje automático, que comparan las predicciones con las verdades del terreno observables. En cambio, se requieren nuevas técnicas para adquirir confianza en la fiabilidad de la inferencia causal. Lo que es más importante, debemos recopilar conocimiento del dominio, razonar sobre nuestras opciones de modelado, validar nuestras suposiciones clave cuando sea posible y examinar la sensibilidad de nuestros resultados a las violaciones de suposiciones cuando la validación no es posible.
Una empresa de servicios públicos introduce un programa de recompensas y ahora, ¿los resultados obtenidos son una consecuencia directa del programa de recompensas?
Los nuevos supuestos de modelado de las técnicas causales proporcionan la barrera más importante para los científicos de datos que recién comienzan a investigar la inferencia causal. DoWhy puede ayudarlos a comprender e implementar el enfoque. La biblioteca se centra en las cuatro fases de un análisis de inferencia causal de extremo a extremo, que se detallan en trabajos anteriores, DoWhy: an End-to-End Library for Causal Inference, y una publicación de blog vinculada:
Modelado: El razonamiento causal comienza con el desarrollo de un modelo coherente de los supuestos causales. Debemos ser específicos sobre lo que ya sabemos para lograr una respuesta legítima a nuestra investigación de causa y efecto.
Identificación: A continuación, utilizamos el modelo para determinar si se puede responder la pregunta causal y enviamos la expresión para que se calcule.
Estimación: Una vez que hayamos identificado el impacto causal, podemos seleccionar varios enfoques de estimación estadísticos y basados en aprendizaje automático para responder a nuestra consulta causal.
Refutación: Una vez que tengamos nuestra respuesta, debemos hacer todo lo posible para poner a prueba nuestras suposiciones subyacentes.
La biblioteca DoWhy se distingue de los kits de herramientas de inferencia causal anteriores al centrarse en las cuatro fases del proceso de inferencia causal de extremo a extremo. DoWhy complementa las bibliotecas existentes que se enfocan en procesos particulares al proporcionar a los usuarios los beneficios de otras bibliotecas en una API uniforme y sin problemas.
Hacer de la causalidad una piedra angular de la práctica de la ciencia de datos necesitaría un esfuerzo de colaboración aún más significativo para construir una base consistente para nuestra industria. DoWhy está haciendo la transición a un modelo de gobierno de código abierto separado en un nuevo grupo de GitHub de PyWhy para brindar acceso a este recurso de conocimiento vital. Amazon Web Services (AWS) colabora para proporcionar nuevas tecnologías basadas en modelos causales estructurales.
Determinación de las contribuciones de diferentes mecanismos causales al resultado de la secuencia causal
PyWhy tiene como objetivo crear un entorno de código abierto para el aprendizaje automático causal que avance en el estado del arte y lo haga accesible para profesionales e investigadores.
Se puede instalar desde GitHub usando:
pip instalar dowhy
DoWhy requiere los siguientes paquetes instalados:
- entumecido
- espía
- scikit-aprender
- pandas
- networkx (para analizar gráficos causales)
- matplotlib (para trazado general)
- sympy (para representar expresiones simbólicas)
Este artículo está escrito como un resumen por el personal de Marktechpost basado en los artículos de investigación de microsoft y Amazonas. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la documentos / github
Por favor, no olvides unirte a nuestro Subreddit de aprendizaje automático
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools