Estás leyendo la publicación: ¿Qué hay de nuevo en PyCaret 2.3.6?
PyCaret es una de las bibliotecas más útiles y populares del lenguaje de programación python utilizado para el aprendizaje automático. La razón detrás de esta popularidad es que consiste en herramientas simples y eficientes para clasificación, regresión, agrupamiento, reducción de dimensionalidad, selección de modelos, etc. El 12 de enero de 2022, se lanzó la nueva versión de PyCaret, PyCaret 2.3.6, con nuevos características emocionantes. En este artículo, hemos cubierto todas las actualizaciones útiles e importantes y las correcciones de errores incluidas en la nueva versión de PyCaret. Los puntos principales que se discutirán en este artículo se enumeran a continuación.
Tabla de contenido
- ¿Qué es PyCaret?
- Características añadidas
- Corrección de errores
¿Qué es PyCaret?
PyCaret es una biblioteca de aprendizaje automático de código abierto de Python con el objetivo de usar código bajo y un número bajo de hipótesis para obtener información dentro de un ciclo de experimentación y desarrollo de aprendizaje automático. Con esta biblioteca, podemos realizar experimentos de aprendizaje automático de extremo a extremo de manera eficiente sin consumir tanto tiempo. Como comentamos, una de las ventajas más importantes de usar esta biblioteca es que necesitamos muy poco código para realizar cualquier experimento de aprendizaje automático. Esta ventaja de PyCaret nos permite realizar experimentos de aprendizaje automático altamente complejos de una manera muy flexible.
Una ventaja más de PyCaret es que es muy simple de usar, realizando operaciones utilizando esta biblioteca almacenada automáticamente en PyCaret Pipeline que está completamente orquestado para y hacia el desarrollo de modelos. Esta biblioteca proporciona instalaciones mediante las cuales podemos pasar del análisis de datos al desarrollo e implementación de modelos en muy poco tiempo. PyCaret también ayuda a automatizar muchas tareas, como agregar valores faltantes o transformar datos categóricos, diseñar las características actuales u optimizar los hiperparámetros en los datos actuales.
Mientras hablamos de la integración, podemos integrar esta biblioteca con muchos entornos compatibles con Python, como Microsoft Power BI, Tableau, Alteryx y KNIME. En la siguiente lista hay algunos ejemplos de tareas que se pueden realizar usando esta biblioteca:
- Preparación de datos
- Entrenando a un modelo
- Ajuste de hiperparámetros dentro del modelo
- Creación de análisis y derivación de la interpretabilidad
- Selección de modelo
- Registro de experimentos
Podemos instalar esta biblioteca usando la siguiente línea de código:
!pip instalar pycaret[full]
En este artículo, vamos a discutir las nuevas actualizaciones (nuevas funciones o correcciones de errores) que vienen con la nueva versión 2.3.6 de PyCaret. Entonces, cualquier versión preinstalada de PyCaret se puede actualizar usando la siguiente línea de comando.
pip instalar –actualizar PyCaret
Para conocer la versión de PyCaret podemos utilizar las siguientes líneas de códigos.
de PyCaret.utils versión de importación version()
Ahora, con la nueva versión de PyCaret, estamos listos para usar las siguientes actualizaciones nuevas (nuevas funciones, correcciones de errores) de PyCaret.
(Fuente)
En la siguiente sección del artículo, discutiremos las nuevas características y funciones que se han agregado en la nueva actualización.
Características añadidas
En la nueva versión de PyCaret se han añadido las siguientes novedades:
- create_app para crear una versión básica de la aplicación Gradio: En uno de nuestros artículos anteriores, hemos visto cómo podemos crear una aplicación GUI basada en web para el aprendizaje automático donde hemos utilizado la biblioteca sklearn para crear un modelo de aprendizaje automático. Usando esta característica de PyCaret, ahora podemos crear aplicaciones basadas en web para modelos de regresión y clasificación desarrollados usando la biblioteca PyCaret. Los códigos dados a continuación se pueden utilizar para la implementación de esta nueva característica.
from pycaret.datasets import get_data data = get_data(‘diamond’) from pycaret.regression import * s = setup(data, target=”Price”, silent=True) dt = create_model(‘dt’) create_app(dt)
Producción:
- create_docker para generar el archivo requirements.txt y Dockerfile: En el desarrollo y la implementación de cualquier proyecto relacionado con los modelos de aprendizaje automático, el requisito.txt si usa GitHub y los archivos docker si usa docker son la columna vertebral del proyecto. Estos archivos se pueden generar fácilmente con esta nueva característica de PyCaret. Los códigos proporcionados a continuación se pueden usar para implementar esta nueva función para el modelo creado anteriormente.
# crear API create_api(dt, ‘mi_api’) # crear Docker create_docker(‘mi_api’)
Producción:
- create_api para hacer la API para modelos de regresión y clasificación: Con esta nueva función, las bibliotecas de PyCaret nos permiten generar una API rápida para modelos de clasificación y regresión creados con la biblioteca de PyCaret. Un ejemplo de la implementación se puede encontrar aquí. Los códigos dados a continuación se pueden usar para la implementación de esta nueva función para el modelo creado anteriormente.
create_api(dt, ‘mi_api’) !python mi_api.py
Producción:
- comprobar_equidad: La equidad se refiere a los diversos intentos de corregir el sesgo algorítmico. Con esta nueva función de PyCaret, podemos verificar la equidad de las variables en los modelos de regresión y clasificación creados con PyCaret. Los códigos dados a continuación se pueden utilizar para la implementación de esta nueva función.
from pycaret.datasets import get_data data = get_data(‘ingresos’) from pycaret.classification import * s = setup(data, target=”ingresos >50K”, session_id = 123) lightgbm = create_model(‘lightgbm’) check_fairness(lightgbm, [‘sex’, ‘race’])
Producción:
- Panel: La mayoría de las veces encontramos que los modelos de aprendizaje automático son técnicas de caja negra y para el desarrollo, se requiere cada pequeño detalle sobre el modelo y la extracción de estos detalles es una de las partes complejas del aprendizaje automático. Esta actualización en PyCaret nos permite obtener detalles sobre los modelos, como la importancia de las características. Los códigos dados a continuación se pueden utilizar para la implementación de esta nueva función.
tablero (lightgbm, display_format=”en línea”)
producción:
- intervalo_cuadrícula: Esta es una característica nueva que puede ayudar en la optimización del umbral para controlar el recuento de iteraciones de un modelo. Esta característica se agrega en la función Optimize_thershold. Los códigos dados a continuación se pueden utilizar para la implementación de esta nueva función.
optimizar_umbral(lightgbm)
Producción:
En esta sección, hemos introducido algunas de las características agregadas a la biblioteca PyCaret que definitivamente hacen que la biblioteca sea más fácil de usar. Hubo algunos errores pequeños en la biblioteca que también se corrigieron con la nueva actualización. En la siguiente sección, analizamos algunos de los errores importantes que se corrigieron ahora.
Corrección de errores
A continuación se muestran algunas de las correcciones de errores importantes en la nueva versión:
- Nivel de registro personalizado: En esta solución, agregaron la variable CUSTOM_LOGGING_LEVEL en el módulo PyCaret.internal.logging. Ahora, al usar esta solución, podemos configurar una variable de entorno del sistema para manejar los niveles de registro.
- Ruta opcional en el diccionario de autenticación: Esta solución ahora nos permite cargar modelos en AWS con una ruta específica. Si no se considera algún camino en el desarrollo, los códigos que se utilizan para el modelado se comportarán de la misma manera que se estaban comportando antes.
- t-SNEplot en PCA: Antes de esta solución, cuando tratábamos de hacer el gráfico t-SNE en agrupamiento usando la configuración de PCA, había algunos errores clave. Eso ya está arreglado, podemos hacer un gráfico en SNE en agrupamiento cuando PCA = Verdadero en la configuración.
- Se corrigieron los problemas relacionados con la representación de la trama que no es de ladrillo amarillo en formato de pantalla (streamlit).
- Con todos los problemas, hubo algunas quejas sobre la documentación de los tutoriales relacionados con PyCaret que ahora están arreglados, y ahora podemos encontrar todos los tutoriales con excelentes explicaciones.
En esta sección, hemos discutido cuáles eran los problemas importantes antes y con las nuevas actualizaciones, los colaboradores de la biblioteca los han intentado y resuelto.
Ultimas palabras
En este artículo hemos visto qué es PyCaret. Como han anunciado aquí PyCaret 2.3.6 como su nueva versión, han comprometido muchas funciones adicionales y también han solucionado algunos de los problemas importantes. Con estas funciones y actualizaciones, la biblioteca se ha vuelto más útil que antes.
Referencias: