El ciclo de vida del aprendizaje automático: hacia la IA

Estás leyendo la publicación: El ciclo de vida del aprendizaje automático: hacia la IA

Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.

MLOps Notes 1: El ciclo de vida del aprendizaje automático

¡Buen día a todos! ¡Y feliz Año Nuevo!

Akhil Theerthala aquí. Debido a mis obligaciones personales, no he podido escribir artículos en serio hasta ahora. ¡Pero finalmente, a partir de hoy, comenzaré a contribuir una vez por semana a mi página mediana!

No he tomado ningún curso en línea en los últimos dos meses porque he estado abrumado con el trabajo, como prepararme para las prácticas y completar informes de proyectos, etc., pero ahora que comencé a tomar Machine Learning For Engineering (MLOps ) Especialización en Coursera y estaré compartiendo mis notas en mi medio. Entonces, por el momento, ¡revisa cada dos días para ponerte al día con mis notas!

De que trata este curso?

Hasta ahora, hemos visto la parte de entrenamiento de los modelos de aprendizaje automático. Ahora es el momento de que veamos cómo los ponemos en producción y los desafíos y requisitos que enfrentamos en el proceso. es decir, este curso trata de lo que sucede fuera del cuaderno Jupyter.

Ejemplo: Veamos el caso de la detección de arañazos de teléfonos móviles. Usamos un dispositivo para identificar si el teléfono tiene rayones o no.

¡Algunos términos!
Edge Device: dispositivo que vive dentro de las fábricas
Software: el programa que controla la forma en que funciona el dispositivo de borde.

En nuestro caso tenemos un software de inspección que controla la cámara que hace las fotos y las pasa al software de control.

  • El software de control llama a una API, que pasa la imagen al servidor de predicción.
  • El servidor de predicción tiene el modelo, cuyo trabajo es predecir si hay un rasguño o no.
  • Este resultado se envía de vuelta al software de control, que se comporta de formas específicas para clasificar el teléfono.
🔥 Recomendado:  Yieldstreet vs. Fundrise: ¿cuál es el adecuado para usted?

Esto generalmente se denomina implementación en la nube. Existe otro tipo de implementación llamada implementación perimetral, en la que la fábrica sigue funcionando independientemente de la conexión a Internet. El POC (prueba de concepto) es el último modelo que construimos. Pero hay muchas cosas que hacen que la gente crea que este POC es solo el 5-10 % de una implementación de producción.

Bueno, la imagen de arriba muestra los componentes completos de una implementación de producción de ml. En este curso, el objetivo es analizar todos los demás procesos. Una de las formas más fáciles de analizar estos otros componentes es definir un ciclo de vida para el proyecto de aprendizaje automático y explorar cada paso cuando sea necesario.

Ciclo de vida del sistema ML:

El ciclo de vida genérico consta de 4 partes principales, en las que en cada parte pasamos por diferentes procesos o tareas y pasamos a la siguiente parte cuando estamos satisfechos. las partes son

  • Alcance del proyecto — Aquí definimos el proyecto y los requisitos y supuestos del proyecto en el que trabajamos.
  • Datos – Con base en el alcance, definimos los datos requeridos, los etiquetamos y organizamos los datos.
  • Modelado — Usando los datos procesados ​​finales, seleccionamos y entrenamos un modelo seguido de un análisis de errores. Esta es la parte con la que estamos más familiarizados y sucede en el cuaderno Jupyter.
  • Despliegue — Finalmente, después de probar el modelo, se envía al primer despliegue a producción. Después de la implementación, monitoreamos y mantenemos todo el sistema de producción en función de los comentarios de los usuarios.

Los pasos 3 y 4 son procesos iterativos en los que, según la necesidad, es posible que tengamos que redefinir el paso en particular o volver a entrenar el modelo o algunos de los pasos anteriores, como cambiar las suposiciones tomadas u obtener más datos.

Veamos un ejemplo usando los pasos en este ciclo: Considere un Reconocimiento de vozsistema donde, en función del clip de audio de entrada, generaremos la transcripción, junto con una función de búsqueda. En cada paso, nos haremos algunas preguntas, lo que aclara un poco lo que debemos hacer.

🔥 Recomendado:  Revisión y precios de AccueMe

Paso 1: Alcance

  • Definición del proyecto:El reconocimiento de voz puede tener muchas aplicaciones. Una de esas aplicaciones es el reconocimiento de voz para la búsqueda por voz.
  • ¿Cuáles serían nuestras métricas clave en este caso? (Completamente dependiente del problema)
  • Algunas de las métricas clave incluyen precisión, latencia, rendimiento, etc.
  • ¿Cuál es el consumo de recursos objetivo? (En este paso, podemos ver cómo se están desempeñando los diferentes sistemas en el mercado y definir un objetivo)

Entonces, principalmente, lo que hacemos en este paso es definir teóricamente lo que tenemos que hacer y cómo lo hacemos, además de hacer las suposiciones necesarias. Esta parte se discutirá en detalle más adelante en el curso.

Paso 2: Datos

  • ¿Los datos están etiquetados consistentemente?
  • ¿Cuánto silencio debemos esperar en el clip?
  • ¿Cómo normaliza el volumen de todos los diferentes altavoces para que el conjunto de datos pueda tener todas las voces en el mismo volumen?

Este paso contiene principalmente extracción de datos, procesamiento e ingeniería de características, lo que facilita el modelado con estos datos.

Paso 3: Modelado

  • Seleccione el modelo de entrenamiento, es decir, seleccionando el código, Hiperparámetros y Datos, nos da el modelo.
  • En general, los datos son fijos y se juega con el código. Mientras en se encuentra que mantener el código fijo y jugar con los datos y los hiperparámetros es normal y eficiente.
  • Se recomienda que en lugar de adoptar una visión centrada en el modelo,
  • El análisis de errores para el modelo generalmente nos ayuda a centrarnos más en la selección de datos y verificar que el modelo funciona.

Paso 4: Implementación

  • Podemos implementarlo en el siguiente modelo, donde el dispositivo de bordees el .
  • El softwareutiliza el micrófono y el módulo VAD (detección de actividad de voz) del dispositivo de borde (teléfono móvil) y envía los datos de voz al servidor de producción.
  • El servidor de producción procesa la solicitud y envía los resultados de acuerdo con la solicitud. Generalmente, este servidor de producción es donde se almacena nuestra canalización modelo.
  • Más tarde, tenemos que seguir monitoreando el sistema para ver si hay desviaciones de concepto u otros problemas para que la herramienta de producción entregue el valor que imaginamos.
🔥 Recomendado:  Exploración de patrones de diseño en sistemas de aprendizaje automático para mejorar el rendimiento y la usabilidad

Todo el paso es prácticamente diferente y depende en gran medida de la aplicación. Pero la esencia general de lo que hacemos es intentar implementar el modelo con un patrón de implementación específico y luego monitorearlo. Si el modelo funciona de acuerdo con nuestro plan, continuamos con la implementación a gran escala, con un monitoreo constante de los diferentes tipos de errores que pueden surgir.

En el primer curso, miraremos hacia atrás, comenzando desde la implementación y luego retrocediendo cada paso, es decir, el próximo artículo de la serie será sobre la parte de la implementación. También analizaremos MLOps, que es una disciplina emergente y comprende un conjunto de herramientas y principios que respaldan las mejores prácticas.

¡Gracias por pasar! Me aseguraré de que el próximo artículo salga el 3 de enero de 2023, como estaba previsto. Así que, ¡estén atentos! Mientras tanto, puede leer mis artículos sobre mi proyecto de análisis de datos o sobre cómo se compara la popular especialización en aprendizaje profundo con el nanogrado en aprendizaje profundo de Udacity.


Notas de MLOps -1: El ciclo de vida del aprendizaje automático se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.

Publicado a través de Hacia la IA

Tabla de Contenido