Los 10 artículos principales para aprender sobre MLOps

Estás leyendo la publicación: Los 10 artículos principales para aprender sobre MLOps

Los últimos años han sido testigos de notables avances en el aprendizaje automático. Por lo tanto, las operaciones de aprendizaje automático (MLOps) se están volviendo integrales para la implementación de proyectos de ciencia de datos. A través de este método, las empresas pueden generar valor a largo plazo y reducir el riesgo asociado con AI/ML.

MLOps se refiere a un conjunto de enfoques y herramientas para implementar modelos ML en producción. Aquí hay 10 documentos como sus nuevos recursos favoritos sobre MLOps.

¡Vamos a sumergirnos!

  1. Aprendizaje automático: la tarjeta de crédito de alto interés de la deuda técnica

Autor(es): D. Sculley et al.

El aprendizaje automático es un conjunto de herramientas importante para construir sistemas complejos rápidamente. Sin embargo, este documento argumenta que estas ganancias rápidas no son gratuitas. Usando el marco de la deuda técnica, los investigadores notaron que es extremadamente simple sufrir una gran cantidad de costos continuos de mantenimiento a nivel del sistema cuando se aplica ML.

Este documento tiene como objetivo resaltar los factores de riesgo y los patrones específicos del LA que se deben evitar. Estos incluyen la erosión de los límites, el enredo, los bucles de retroalimentación ocultos, los consumidores no declarados y una variedad de antipatrones a nivel del sistema.

Lea el documento completo aquí.

  1. Operaciones de aprendizaje automático (MLOps): descripción general, definición y arquitectura

Autor(es): Dominik Kreuzberger et al.

MLOps se considera un término vago y sus consecuencias para los investigadores son ambiguas. Para abordar esta brecha, los autores llevaron a cabo una investigación de métodos mixtos para proporcionar una descripción general agregada de los principios, componentes y roles necesarios junto con la arquitectura y los flujos de trabajo asociados.

El documento guía a los investigadores y profesionales de ML que desean automatizar y operar productos de ML con un conjunto de tecnologías.

🔥 Recomendado:  Cómo escribir una política de devolución fácil para aumentar la lealtad del cliente

Lea el documento completo aquí.

  1. Operacionalización del aprendizaje automático: un estudio de entrevista

Autor(es): Shreya Shankar et al.

Las organizaciones confían en los ingenieros de aprendizaje automático (MLEs) para implementar y mantener las canalizaciones de ML en producción. En entrevistas etnográficas semiestructuradas con 18 MLE que trabajan en muchas aplicaciones, los investigadores intentan comprender los desafíos no abordados y las implicaciones para los creadores de herramientas.

Los investigadores resumieron las prácticas comunes para la experimentación, la implementación y el mantenimiento del rendimiento de producción de ML con éxito. Además, discuten los puntos débiles y los antipatrones de los entrevistados, con implicaciones para el diseño de herramientas.

Lea el documento completo aquí.

  1. Cómo evitar las trampas del aprendizaje automático: una guía para investigadores académicos

Autor(es): Michael A. Lones

El documento proporciona un resumen conciso de algunos errores comunes que ocurren en el uso de técnicas de ML y las formas en que se pueden evitar. Está destinado principalmente como una guía para los estudiantes de investigación. Se centra en temas de especial interés dentro de la investigación académica, como la necesidad de realizar comparaciones rigurosas y llegar a conclusiones válidas.

Lea el documento completo aquí.

  1. Problemas de calidad en los sistemas de software de aprendizaje automático

Autor(es): Pierre-Olivier Côté, Amin Nikanjam, Rached Bouchoucha, Foutse Khomh

Los modelos de aprendizaje automático se implementan como componentes de software y se implementan en sistemas de software de aprendizaje automático (MLSS). Por lo tanto, la garantía de calidad de estos MLSS es integral porque las malas decisiones pueden provocar el mal funcionamiento de otros sistemas y pérdidas financieras significativas.

Este documento investiga las características de los problemas reales de calidad en los MLSS desde el punto de vista del profesional. Mediante entrevistas con profesionales del ML, el documento identifica una lista de malas prácticas relacionadas con la mala calidad de los MLSS.

🔥 Recomendado:  CFDA abre una exhibición de moda de metaverso en The Sandbox y lanza NFT para celebrar su 60 aniversario

Lea el documento completo aquí.

  1. Entrenando a los transformadores juntos

Autor(es): Alexander Borzunov et al.

La capacitación de modelos de última generación suele ser costosa y solo está al alcance de las grandes corporaciones e instituciones.

En esta demostración, los investigadores entrenaron en colaboración un transformador de texto a imagen similar al ‘DALL-E’ de OpenAI. Demostraron que el modelo resultante genera imágenes de calidad razonable en varias indicaciones.

Lea el documento completo aquí.

  1. Una comparación a gran escala del código de Python en los cuadernos y scripts de Jupyter

Autor(es): Konstantin Grotov, Sergey Titov et al.

En este trabajo, los investigadores comparan el código de Python escrito en Jupyter Notebooks y en scripts de Python tradicionales. El objetivo era allanar el camino para estudiar problemas específicos de los portátiles que deberían abordarse mediante el desarrollo de herramientas específicas para portátiles y proporcionar varios conocimientos que pueden ser útiles en este sentido.

Lea el documento completo aquí.

  1. Comprender el almacenamiento y la ingestión de datos para la capacitación del modelo de recomendación profunda a gran escala

Autor(es): Mark Zhao, Niket Agarwal, Aarti Basant et al.

Este documento presenta la tubería DSI de extremo a extremo de Meta, compuesta por un almacén de datos central basado en almacenamiento distribuido y un servicio de preprocesamiento de datos que elimina las paradas de datos.

Los investigadores caracterizan cómo se entrenan de forma colaborativa varios modelos en los centros de datos a través de la formación continua. Miden los intensos recursos de red, memoria y cómputo requeridos por cada trabajo de entrenamiento para preprocesar muestras durante el entrenamiento. Los puntos clave del documento incluyen lo siguiente:

  • Identificación de cuellos de botella de hardware.
  • Hablar de oportunidades para el hardware DSI.
  • Implementación de lecciones aprendidas en la optimización de la infraestructura DSI.
🔥 Recomendado:  Las 5 mejores aplicaciones de tabla de precios de Shopify para impulsar sus ventas (2023)

Lea el documento completo aquí.

  1. La revolución del aprendizaje profundo y sus implicaciones para la arquitectura informática y el diseño de chips

Autor(es): Jeffrey Dean

Este documento analiza los avances en el aprendizaje automático y sus implicaciones en los tipos de dispositivos computacionales que necesitamos construir, especialmente en la era posterior a la Ley de Moore. También analiza cómo el aprendizaje automático puede ayudar con aspectos del proceso de diseño de circuitos.

Proporciona un resumen de al menos una dirección hacia los modelos multitarea que se activan y emplean un mejor enrutamiento basado en tareas y ejemplos que los modelos de aprendizaje automático actuales.

Lea el documento completo aquí.

  1. Gestión de activos en el aprendizaje automático: una encuesta

Autor(es): Samuel Idowu, Daniel Strüber, Thorsten Berger

El documento presenta una encuesta de 17 herramientas con soporte de gestión de activos de ML identificadas en una búsqueda sistemática. Describen las características de estas herramientas para administrar los diferentes tipos de activos utilizados para diseñar sistemas basados ​​en ML y realizar experimentos.

En conclusión, la mayor parte del soporte de gestión de activos depende de los sistemas de control de versiones tradicionales y solo unas pocas herramientas admiten un nivel de granularidad de activos que diferencia entre activos de ML importantes, como conjuntos de datos y modelos.

Lea el documento completo aquí.