MLOps: una inversión hacia un futuro más seguro

Estás leyendo la publicación: MLOps: una inversión hacia un futuro más seguro

MLOps ha surgido recientemente como el eslabón perdido en el ciclo de vida de ML. Los ingenieros de MLOps se aseguran de que la tubería esté unida y funcione sin problemas. Desde 2018, las funciones de MLOps se han convertido en el centro de atención y, con el tiempo, se han consolidado como un mecanismo vital.

Nos reunimos con Praveen Nair, gerente de Tredence, para saber qué les depara el futuro a los equipos de MLOps, cómo el panorama actual de IA de ritmo acelerado afectará a MLOps y qué se necesita para ser un ingeniero de MLOps.

Praveen: En realidad, esto es algo de lo que no se habla tan a menudo como debería. MLOps realmente puede ayudar con la implementación de marcos éticos cuando los países y los gobiernos propongan nuevas leyes de datos sobre preocupaciones de seguridad.

Digamos que un banco tiene que denegar o aprobar préstamos en función de los antecedentes, las características financieras y el comportamiento de una persona en particular. Cuando se deben capacitar modelos para estos procesos, debe asegurarse de que su sistema no esté sesgado hacia ningún grupo demográfico o de género. Se espera que el modelo sea justo y los bancos deben ofrecer igualdad de oportunidades para todos. Una de las mayores soluciones para esto es tener más explicabilidad en los modelos. MLOps puede ayudar a configurar procesos para que el modelo sea más transparente. Los científicos de datos también pueden evaluar esto con sistemas de monitoreo de sesgo implementados.

Ya ha habido contribuciones de código abierto en este sentido. Varias plataformas en la nube ya han implementado algunas de estas medidas preventivas. Sin embargo, es la parte de adopción la que sigue siendo más lenta. Ahora, con la entrada en escena de las leyes, las empresas se verán obligadas a adoptar medidas más temprano que tarde.

En el contexto de la privacidad de los datos, no querrá que los datos personales de los usuarios se expongan en las bases de datos y estén disponibles para que la gente los vea. Para reiterar, hay una serie de herramientas de código abierto disponibles para detectar si su modelo o canalizaciones relacionadas están utilizando este tipo de información de identificación personal o PII. Por lo tanto, tener procesos sólidos de MLOps puede solucionar estos riesgos.

🔥 Recomendado:  ¿Por qué Netflix canceló 1899 después de solo una temporada?

Tener un equipo de MLOps también ayudará a abordar las preocupaciones sobre la seguridad externa y los ataques de adversarios. Por ejemplo, si una empresa tiene un pequeño equipo de ciencia de datos, puede enfocarse solo en la parte de innovación y los equipos de MLOps pueden proteger la capa de seguridad de datos y cuidar los límites de lo que puede y no puede hacer.

OBJETIVO: El aprendizaje federado tiene una serie de ventajas, pero ¿cuáles son los desafíos en torno a su uso en MLOps?

Praveen: El aprendizaje federado es algo relativamente nuevo en cuanto a la cantidad de aplicaciones que están saliendo. Una gran parte de los procesos actuales de MLOps todavía no está lo suficientemente preparado para encargarse de lo que vendrá en el futuro. Por ejemplo, con GPT-4, Sam Altman ha dicho que el modelo funciona con el aprendizaje autosupervisado, lo que significa que está construyendo un cerebro basado en las aportaciones de los usuarios. Cuando una herramienta como esta llega al panorama, es probable que también surjan nuevos problemas relacionados con la privacidad. No le gustaría que un usuario supiera para qué otros usuarios han usado el modelo. Este es uno de los mayores desafíos ya que hay millones de usuarios en él.

En el aprendizaje federado, los datos de todos están descentralizados y pueden mantener sus datos con ellos. El objetivo es entrenar la inteligencia en conjunto, pero sus datos no se desviarán a un servidor central. Más bien, entrenaremos dentro de su dispositivo y luego recuperaremos esa comprensión y luego la agregaremos a otro lugar. El otro desafío es que también están surgiendo leyes estrictas contra la recopilación de todos los datos de diferentes regiones en un lugar central.

OBJETIVO: ¿Cuáles son las diferencias y similitudes entre MLOps y AutoML?

Praveen: Una de las cosas nuevas en términos de monitoreo es comprender qué comportamientos han cambiado como lo que vimos después de la pandemia de COVID-19. Ciertos segmentos como la actividad de comercio electrónico han sido testigos de un estallido significativo después de la pandemia en comparación con la actividad anterior a la pandemia, principalmente debido a un cambio en el comportamiento del cliente. Los modelos que se entrenaron entonces realmente no funcionaron durante/después de que ocurrió la pandemia. Entonces, este cambio implicará que estos modelos tendrán que ser reentrenados.

🔥 Recomendado:  ¿Qué es Canal de Ventas? Todo lo que necesitas saber en 6 minutos

Hacer esto continuamente es la parte difícil porque los comportamientos de los clientes cambian con demasiada frecuencia. En este escenario, AutoML es un buen proceso para automatizar esta parte del flujo de trabajo.

AutoML puede entrenar modelos mucho más rápido, ya que abstrae los esfuerzos de entrenamiento. Todo lo que tiene que hacer el científico de datos es hacer que el modelo sea transparente y asegurarse de que el modelo esté libre de sesgos. No creo que AutoML y MLOps sean comparables, sino más bien Diría que AutoML es una buena herramienta para garantizar la implementación de la adopción de MLOps en todas las organizaciones.. El desafío consiste en obtener modelos de última generación con AutoML, pero aun así se obtiene un modelo de referencia mucho más rápido.

OBJETIVO: ¿Cómo impulsará aún más la aparición de la IA generativa la implementación de MLOps?

Praveen: Construir un modelo GPT no es fácil porque son extremadamente complejos, utilizan mucha potencia informática y requieren mucho tiempo. Ahora, dado que las personas han comenzado a encontrar valor comercial en él, GPT-4 definitivamente se utilizará en todas las industrias.

Sin embargo, una pequeña información errónea puede tener un gran impacto negativo, especialmente en campos sensibles a la información como la medicina. MLOps puede establecer procesos estándar para la seguridad en este sentido. Incluso cuando se están capacitando LLM tan masivos, necesitamos grandes cantidades de datos de calidad que las disciplinas de ingeniería de datos y MLOps pueden garantizar. No querrá que su modelo de IA generativa sea político o inapropiado. Por lo tanto, aquí hay una serie de preocupaciones válidas porque los modelos generativos generalmente usan grandes cantidades de datos y las respuestas deben validarse continuamente para buscar mejoras o precisión.

La IA generativa definitivamente impulsará la implementación de MLOps e introducirá diferentes tipos de procesos de MLOps en el futuro. ya hay MLOps de lenguaje grandeque se está convirtiendo en una cosa y eso es genial porque las preocupaciones éticas y las barandillas necesarias se pueden abordar más rápidamente.

OBJETIVO: ¿Cuáles son las principales habilidades que resultan esenciales para convertirse en un ingeniero de MLOps?

Praveen: El concepto erróneo más grande sobre MLOps es que es simplemente la implementación de modelos ML. Si bien esto es parcialmente cierto, la amplitud de lo que hace un ingeniero de MLOps incluye más que la implementación de modelos. Lo primero que se necesita es habilidades blandas ya que los ingenieros de MLOps tienen que hablar con los científicos de datos que siempre defenderán sus modelos o los equipos comerciales que quieren un mejor ROI. Los gerentes de MLOps a menudo están atrapados en el medio tratando de hacer felices a ambas partes. Entonces, también es importante tener un sentido de colaboración.

🔥 Recomendado:  5 ejemplos de marcas en Twitch que se están disparando La comunidad de jugadores

La segunda habilidad es competencia en ML y aprendizaje profundo. La idea habitual es que necesitamos saber DevOps, lo cual no es cierto. También necesitamos optimizar estos modelos de diferentes maneras, como tratar de entender qué está haciendo el algoritmo y si ha sido entrenado de la manera correcta. Esto requiere una comprensión más profunda de estos algoritmos.

En tercer lugar, tenemos que comprender los datos y almacenar el tipo correcto de datos. Debe poder interpretar los datos que tiene y hacerlos útiles al generar más métricas sobre calidad y precisión.

En tándem, debe tener una comprensión arquitectónica lo que significa que debe comprender que cada cliente requiere algo diferente. No es como una solución única para todos. Según el entorno del cliente, debe determinar cuál es el enfoque más rentable y óptimo. Para esto, debe tener una comprensión arquitectónica de lo que MLOps está tratando de lograr. Entonces, como ingeniero de MLOps, debe tener diferentes variaciones de la misma arquitectura listas en su bolsillo y eso, en última instancia, marca la mayor diferencia. La última habilidad sería la más obvia, tener gran habilidades en programación.

Tabla de Contenido