Cómo construir mejores productos de datos

Estás leyendo la publicación: Cómo construir mejores productos de datos

Neeraj Gehani, director de productos de dunnhumby, defendió tener una mentalidad de producto en la cuarta edición de la Cumbre de desarrolladores de aprendizaje automático (MLDS) durante su sesión titulada “Emergence of Data Products”. Expuso las razones por las que los productos de datos se vuelven cada vez más importantes, los tipos de productos de datos, el marco para crear productos de datos y los desafíos únicos en la creación de productos de datos.

Productos de datos

“La entrega de valor tiene que ver con la personalización. Desde una perspectiva de ventaja competitiva, se trata de la retención de clientes, la rentabilidad o el uso de los datos para crear una ventaja competitiva en el negocio. Y desde una perspectiva de diferenciación estratégica, las empresas tienen activos de datos únicos, algoritmos o modelos comerciales únicos, y todas estas cosas se unen para crear el sabor de los productos de datos”, dijo Gehani.

Hay tres tipos de datos: datos sin procesar, datos agregados y datos de modelos ML. Cualquier tipo de datos en forma de datos transaccionales, por ejemplo, los datos que se almacenan en Google Cloud, Amazon s3, Microsoft Azure, etc., destinados para uso interno son datos sin procesar. Los datos son construidos o mantenidos por ingenieros de datos. El siguiente nivel de evolución se trata de datos agregados para crear paneles para obtener información. Dichos conjuntos de datos son internos. Los tableros ofrecen información o informes para la toma de decisiones: los conjuntos de datos generalmente los crean y mantienen los analistas comerciales con el apoyo de los desarrolladores. Las plataformas automatizadas, como Optimizely, producen datos de forma automatizada para realizar pruebas, modelar la telemetría, etc. Dichas plataformas son creadas y mantenidas por científicos de datos e ingenieros de aprendizaje automático.

🔥 Recomendado:  Las 12 mejores alternativas de Google AdSense para 2023

Basado en datos

Últimamente, los proveedores están presentando muchas herramientas, desde el lado de la infraestructura hasta el lado del aprendizaje automático, el lado del analista, las aplicaciones empresariales, los conjuntos de datos de seguridad, etc.

“La comunidad de desarrolladores está muy interesada en aprender las habilidades relevantes para capitalizar la demanda en el mercado. Hay muchas personas que realizan cursos de análisis de datos, SQL, Python y ML. De hecho, de mayo de 2019 a mayo de 2020, ha habido un aumento del 300 % en el total de inscripciones para cursos de aprendizaje automático. Pero, según una encuesta, menos del 40 % de las organizaciones gestionan los datos como un activo comercial y crean una organización basada en datos”, informó Gehani.

La desconexión es palpable. Los proveedores están implementando productos de datos y capacitando a la comunidad. Pero cuando se trata de crear una organización basada en datos, forjar una cultura basada en datos o administrar los datos como un activo comercial, los números no son positivos. Algo está realmente mal en términos de por qué las empresas no obtienen el tipo de valor que esperarían de los conjuntos de datos.

Mejor retorno de la inversión

Es esencial construir una relación con los equipos comerciales, en lugar de trabajar en silos. Desde una perspectiva de solución, los científicos de datos, los desarrolladores y los ingenieros de aprendizaje automático deben comenzar a operar con una mentalidad de producto.

Una vez que los desarrolladores han creado un modelo y un tablero, es esencial seguir iterando el producto para mantener su relevancia. Esto viene con una mentalidad de producto en términos de pensar a través de la cadena de valor de principio a fin. “Creo que esto es algo que le falta a nuestra comunidad. Se parte de definir los problemas de negocio a un nivel muy alto en términos de cuáles son los objetivos, cuáles son los casos de uso. ¿Cuál es el criterio de éxito de la evaluación comparativa? dijo Gehani.

🔥 Recomendado:  ¿Instagram no envía código SMS? Aquí está cómo arreglar

Incluso si los científicos de datos han definido el problema comercial, es esencial comprender los datos en términos de si están disponibles los datos correctos, identificar las brechas en la calidad, limpiar los datos, buscar cosas como la imputación de valores faltantes, etiquetar todos esos cosas junto con la ingeniería de características. Luego, cuando el desarrollo de modelos es importante para los tipos de productos predictivos, se trata de seleccionar las técnicas de modelado para construir modelos y luego evaluarlos.

“El punto que estoy tratando de hacer es que, como comunidad, creo que estamos muy, muy aislados. Entonces, tenemos personas que se enfocan en comprender los datos y asegurarse de que los datos estén configurados para el éxito. Se centran en el desarrollo de modelos, pero las personas que piensan en la cadena de valor de extremo a extremo son limitadas”. dijo Gehani. “Así que simplemente construir un modelo científico por sí solo no ayudará. Tienes que pensar en esto de principio a fin y pensar en todas las áreas donde ocurrirán las integraciones”.

Tabla de Contenido

🔥 Recomendado:  Cómo iniciar un negocio de cupcakes de $ 500K / año (2023)