Estás leyendo la publicación: Presentamos Einblick, la primera plataforma de computación de datos visuales
La toma de decisiones respaldada por datos es un cuello de botella para casi todas las empresas en la actualidad. Por un lado, no hay suficiente ancho de banda de ciencia de datos y los roles técnicos son difíciles de cubrir. Pero, por otro lado, las herramientas y los lenguajes de programación existentes de la mayoría de los equipos de ciencia de datos son demasiado técnicos para los no expertos. El resultado es que lleva demasiado tiempo responder a las preguntas comerciales más comunes, y muchas iniciativas estratégicas se deciden con Excel o instinto en lugar de basarse en datos.
Un sorprendente 97,2 por ciento de las organizaciones invierten mucho en Big Data e IA. Pero la pregunta es, ¿están utilizando efectivamente los datos y la visualización de datos correspondiente?
“Las organizaciones acaban de comenzar a almacenar y organizar correctamente sus datos, pero cuando lo hacen, la mayoría de las veces, no están utilizando esos datos de manera adecuada”, dijo Tim Kraska, cofundador de Einblick y profesor del MIT. Algunas organizaciones no recopilan suficientes datos y otras recopilan los datos pero no hacen nada con ellos. Y hay un subconjunto de equipos un poco más avanzados que obtienen conocimientos de forma activa a partir de los datos, pero que no actúan necesariamente sobre la base de los conocimientos o actúan incorrectamente debido a la falta de experiencia. En última instancia, esto se reduce a dos problemas relacionados que afectan a casi todas las organizaciones.
Primero, las personas dentro de una organización que usan herramientas de análisis de datos no están lo suficientemente cerca de los problemas comerciales que los datos podrían resolver. Incluso si los científicos de datos tienen acceso a datos de diferentes líneas de negocios, la experiencia en la materia es importante para hacer un buen uso de los datos. El resultado deseado de la línea de negocios de las partes interesadas con frecuencia se pierde en la traducción. Otras veces, el análisis de la ciencia de datos se convierte en una serie de ejercicios retrospectivos, ya que el análisis se lleva a cabo sin una comprensión clara de la estrategia empresarial prospectiva.
En segundo lugar, ha habido una gran barrera de entrada para el experto en dominios. Por ejemplo, los científicos de datos no pueden compartir cuadernos tradicionales con sus partes interesadas. Por otro lado, es posible que ninguna herramienta de arrastrar y soltar código pueda generar imágenes, pero no puede superar por completo la falta de familiaridad de los que no son científicos de datos con el modelado estadístico o la transformación de datos. Y estas herramientas sin código también son entornos poco acogedores para los programadores que quieren hacer más y, en lugar de ser un “terreno común”, resultan ser solo otro silo. Una forma de resolver esto es simplemente invertir la ecuación: llevar una nueva habilidad (ciencia de datos) a los departamentos de toda la empresa.
“Lo que falta es una herramienta que facilite una discusión de datos para un experto en el dominio a través de una interfaz visual amigable con capacidad de explicación, además en ese mismo lienzo existe una interfaz de “cueva de código” familiar para un científico de datos, como un cuaderno o IDE. Además, todo esto debe ejecutarse en un motor de cómputo ágil pero poderoso para manejar cualquier cantidad de datos o interacciones del usuario”, dijo Kraska.
Aquí es donde entra en juego la herramienta de visualización de datos y colaboración de datos Einblick. Replantea el diseño de los flujos de trabajo de datos, que tradicionalmente se centraban en la resolución lineal de problemas como colaborador individual. En su lugar, crea una pizarra digital multijugador que admite interacciones de arrastrar y soltar, sin operadores de ciencia de datos de código y Python. “Al centrarse primero en la colaboración y eliminar la necesidad de codificar (aunque puede hacerlo si lo desea), los equipos pueden unirse a Einblick y crear una solución prototipo en menos de una hora”, dijo Kraska.
Fundada en 2019, Einblick Analytics es una empresa derivada del MIT y la Universidad de Brown. Sus cofundadores incluyen a Benedetto Jacopo Buratti, Emanuel Zgraggen, Philipp Eichmann, Kraska y Zeyuan Shang. La compañía tiene como objetivo permitir que todos tengan un impacto a través de datos, no de opiniones.
Team Einblick ha estado desarrollando su tecnología durante más de cinco años en el MIT y la Universidad de Brown, ganando varios premios, incluida la competencia de aprendizaje automático automatizado D3M de DARPA. Ahora, Einblick está comercializando esta investigación.
La tecnología detrás de Einblick
Einblick se ha construido sobre la idea de que la colaboración en vivo es posible y el código es opcional. Para hacer realidad ambas condiciones, el equipo replanteó la estructura del software de análisis desde cero y desarrolló varias innovaciones, desde el motor computacional hasta la UX.
Si bien la mayoría de las plataformas de análisis permiten compartir código o copiar flujos de trabajo, Einblick es la única plataforma que permite la conversación en vivo y el modo multijugador en el lienzo. Esto significa que dos partes interesadas pueden intercambiar ideas sobre hipótesis de pizarra y avanzar rápidamente a través de la creación y el debate de resultados. “Cuando una parte interesada es más técnica, puede ‘mostrar’, no ‘decir’, al otro usuario cómo depurar”, dijo Eichmann.
“Pero, para potenciar esto, la salida debe poder renderizarse casi en tiempo real, a la velocidad del pensamiento. Entonces, creamos un motor de cálculo progresivo aproximadoque ofrece la mejor suposición de la finalización y actualiza las imágenes en lotes, pero todo este tiempo, los usuarios pueden discutir los resultados en el lienzo visual y continuar desarrollando el flujo de trabajo”, explicó Eichmann.
Team Einblick ha implementado varios operadores sin código con el motor en su lugar, incluido AutoML, junto con una amplia gama de otras herramientas de minería de datos asociadas como análisis de impulsores clave. De esta manera, los equipos de analistas (especialmente aquellos que aún no son científicos de datos expertos) pueden desarrollar un análisis completo en lugar de lanzarse de cabeza a una solución de ML.
“Entonces, para unir todas las piezas, un flujo de trabajo de código opcional con capacidad de respuesta en tiempo real permite que dos usuarios menos técnicos salten juntos a un conjunto de datos externo, discutan lo que están viendo, construyan rápidamente un prototipo de modelo ML y luego iteren rápidamente sobre eso. ”, dijo Eichmann.
Einblick contra el mundo
Actualmente, estamos alcanzando un nuevo horizonte en el análisis de datos, y el análisis prescriptivo se está volviendo cada vez más importante para tomar decisiones basadas en datos. Sin embargo, a pesar del progreso en la democratización de la adquisición y el acceso a los datos, la toma de decisiones basadas en datos sigue siendo un desafío importante para los equipos sin conocimientos técnicos profundos.
Las herramientas de análisis descriptivo, como Tableau, Qlik, Thoughtspot, etc., están ayudando a los expertos del dominio a comprender los datos anteriores. Podría decirse que es la base de cualquier negocio. Sin embargo, las herramientas existentes para el análisis de datos más allá de la inteligencia comercial central que se diseñó hace décadas todavía presentan un alto nivel para los expertos del dominio, y eliminar esto requiere un replanteamiento fundamental tanto de la interfaz como del backend.
En Einblick, un spin-off de MIT y Brown basado en el proyecto Northstar, el equipo ha estado construyendo la herramienta de análisis de próxima generación en los últimos años. Para superar las fallas de los motores de procesamiento existentes, introdujeron Davos, un backend novedoso de Einblick. La forma en que funciona es que Davos combina aspectos de muestreo de cálculo progresivo y procesamiento de consultas aproximadas con un enfoque específico en mejorar las operaciones definidas por el usuario. Además, optimiza los escenarios multiusuario para promover la colaboración.
“Con la creciente popularidad de los portátiles de Python, los usuarios a veces quisieran integrar sus operaciones personalizadas en el sistema, es decir, operaciones definidas por el usuario (UDO)”, dijo Kraska.
Más recientemente, las herramientas de ciencia de datos como Alteryx, DataRobot, KNIME, etc., hicieron que el análisis predictivo fuera más accesible. Estas herramientas, a veces llamadas ML de autoservicio o herramientas de ciencia de datos, a menudo son bastante diferentes de las herramientas de inteligencia comercial (BI), ya que tienen como objetivo crear el mejor modelo posible para un escenario determinado.
La forma en que funciona es que, en lugar de interfaces basadas en diálogos, generalmente se desarrollan sobre motores de flujo de trabajo, donde las operaciones/tareas individuales se representan mediante cuadros, que el usuario luego conecta para formar una canalización completa de ML. Esta interfaz facilita la comprensión de cómo “fluyen” los datos desde su origen y formato sin procesar hasta el modelo final para crear una predicción eventualmente.
Esto es importante para ML ya que las diferentes formas de limpiar y codificar datos pueden afectar profundamente la precisión final del modelo. “Sin embargo, la desventaja de los motores de flujo de trabajo es que no brindan comentarios inmediatos. El usuario debe presionar el botón ‘reproducir’ después de curar la canalización, lo que inicia el cálculo del flujo de trabajo de composición. Esto puede llevar horas hasta que se produzca el primer resultado. Si bien algunas herramientas intentan resolver este problema brindando retroalimentación más inmediata para partes de la canalización a través de interfaces especializadas (por ejemplo, ajuste de hiperparámetros), aseguran que el usuario aún vea y comprenda todo el proceso”, explicó Shang.
El equipo cree que Einblick empaqueta todo lo anterior en una oferta SaaS basada en navegador, cerrando las brechas con las que están plagadas las herramientas mencionadas anteriormente.
Colaboración simplificada
“Para democratizar verdaderamente la ciencia de datos, necesitamos cambiar fundamentalmente la forma en que las personas interactúan con los datos”, dijo Kraska. Sin embargo, sorprendentemente, las interfaces que la gente usa para analizar datos no han cambiado desde la década de 1990, y la mayoría de las operaciones/tareas analíticas aún se realizan utilizando lenguajes de secuencias de comandos y/o SQL, comentó Kraska.
Últimamente, ha habido tendencias en la elección del lenguaje de programación (ejemplo: de PERL a Python), algoritmos (desde redes neuronales hasta aprendizaje estadístico y de regreso a redes neuronales) y tecnología de bases de datos (SQL, NoSQL y no solo SQL). “Sin embargo, las personas aún interactúan principalmente con los datos a través de scripts y lenguajes similares a SQL, con tiempos de espera de hasta una hora para obtener resultados”, agregó Kraska.
Dijo que la gente debería dejar de aferrarse al pasado; más bien, deberíamos comenzar a diseñar sistemas sobre cómo se debe hacer la ciencia de datos en diez años. “Hasta la fecha, las pizarras digitales interactivas son simplemente mejores sistemas de conferencias, pero tienen el potencial de ser mucho más. Queremos ponerlos en el centro de cada reunión que involucre números, desde discutir cifras de ventas hasta comprender mejor la base de clientes y construir modelos predictivos”, dijo Kraska.
“Visualizamos un entorno colaborativo, donde los científicos de datos y los expertos en el dominio pueden trabajar juntos para llegar a soluciones primarias durante una sola reunión, soluciones que luego, si es necesario, pueden redefinirse fuera de línea”, agregó.
Esto contrasta con la pésima forma actual en que los científicos de datos y los expertos en dominio interactúan, enfatizó Kraska, reunión tras reunión para encontrar una base común antes de que se logre un progreso real. “En consecuencia, para fomentar la colaboración y los resultados, el sistema debe proporcionar una interfaz visual porque la coprogramación de Python con un CEO simplemente no es una opción”, agregó.
Además, Kraska dijo que quieren permitir que los expertos en dominios construyan modelos de forma independiente sin la ayuda de un científico de datos. Por lo tanto, la UX en la computadora portátil de un experto en el dominio debe ser similar a la de una pizarra interactiva y contar con un científico de datos virtual que supervisa el proceso y evita que ocurran errores importantes.
“Curiosamente, al poner la experiencia del usuario en primer lugar, no solo descubrimos que los sistemas existentes no funcionan en esta configuración, sino que también terminamos diseñando un sistema muy diferente de uno que hubiéramos creado usando un enfoque de sistemas primero”, dijo Kraska. .
¿En qué se diferencia Einblick?
“Si bien los sistemas como Tableau son un paso en la dirección correcta, ya que ofrecen una interfaz visual para la exploración de datos, carecen de soporte para crear resultados más sofisticados, como modelos de aprendizaje automático. En nuestro trabajo para hacer que la ciencia de datos sea más accesible, vimos la experiencia del usuario como un componente crucial”, dijo Zgraggen. Al combinar una interfaz visual colaborativa con la capacidad de ejecutar flujos de trabajo de ciencia de datos de extremo a extremo, Einblick ha creado algo completamente nuevo. Y desde una perspectiva de comparación de precios, Einblick es más asequible con su nueva oferta freemium SaaS que permite a la mayoría de los usuarios principiantes acceder a potentes herramientas de minería de datos y ML de forma gratuita.
Implemente modelos ML en un abrir y cerrar de ojos
Actualmente, Einblik tiene alrededor de 100 clientes repartidos en industrias y en todo el mundo. Por ejemplo, en uno de sus clientes en el segmento automotriz, varios gerentes de operaciones no técnicas diferentes usaron Einblick para construir diferentes modelos de aprendizaje automático. Algunas de las soluciones implementadas incluyen un modelo predictivo que detecta de forma proactiva el 80 % de los posibles problemas de la cadena de suministro. Otros modelos mejoran la retención de la fuerza laboral mediante la identificación de señales de deserción y el uso de incentivos dirigidos al consumidor para impulsar las ventas minoristas en los concesionarios.
Bueno, hay más. ¿Cómo puede Einblick incorporar nuevos clientes?
“No existe una solución única para la incorporación técnica. Nuestra filosofía ha sido guiar a las personas a través de la mecánica básica del software y enseñar conceptos básicos de ciencia de datos. Fuera del software, hemos comenzado una serie de blogs y videos instructivos ‘Data Science 201’ para ayudar a las personas a cruzar el límite para responder preguntas difíciles”, compartió Kraska.
En otras palabras, Einblick ha mejorado su juego en términos de ayuda en la aplicación, con panelistas expertos para guiar a los usuarios durante los primeros minutos. Además, tienen un espacio de trabajo donde, lado a lado, hay un ejemplo, un video de demostración y un espacio para ‘hacerlo usted mismo’.
“Fuera de la incorporación central, es importante asegurarse de que la ciencia de datos sea interesante para la gente”, dijo Kraska. En línea con esto, el equipo de Einblick ha comenzado una serie llamada ‘Traiga sus propios datos.’ Aquí, le piden a alguien que podría ser un experto en el dominio pero que es menos técnico que desarrolle un análisis con ellos. “Usando una amplia gama de ejemplos y mostrando las conversaciones que deberían estar sucediendo, esperamos que las personas aprendan sin siquiera darse cuenta de que se les pide que aprendan”, agregó Kraska.
El futuro es Einblick
El equipo Einblick dijo que continuaría desarrollando su cartera de integraciones, tanto desde la perspectiva de la fuente de datos como de MLOps. Por ejemplo, recientemente, agregaron la capacidad de conectarse a instancias de Databricks desde el lado de ingesta y agregaron la capacidad de incrustar espacios de trabajo de Einblick en iframes para que puedan implementarse en cualquier lugar de Internet en el lado de salida.
“Y siempre, dadas las funciones de extensibilidad de la plataforma, continuaremos publicando nuevas extensiones, como nuestro nuevo operador avanzado de ingeniería de funciones de series temporales, que permite a los usuarios convertir flujos de datos de registro o IoT en variables predictivas para el análisis más fácil que cualquier otra cosa disponible actualmente”. dijo Zgraggen.
Actualmente, Einblick trabaja con clientes en NAM y EU, con prospectos en LATAM. “Dado que el lenguaje de la analítica es universal, esperamos seguir creciendo en todos los dominios”, dijo Zgraggen. Además, dijo que siempre están buscando buenos comentarios y usuarios que puedan beneficiarse de los consejos de uso y ciencia de datos a cambio de ser parte del consejo de usuarios de Einblick.
¿Entonces, Qué esperas? Si Einblick suena interesante, comience gratis en einblick.ai.