Estás leyendo la publicación: Etienne Bernard, cofundador y director ejecutivo de NuMind – Serie de entrevistas
Etienne Bernard, es cofundador y director ejecutivo de NuMind una empresa de software fundada en junio de 2022 especializada en el desarrollo de herramientas de aprendizaje automático. Etienne es un experto en inteligencia artificial y aprendizaje automático. Después de un doctorado (ENS) y un posdoctorado (MIT) en física estadística, Etienne se unió a Wolfram Research, donde se convirtió en el jefe de aprendizaje automático durante 7 años. Durante este tiempo, Etienne lideró el desarrollo de herramientas de aprendizaje automático, un marco de aprendizaje profundo fácil de usar y varias aplicaciones de aprendizaje automático.
¿Qué le atrajo inicialmente del aprendizaje automático?
La primera vez que escuché el término “aprendizaje automático” fue en 2009, creo, gracias al premio de Netflix. Encontré la idea de que las máquinas pueden aprender fascinante y poderosa. Ya tenía claro que esto conduciría a muchas aplicaciones importantes, incluida la emocionante posibilidad de crear IA. Inmediatamente decidí sumergirme en él y nunca volví.
Después de obtener un doctorado (ENS) y un posdoctorado (MIT) en física estadística, se unió a Wolfram Research, donde se convirtió en el jefe de aprendizaje automático durante 7 años. ¿Cuáles fueron algunos de los proyectos más interesantes en los que trabajaste?
Mi tipo de proyecto favorito en Wolfram fue el desarrollo de funciones automáticas de aprendizaje automático para Wolfram Language (también conocido como Mathematica). El primero fue Classify, donde solo le das los datos y devuelve un clasificador. Para mí, el aprendizaje automático siempre se ha tratado de ser automático. No ajustas los hiperparámetros de tu estudiante humano, ¡y tampoco deberías hacerlo para tu máquina! Fue bastante desafiante desde una perspectiva científica y de ingeniería de software crear funciones de aprendizaje automático automático verdaderamente sólidas y eficientes.
La creación de un marco de red neuronal de alto nivel también fue un proyecto muy interesante. Muchas decisiones de diseño difíciles sobre cómo representar simbólicamente las redes neuronales, cómo visualizarlas y cómo manipularlas (es decir, poder cortar algunas piezas, pegar otras, reemplazar capas, etc.) Creo que hicimos un trabajo decente al por cierto, y si fuera de código abierto, estoy bastante seguro de que sería muy utilizado 😉
Durante este período de tiempo también escribió un libro seminal titulado “Introducción al aprendizaje automático”, ¿Cuáles fueron algunos de los desafíos detrás de escribir un libro tan completo?
¡Ay, eran muchos! Me llevó dos años en total escribirlo. Podría haber decidido simplemente escribir un libro de “instrucciones”, lo que hubiera sido más fácil, pero parte de mi viaje en Wolfram ha consistido en aprender sobre aprendizaje automático y sentí la necesidad de transmitirlo. Entonces, la principal dificultad fue averiguar de qué hablar exactamente y en qué orden, para hacerlo interesante y fácil de entender. Luego estaban los detalles pedagógicos: ¿debería usar una fórmula matemática para este concepto? ¿O algún código? ¿O simplemente una visualización? Quería hacer este libro lo más accesible posible y esto me dio muchos dolores de cabeza. En general estoy contento con el resultado. ¡Espero que sea útil para muchos!
¿Podría compartir la historia de génesis detrás de NuMind?
Bueno. Quería crear una startup por un tiempo, originalmente en 2012 para crear una herramienta de aprendizaje automático automático, pero el trabajo en Wolfram era demasiado divertido. Luego, alrededor de 2019-2020, comenzaron a aparecer los primeros modelos de lenguaje grande (LLM), como GPT-2 y luego GPT-3. Fue un shock para mí lo bien que podían entender y generar texto. Al mismo tiempo, pude ver lo doloroso que era crear modelos de PNL: necesitabas tratar con un equipo de anotaciones, tener expertos realizando muchos experimentos, etc. Pensé que debería haber una manera de usar estos LLM a través de un herramienta para mejorar drásticamente la experiencia de crear modelos NLP. Mi cofundador, Samuel (que resulta ser mi primo), compartía la misma visión, por lo que decidimos crear esta herramienta.
El objetivo de NuMind es difundir el uso del aprendizaje automático, y la inteligencia artificial en general, mediante la creación de herramientas simples pero poderosas. ¿Cuáles son algunas de las herramientas que están disponibles actualmente?
En efecto. Nuestra primera herramienta es para crear modelos personalizados de PNL. Por ejemplo, supongamos que desea analizar el sentimiento de sus usuarios a partir de sus comentarios. El uso de un modelo listo para usar generalmente no es bueno, porque ha sido entrenado en un tipo diferente de datos y para una tarea ligeramente diferente (¡las tareas de análisis de sentimiento son sorprendentemente diferentes entre sí!). En su lugar, desea entrenar un modelo personalizado que funcione bien en sus datos. Nuestra herramienta permite hacer precisamente eso, de una manera extremadamente simple y eficiente. Básicamente, carga sus datos, realiza una pequeña cantidad de anotaciones y obtiene un modelo que puede implementar a través de una API. Esto es posible gracias al uso de LLM, pero también a este nuevo paradigma de aprendizaje que llamamos Interactive AI Development.
¿Cuáles son algunos de los modelos personalizados que está viendo desarrollados a partir de la primera ronda de clientes de NuMind?
Ha habido algunos analizadores de sentimientos. Por ejemplo, un cliente está monitoreando el sentimiento de los chats grupales donde las personas se ayudan mutuamente a combatir sus adicciones. Este análisis es necesario para intervenir en el raro caso de que el sentimiento esté decayendo. Otro cliente nos usa para encontrar qué ofertas de trabajo son mejores para un currículum determinado y, por cierto, creo que hay mucho potencial en este tipo de IA de emparejamiento. También tenemos clientes que están extrayendo información de documentos médicos y legales.
¿Cuánto tiempo pueden ahorrar las empresas al usar las herramientas de NuMind?
Por supuesto, depende de la aplicación, pero en comparación con las soluciones tradicionales (etiquetado de datos y entrenamiento de un modelo por separado), vemos una mejora de hasta 10 veces en la velocidad para obtener un modelo y ponerlo en producción. Espero que este número mejore a medida que continuamos desarrollando el producto. Eventualmente, creo que los proyectos que hubieran llevado meses se completarán en días y con un mejor rendimiento.
¿Podría explicar cómo funciona el desarrollo interactivo de IA de NuMind?
La idea del desarrollo interactivo de IA proviene de cómo los humanos se enseñan unos a otros. Por ejemplo, supongamos que contrata a un interno para clasificar sus correos electrónicos. Primero describiría la tarea y su propósito. Entonces usted podría dar algunos buenos ejemplos, tal vez algunos casos de esquina. Luego, su pasante comenzaría a etiquetar los correos electrónicos y comenzaría una conversación. Su pasante regresaría con preguntas como “¿Cómo debo etiquetar este?” o “Creo que deberíamos crear una nueva etiqueta para este”, o incluso preguntarte “por qué” deberíamos etiquetar de cierta manera. Del mismo modo, puede hacer preguntas a su pasante para identificar y corregir sus lagunas de conocimiento. Esta forma de enseñanza es muy natural y extremadamente eficiente en términos de intercambio de información. Estamos tratando de imitar este flujo de trabajo para que los humanos puedan enseñar a las máquinas de manera eficiente.
En términos técnicos, este flujo de trabajo es una comunicación bidireccional, multimodal, de gran ancho de banda y de baja latencia entre el ser humano y la máquina, y decidimos llamarlo Desarrollo interactivo de IA para enfatizar los aspectos bidireccionales y de baja latencia. Veo esto como un tercer paradigma para enseñar a las máquinas, después de la programación clásica y el aprendizaje automático clásico (donde solo das un montón de ejemplos de la tarea para que la computadora descubra qué hacer).
Este nuevo paradigma está desbloqueado por LLM. De hecho, debe tener algo que ya sea inteligente en la máquina para interactuar de manera eficiente con ella. Creo que este paradigma se convertirá en un lugar común en un futuro próximo, y ya podemos vislumbrarlo con los LLM basados en chat y, por supuesto, con nuestra herramienta.
Estamos aplicando este paradigma para enseñar tareas de PNL, pero esto puede usarse, y lo hará, para mucho más, incluido el desarrollo de software.
¿Hay algo más que le gustaría compartir sobre NuMind?
¡Quizás que es una herramienta que puede ser utilizada tanto por expertos como por no expertos en aprendizaje automático, que es multilingüe, que usted posee sus modelos y que los datos pueden permanecer en su máquina!
De lo contrario, estamos en una fase beta privada, por lo que si tiene alguna necesidad de PNL, ¡estaremos encantados de hablar y averiguar si / cómo podemos ayudarlo!
Gracias por la gran entrevista, los lectores que deseen obtener más información deben visitar NuMind.