Estás leyendo la publicación: Investigadores de Cambridge y UCLA presentan DC-Check: un nuevo marco de estilo de lista de verificación de IA centrado en datos para guiar el desarrollo de sistemas de aprendizaje automático confiables
Los avances revolucionarios en los algoritmos de aprendizaje automático (ML) han potenciado muchas aplicaciones impulsadas por IA en diversas industrias, como el comercio electrónico, las finanzas, la fabricación y la medicina. Sin embargo, desarrollar sistemas de ML del mundo real en configuraciones de datos complejas puede ser un desafío, como lo demuestran numerosas fallas de alto perfil debido a sesgos en los datos o algoritmos.
Para abordar este problema, un equipo de investigadores de la Universidad de Cambridge y UCLA introdujo un nuevo marco de IA centrado en datos llamado DC-Check; que tiene como objetivo enfatizar la importancia de los datos utilizados para entrenar algoritmos de aprendizaje automático. DC-Check es un marco de estilo de lista de verificación procesable que proporciona un conjunto de preguntas y herramientas prácticas para guiar a los profesionales e investigadores a pensar críticamente sobre el impacto de los datos en cada etapa de la canalización de ML: datos, capacitación, pruebas e implementación.
Según los investigadores, el enfoque actual del aprendizaje automático está centrado en el modelo, donde el enfoque está en la iteración y mejora del modelo para lograr un mejor rendimiento predictivo. Sin embargo, este enfoque a menudo subestima la importancia de los datos a lo largo del ciclo de vida de ML. Por el contrario, la IA centrada en los datos considera que los datos son la clave para construir sistemas de ML confiables y busca mejorar sistemáticamente los datos utilizados por estos sistemas. Definen la IA centrada en datos como: “La IA centrada en datos abarca métodos y herramientas para caracterizar, evaluar y monitorear sistemáticamente los datos subyacentes utilizados para entrenar y evaluar modelos”. Al centrarnos en los datos, nuestro objetivo es crear sistemas de IA que no solo sean altamente predictivos sino también fiables y confiables”, escribieron los investigadores en su artículo.
Los investigadores señalan que si bien existe un gran interés en la IA centrada en datos, actualmente no existe un proceso estandarizado cuando se trata de diseñar sistemas de IA centrados en datos, lo que dificulta que los profesionales la apliquen a su trabajo.
DC-Check resuelve este desafío como el primer marco estandarizado para interactuar con la IA centrada en datos. La lista de verificación de DC-Check proporciona un conjunto de preguntas para guiar a los usuarios a pensar críticamente sobre el impacto de los datos en cada etapa de la canalización, junto con herramientas y técnicas prácticas. También destaca los desafíos abiertos que debe abordar la comunidad investigadora.
DC-Check cubre las cuatro etapas clave de la tubería de aprendizaje automático: datos, capacitación, pruebas e implementación. En la etapa de datos, DC-Check alienta a los profesionales a considerar la selección proactiva de datos, la curación de datos, la evaluación de la calidad de los datos y los datos sintéticos para mejorar la calidad de los datos utilizados para el entrenamiento del modelo. En Capacitación, DC-Check promueve el diseño de modelos basados en datos, la adaptación de dominios y la capacitación sólida de grupos. Las consideraciones de prueba incluyen divisiones de datos informados, métricas específicas y pruebas de estrés, y evaluación en subgrupos. Finalmente, las consideraciones de implementación abarcan el monitoreo de datos, los circuitos de retroalimentación y los métodos de confiabilidad, como la estimación de la incertidumbre.
Si bien la lista de verificación tiene un público objetivo de profesionales e investigadores, se menciona que DC-Check también puede ser utilizado por los tomadores de decisiones organizacionales, los reguladores y los formuladores de políticas para tomar decisiones informadas sobre los sistemas de IA.
El equipo de investigadores detrás de DC-Check espera que la lista de verificación fomente la adopción generalizada de IA centrada en datos y conduzca a sistemas de aprendizaje automático más confiables y confiables. Junto con Papel de cheque DChan proporcionado un sitio web complementario que tiene la lista de verificación y la herramienta DC-Check junto con Recursos adicionales.
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools