Estás leyendo la publicación: La utilidad del aprendizaje automático en el diagnóstico de la salud: hacia la IA
Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.
La última década ha visto un aumento significativo en la aplicación de IA y aprendizaje automático en el campo de la medicina. Sin embargo, la ética, la confiabilidad y la idoneidad de estas herramientas deben considerarse cuidadosamente si se pretende reemplazar los enfoques tradicionales actuales. Aquí consideraré 3 formas en las que el aprendizaje automático puede tener el potencial de beneficiar la atención médica:
1. Redefinir y justificar los umbrales de riesgo para enfermedades y trastornos
Actualmente, en el diagnóstico, muchos umbrales de riesgo de trastornos tales como enfermedades cardíacas tienden a determinarse con una única consideración variable en lugar de un sentido multivariable. Por ejemplo, al diagnosticar insuficiencia cardíaca o cardiomiopatía, la evidencia de una fracción de eyección por debajo del 40 por ciento fue, durante mucho tiempo, el estándar de oro. Sin embargo, los estudios han encontrado que aproximadamente la mitad de todos los casos de insuficiencia cardíaca ocurren con fracción de eyección preservada, lo que presenta un grave desafío diagnóstico y terapéutico, especialmente para distinguir esto de otras causas de síntomas informados, como dificultad para respirar (disnea) [1]. Cuando se trata de pacientes presintomáticos, en riesgo o de inicio temprano de tales enfermedades, incluso si se utilizan múltiples variables, los médicos tienden a combinarlas arbitrariamente en un sentido independiente y asociativo. [2].
Presumiblemente, la precisión del diagnóstico aumentaría si se realiza caso por caso utilizando umbrales condicionales en múltiples variables, lo que significa que el umbral para una variable puede depender del valor de otra. Por ejemplo, dado que un paciente tiene 40 años, es varón, tiene una presión arterial sistólica de 120 mmHg y un colesterol total de 4 mmol/L, ¿por encima de qué umbral de masa ventricular izquierda indicaría la aparición temprana de insuficiencia cardíaca? O, dada esta combinación de valores de parámetros, ¿cuál es la probabilidad del paciente de un inicio futuro? Hoy en día, incluso el soporte de decisiones basado en reglas de IA de última generación utilizado por el NHS en su sistema de registro electrónico de salud (EHR) actualmente carece de este tipo de precisión. [4]
Una forma de lograr este objetivo es mediante el uso de algoritmos de clasificación basados en árboles. Teoricemos que el mecanismo subyacente de algunos trastornos (estenosis aórtica, por ejemplo) depende de un conjunto complejo de interrelaciones condicionales y reglas lógicas que se aplican en algunos casos y no en otros. Por ejemplo, hemos observado que una masa ventricular izquierda alta (hipertrofia) solo es un problema si el paciente tiene una edad determinada y una masa grasa visceral por encima de un valor determinado y algunas otras condiciones. Los algoritmos basados en árboles, como los árboles de decisión y los bosques aleatorios, aprenden y modelan explícitamente estos subgrupos, utilizando reglas de decisión condicional que varían entre las ramas de su árbol, proporcionando diferentes conjuntos de lógica para diferentes pacientes. Simultáneamente, facilita la interpretabilidad en forma de características importantes y diagramas de árbol (como la Figura 1).
Vale la pena señalar que no todos los algoritmos de clasificación de aprendizaje automático permiten inferir el mismo tipo de lógica subyacente. Con un enfoque de ajuste de curva singular, otros algoritmos discriminantes como SVM, K-vecinos más cercanos o regresión logística no pueden aprender este tipo de lógica condicional a menos que estén preprogramados.
A lo largo de las décadas, hemos visto varios enfoques de los sistemas basados en reglas para el diagnóstico médico. A partir de MYCIN a principios de la década de 1970, que se utilizó para diagnosticar infecciones bacterianas transmitidas por la sangre a partir de múltiples variables utilizando una base de conocimiento de ~600 reglas ingresadas por expertos y un motor de inferencia, hasta IBM Watson para el diagnóstico de cáncer, hasta el NHS EHR que se usa hoy. ; El mayor desafío ha sido el debate sobre cómo representar mejor la incertidumbre, particularmente la estimación de un gran número de probabilidades condicionales, y cómo lidiar con la ocurrencia de lógica conflictiva o circular en estas reglas programadas. [4].
E incluso donde dichos sistemas de reglas, como MYCIN, han logrado predicciones a la par de los expertos médicos, aún no hemos visto un éxito generalizado o la adopción de tales sistemas para establecer el estándar para la evaluación de diagnóstico, también debido a la mala integración con los sistemas clínicos existentes y preocupaciones sobre la responsabilidad legal por predicciones erróneas.
2. Desarrollar sistemas de diagnóstico automático con una precisión superior para los médicos
Con acceso a mayores cantidades de datos y más pruebas de solidez, los clasificadores de aprendizaje automático pueden determinar el riesgo y la aparición de trastornos cardíacos antes y con mayor precisión que los médicos por sí mismos. Si bien (1) analizó cómo los umbrales de riesgo y el diagnóstico de enfermedades podrían definirse mejor mediante el aprendizaje automático y usarse como apoyo para la toma de decisiones para los médicos, otro caso de uso podría ser en tareas singulares donde la explicabilidad es menos importante o irrelevante.
Para diagnósticos por imágenes simples y específicos, como la detección de malignidad de lesiones cutáneas pigmentadas, Tschandl et al. (2019) encontraron que los clasificadores superaron el juicio de 27 expertos humanos con más de una década de experiencia, logrando una media de diagnósticos correctos de 25,43 frente a 18,78 (P<0,0001). De manera similar, al entrenar una IA en escaneos de retina, DeepMind pudo identificar correctamente múltiples enfermedades de la retina con una precisión del 94 %, superando la de los mejores expertos humanos. [5]. Sin embargo, en otras áreas, los datos limitados y la mayor complejidad detrás de los factores de influencia actualmente dificultan la precisión y confiabilidad del aprendizaje automático en comparación con los humanos. Y de manera similar, debido a la cuestión de la culpabilidad legal por las predicciones erróneas, la confianza en estos métodos automáticos tomará más tiempo para generarse. Por ahora, parece más inteligente abordar cualquier aplicación de aprendizaje automático con la filosofía de que debe colaborar y complementar la toma de decisiones humana en lugar de reemplazarla por completo.
3. Descubrir ideas y teorías novedosas para la investigación médica
A menudo, existe una dicotomía entre el aprendizaje automático y las estadísticas tradicionales en términos de rendimiento predictivo frente a la compensación de la explicabilidad: el aprendizaje automático se diseñó con mayor énfasis en la predicción de alta precisión, mientras que las estadísticas se diseñaron principalmente para inferir relaciones entre variables. [6].
Sin embargo, con los desarrollos en las herramientas de interpretabilidad y explicabilidad del aprendizaje automático (p. ej., importancia de características, SHAP y redes bayesianas), es plausible que el aprendizaje automático tenga el potencial de lograr tanto una alta precisión predictiva como explicaciones perspicaces. Aplicado al contexto de la investigación médica, se podría vislumbrar un futuro para la academia en el que los algoritmos utilicen volúmenes masivos de datos de pacientes para generar modelos causales que propongan nuevas teorías y asociaciones entre variables diagnósticas. Al principio, estas inferencias servirían como validaciones para teorías médicas preexistentes y bien establecidas, pero a medida que crece la confianza en la precisión y la sabiduría de estos algoritmos, pueden comenzar a usarse como fuentes de nuevas teorías para ser estudiado y complementado con más estudios de pacientes o ensayos in vitro.
Si bien tales intentos de extracción de datos y descubrimiento de conocimientos en medicina han existido desde los años 90, existen limitaciones en la metodología detrás de inferir y probar la causalidad de los datos, junto con el desafío general de cómo se debe derivar, interpretar y presentar la información. Citando a los autores de un reciente revisarDesafortunadamente, “la investigación biomédica se está ahogando en datos, pero está hambrienta de conocimiento”. [7]
Referencias:
[2] Jonathan G. Richens, Ciarán M. Lee y Saurabh Johri. “Mejora de la precisión del diagnóstico médico con el aprendizaje automático causal”
[3] C.Hughes “ La representación de la incertidumbre en los sistemas expertos médicos”
[4]Thomas Davenport y Ravi Kalakota “El potencial de la inteligencia artificial en el cuidado de la salud”
[5] https://www.moorfields.nhs.uk/content/breakthrough-ai-technology-improve-care-patients
[6] Danilo Bzdok, Naomi Altman y Martin Krzywinski. “Estadística versus aprendizaje automático”
[7] Andreas Holzinger e Igor Jurisica. “Descubrimiento de conocimiento y minería de datos en informática biomédica: el futuro está en soluciones de aprendizaje automático integradas e interactivas”
La utilidad del aprendizaje automático en el diagnóstico de la salud se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.
Publicado a través de Hacia la IA