Estás leyendo la publicación: Investigadores de inteligencia artificial de Mayo Clinic presentan un método basado en el aprendizaje automático para aprovechar los modelos de difusión a fin de construir un algoritmo multitarea para pintar tumores cerebrales
El número de publicaciones de IA y, en particular, de aprendizaje automático (ML) relacionadas con imágenes médicas ha aumentado drásticamente en los últimos años. Una búsqueda actual en PubMed con las palabras clave de Mesh “inteligencia artificial” y “radiología” arrojó 5369 artículos en 2021, más de cinco veces los resultados encontrados en 2011. Los modelos ML se desarrollan constantemente para mejorar la eficiencia y los resultados de la atención médica, desde la clasificación hasta la segmentación semántica , detección de objetos y generación de imágenes. Numerosos informes publicados en radiología de diagnóstico, por ejemplo, indican que los modelos ML tienen la capacidad de funcionar tan bien o incluso mejor que los expertos médicos en tareas específicas, como la detección de anomalías y la detección de patologías.
Por lo tanto, es innegable que, cuando se usa correctamente, la IA puede ayudar a los radiólogos y reducir drásticamente su trabajo. A pesar del creciente interés en el desarrollo de modelos ML para imágenes médicas, los desafíos significativos pueden limitar las aplicaciones prácticas de dichos modelos o incluso predisponerlos a un sesgo sustancial. La escasez de datos y el desequilibrio de datos son dos de estos desafíos. Por un lado, los conjuntos de datos de imágenes médicas suelen ser mucho más pequeños que los conjuntos de datos de fotografías naturales como ImageNet, y puede ser imposible agrupar conjuntos de datos institucionales o hacerlos públicos debido a preocupaciones sobre la privacidad del paciente. Por otro lado, incluso los conjuntos de datos de imágenes médicas a los que tienen acceso los científicos de datos podrían estar más equilibrados.
En otras palabras, el volumen de datos de imágenes médicas de pacientes con patologías específicas es significativamente menor que el de pacientes con patologías comunes o personas sanas. El uso de conjuntos de datos insuficientemente grandes o desequilibrados para entrenar o evaluar un modelo de aprendizaje automático puede generar sesgos sistémicos en el rendimiento del modelo. La generación de imágenes sintéticas es una de las principales estrategias para combatir la escasez y el desequilibrio de datos, además del lanzamiento público de conjuntos de datos de imágenes médicas no identificados y la aprobación de estrategias como el aprendizaje federado, que permite el desarrollo de modelos de aprendizaje automático (ML) en entornos multiinstitucionales. conjuntos de datos sin compartir datos.
Los modelos de aprendizaje automático generativo pueden aprender a generar datos de imágenes médicas realistas que no pertenecen a un paciente real y, por lo tanto, pueden compartirse públicamente sin poner en peligro la privacidad del paciente. Se han introducido varios modelos de generación capaces de sintetizar datos sintéticos de alta calidad desde que surgieron las redes antagónicas generativas (GAN). La mayoría de estos modelos producen datos de imágenes sin etiquetar, que pueden ser útiles en aplicaciones específicas, como modelos descendentes autosupervisados o semisupervisados. Además, algunos otros modelos son capaces de generación condicional, lo que permite generar una imagen basada en variables clínicas, textuales o de imágenes predeterminadas.
Los modelos probabilísticos de difusión de eliminación de ruido (DDPM), también conocidos como modelos de difusión, son una nueva clase de modelos de generación de imágenes que superan a las GAN en cuanto a calidad de imagen sintética y diversidad de salida. La última clase de modelos generativos permite la generación de datos sintéticos etiquetados, lo que hace avanzar la investigación del aprendizaje automático, la calidad de las imágenes médicas y la atención al paciente. A pesar de su enorme éxito en la generación de datos de imágenes médicas sintéticas, las GAN son frecuentemente criticadas por su falta de diversidad de salida y entrenamiento inestable. Los modelos de aprendizaje profundo de Autoencoder son una alternativa más tradicional a las GAN porque son más fáciles de entrenar y producen resultados más diversos. Aún así, sus resultados sintéticos carecen de la calidad de imagen de las GAN.
Los modelos de difusión basados en la teoría de la cadena de Markov aprenden a generar sus resultados sintéticos eliminando gradualmente el ruido de una imagen inicial llena de ruido gaussiano aleatorio. Este proceso iterativo de eliminación de ruido hace que las ejecuciones de inferencia de los modelos de difusión sean significativamente más lentas que las de otros modelos generativos. Aún así, les permite extraer características más representativas de sus datos de entrada, lo que les permite superar a otros modelos. En este documento metodológico, presentan un modelo de difusión de prueba de concepto que se puede utilizar para pintar tumores cerebrales multitarea en estudios de imágenes por resonancia magnética (IRM) cerebrales multisecuenciales.
Crearon un modelo de difusión que puede recibir un corte axial bidimensional (2D) de una secuencia ponderada en T1 (T1), ponderada en T1 con contraste (T1CE), ponderada en T2 (T2) o FLAIR de una resonancia magnética cerebral. y vuelva a pintar un área recortada definida por el usuario de ese corte con una imagen realista y controlable de un glioma de alto grado y sus componentes correspondientes (p. ej., el edema circundante), o tejidos cerebrales sin tumor (aparentemente normales).
En los Estados Unidos, la incidencia del glioma de alto grado es de 3,56 por cada 100 000 personas, y solo hay unos pocos conjuntos de datos de resonancia magnética disponibles públicamente para tumores cerebrales. Su modelo permitirá a los investigadores de ML editar (inducir o eliminar) tejidos tumorales sintéticos o sin tumores con características configurables en cortes de resonancia magnética cerebral en datos tan limitados. La herramienta se ha implementado en línea para que la gente la use. El modelo ha sido de código abierto junto con su documentación en GitHub.
Este artículo está escrito como un artículo de resumen de investigación por el personal de Marktechpost basado en el trabajo de investigación ‘PINTURA DE TUMOR CEREBRAL MULTITAREA CON MODELOS DE DIFUSIÓN: UN INFORME METODOLÓGICO‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, código y herramienta.
Por favor no olvides unirte Nuestro subreddit de ML
Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools