El último estudio de inteligencia artificial (IA) de Harvard encuentra formas de maximizar la precisión de la segmentación de imágenes mediante algoritmos de aprendizaje automático en imágenes de tejidos multiplexados…

Estás leyendo la publicación: El último estudio de inteligencia artificial (IA) de Harvard encuentra formas de maximizar la precisión de la segmentación de imágenes mediante algoritmos de aprendizaje automático en imágenes de tejidos multiplexados…

Los tipos de células, las membranas basales y las estructuras conectivas que organizan los tejidos y los tumores se pueden encontrar en rangos de longitud que van desde orgánulos microscópicos hasta órganos completos (0,1 a >104 m). En la investigación de la arquitectura tisular, la hematoxilina, la eosina (H&E) y la microscopía inmunohistoquímica han sido durante mucho tiempo el método de elección. Además, la histopatología clínica continúa siendo el método principal para el diagnóstico y tratamiento de enfermedades como el cáncer. Sin embargo, la histología clásica necesita brindar más datos moleculares para clasificar correctamente los genes de enfermedades, analizar las vías de desarrollo o identificar subtipos de células.

Es adecuado para identificar tipos de células, evaluar estados celulares (reposo, proliferación, muerte, etc.) e investigar vías de señalización celular utilizando imágenes de alto plex de tejidos sanos y enfermos (también conocida como proteómica espacial). En un entorno 3D conservado, las imágenes de alto plexo también exponen las morfologías y ubicaciones de las estructuras acelulares necesarias para la integridad del tejido. La resolución, el campo de visión y la diversidad (plex) de las técnicas de imagen de alto plex varían, pero todas proporcionan imágenes 2D de cortes de tejido que suelen tener un grosor de 5 a 10 m.

Los datos de una sola célula producidos al segmentar y cuantificar imágenes multiplexadas complementan perfectamente los datos de secuenciación de ARN de una sola célula (scRNASeq), que ha avanzado significativamente su comprensión de las células y tejidos sanos y patológicos. Sin embargo, la imagen de tejido multiplex mantiene la información morfológica y espacial, a diferencia del RNASeq disociativo. Sin embargo, las imágenes de células cultivadas, que hasta ahora han sido el foco principal de los sistemas de visión artificial con un enfoque centrado en la biología, son mucho más difíciles de evaluar computacionalmente que los datos de imágenes de alto plex.

🔥 Recomendado:  8 formas de ganar dinero como comprador personal de comestibles

Las técnicas de segmentación de células de metazoos han experimentado un amplio desarrollo; sin embargo, la segmentación de imágenes de tejido presenta un problema más desafiante debido al hacinamiento celular y la variedad de formas celulares. Al igual que la aplicación omnipresente de las redes neuronales convolucionales (CNN) en la identificación de imágenes, la detección de objetos y la producción de imágenes sintéticas, los algoritmos de segmentación que emplean el aprendizaje automático se han generalizado recientemente. Arquitecturas como ResNet, VGG16 y, más recientemente, UNet y Mask R-CNN han obtenido una amplia aceptación por su capacidad para aprender millones de parámetros y generalizar a través de conjuntos de datos.

Dado que la mayoría de los tipos de células solo tienen un núcleo, la localización de núcleos es un punto de partida ideal para segmentar células y tejidos cultivados. Las tinciones nucleares con una alta relación señal-fondo también están ampliamente disponibles. En el pasado, los investigadores propusieron dos enfoques aleatorios basados ​​en bosques utilizando un grupo de árboles de decisión para asignar probabilidades de clase de píxeles a una imagen mediante el uso de varios canales para la clasificación de píxeles de clase. Sin embargo, un inconveniente significativo de los modelos de bosques aleatorios es que son mucho menos capaces de aprender que las CNN. Por lo tanto, aún queda mucho por investigar sobre el potencial de utilizar CNN con datos multicanal para mejorar la segmentación del núcleo.

El método más popular para extender los datos de entrenamiento para dar cuenta de los artefactos de imagen es el aumento computacional, que implica rotar, cortar, voltear, etc., imágenes al azar antes de preprocesarlas. Esto se hace para evitar que los algoritmos recojan información no relacionada sobre una imagen, incluida su orientación. Hasta ahora, los artefactos de enfoque se han eliminado utilizando el desenfoque gaussiano calculado para complementar los datos de entrenamiento. Sin embargo, el desenfoque gaussiano es simplemente una aproximación aproximada del desenfoque presente en cualquier dispositivo óptico de imágenes con un paso de banda restringido, como un microscopio real, así como las consecuencias de los índices de refracción no coincidentes y la dispersión de la luz.

🔥 Recomendado:  Este documento de IA muestra cómo los modelos de difusión memorizan imágenes individuales de sus datos de entrenamiento y las emiten en el momento de la generación

Esta investigación explora métodos para mejorar la precisión de las imágenes de tejido multiplexado con artefactos de imagen típicos y segmentación de imágenes utilizando técnicas de aprendizaje automático. Mediante la selección manual de una variedad de tejidos y tumores normales, crean un conjunto de entrenamiento y prueba con anotaciones reales. Luego usaron estos datos para medir la precisión de segmentación de tres redes de aprendizaje profundo, cada una de las cuales fue entrenada y probada de forma independiente: UNet, Mask R-CNN y Pyramid Scene Parsing Network (PSPNet). Los modelos resultantes son una serie de Modelos universales para identificar células y segmentar tejidos (UnMICST), cada uno basado en un tipo diferente de red ML pero que utiliza los mismos datos de entrenamiento. Encontraron dos estrategias para aumentar la precisión de la segmentación para las tres redes según su estudio. El primero combina fotografías de cromatina nuclear teñida con colorantes de intercalación de ADN con fotografías de tinción de envoltura nuclear (NES). El segundo incluye aumentos naturales, definidos aquí como fotos sobresaturadas y borrosas a propósito en los datos de entrenamiento para fortalecer los modelos contra los tipos de artefactos que se ven en las imágenes de tejido reales. Descubren que el aumento de datos real supera con creces el aumento de desenfoque gaussiano tradicional, mejorando estadísticamente la solidez del modelo de forma espectacular. Los beneficios de incluir datos NES y aumentos genuinos son acumulativos en varios tipos de tejidos.