Por Adam Zewe En biomedicina, la segmentación implica anotar píxeles de una estructura importante en una imagen médica, como un órgano o una célula. Los modelos de inteligencia artificial pueden ayudar a los médicos al resaltar los píxeles que pueden mostrar signos de una determinada enfermedad o anomalía. Sin embargo, estos modelos suelen proporcionar una sola respuesta, mientras que el problema de la segmentación de imágenes médicas suele estar lejos de ser blanco o negro. Cinco anotadores humanos expertos podrían proporcionar cinco segmentaciones diferentes, tal vez en desacuerdo sobre la existencia o extensión de los bordes de un nódulo en una imagen de TC pulmonar. "Tener opciones puede ayudar en la toma de decisiones. Incluso el simple hecho de ver que hay incertidumbre en una imagen médica puede influir en las decisiones de alguien, por lo que es importante tener en cuenta esta incertidumbre", dice Marianne Rakic, candidata a doctorado en ciencias de la computación del MIT. Rakic es el autor principal de un artículo con otros en el MIT, el Instituto Broad del MIT y Harvard, y el Hospital General de Massachusetts que presenta una nueva herramienta de IA que puede capturar la incertidumbre en una imagen médica. Conocido como Tyche (llamado así por la divinidad griega del azar), el sistema proporciona múltiples segmentaciones plausibles que resaltan áreas ligeramente diferentes de una imagen médica. Un usuario puede especificar cuántas opciones genera Tyche y seleccionar la más apropiada para su propósito. Y lo que es más importante, Tyche puede abordar nuevas tareas de segmentación sin necesidad de volver a formarse. El entrenamiento es un proceso intensivo en datos que implica mostrar un modelo muchos ejemplos y requiere una amplia experiencia en aprendizaje automático. Debido a que no necesita reentrenamiento, Tyche podría ser más fácil de usar para los médicos e investigadores biomédicos que otros métodos. Podría aplicarse "fuera de la caja" para una variedad de tareas, desde la identificación de lesiones en una radiografía de pulmón hasta la identificación de anomalías en una resonancia magnética cerebral. En última instancia, este sistema podría mejorar los diagnósticos o ayudar en la investigación biomédica al llamar la atención sobre información potencialmente crucial que otras herramientas de IA podrían pasar por alto. "La ambigüedad ha sido poco estudiada. Si su modelo pasa por alto por completo un nódulo que tres expertos dicen que está allí y dos expertos dicen que no, eso es probablemente algo a lo que debería prestar atención", agrega el autor principal Adrian Dalca, profesor asistente en la Facultad de Medicina de Harvard y MGH, e investigador científico en el Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT. Sus coautores incluyen a Hallee Wong, estudiante de posgrado en ingeniería eléctrica y ciencias de la computación; José Javier González Ortiz PhD '23; Beth Cimini, directora asociada de análisis de bioimágenes en el Instituto Broad; y John Guttag, profesor Dugald C. Jackson de Ciencias de la Computación e Ingeniería Eléctrica. Rakic presentará a Tyche en la Conferencia IEEE sobre Visión por Computadora y Reconocimiento de Patrones, donde Tyche ha sido seleccionado como uno de los aspectos más destacados. Abordar la ambigüedad Los sistemas de IA para la segmentación de imágenes médicas suelen utilizar redes neuronales. Basadas libremente en el cerebro humano, las redes neuronales son modelos de aprendizaje automático que comprenden muchas capas interconectadas de nodos, o neuronas, que procesan datos. Después de hablar con colaboradores del Instituto Broad y MGH que utilizan estos sistemas, los investigadores se dieron cuenta de que dos problemas principales limitan su efectividad. Los modelos no pueden capturar la incertidumbre y deben volver a entrenarse incluso para una tarea de segmentación ligeramente diferente. Algunos métodos intentan superar un escollo, pero abordar ambos problemas con una sola solución ha demostrado ser especialmente complicado, dice Rakic. "Si se quiere tener en cuenta la ambigüedad, a menudo hay que utilizar un modelo extremadamente complicado. Con el método que proponemos, nuestro objetivo es facilitar su uso con un modelo relativamente pequeño para que pueda hacer predicciones rápidamente", dice. Los investigadores construyeron Tyche modificando una arquitectura de red neuronal sencilla. En primer lugar, un usuario alimenta a Tyche con algunos ejemplos que muestran la tarea de segmentación. Por ejemplo, los ejemplos podrían incluir varias imágenes de lesiones en una resonancia magnética cardíaca que han sido segmentadas por diferentes expertos humanos para que el modelo pueda aprender la tarea y ver que hay ambigüedad. Los investigadores encontraron que solo 16 imágenes de ejemplo, llamadas "conjunto de contexto", son suficientes para que el modelo haga buenas predicciones, pero no hay límite para el número de ejemplos que se pueden usar. El conjunto de contextos permite a Tyche resolver nuevas tareas sin necesidad de volver a entrenar. Para que Tyche capturara la incertidumbre, los investigadores modificaron la red neuronal para que genere múltiples predicciones basadas en una entrada de imagen médica y el conjunto de contextos. Ajustaron las capas de la red para que, a medida que los datos se mueven de una capa a otra, las segmentaciones candidatas producidas en cada paso puedan "hablar" entre sí y con los ejemplos en el conjunto de contextos. De esta manera, el modelo puede garantizar que las segmentaciones de candidatos sean un poco diferentes, pero aún así resuelvan la tarea. "Es como tirar los dados. Si tu modelo puede sacar un dos, un tres o un cuatro, pero no sabe que ya tienes un dos y un cuatro, entonces cualquiera de los dos podría volver a aparecer", dice. También modificaron el proceso de entrenamiento para que sea recompensado maximizando la calidad de su mejor predicción. Si el usuario pidió cinco predicciones, al final puede ver las cinco segmentaciones de imágenes médicas que Tyche produjo, aunque una podría ser mejor que las otras. Los investigadores también desarrollaron una versión de Tyche que se puede utilizar con un modelo existente y preentrenado para la segmentación de imágenes médicas. En este caso, Tyche permite que el modelo genere varios candidatos realizando ligeras transformaciones en las imágenes. Predicciones mejores y más rápidas Cuando los investigadores probaron Tyche con conjuntos de datos de imágenes médicas anotadas, encontraron que sus predicciones capturaban la diversidad de anotadores humanos y que sus mejores predicciones eran mejores que cualquiera de los modelos de referencia. Tyche también funcionó más rápido que la mayoría de los modelos. "Generar varios candidatos y asegurarse de que sean diferentes entre sí realmente te da una ventaja", dice Rakic. Los investigadores también vieron que Tyche podría superar a los modelos más complejos que han sido entrenados utilizando un conjunto de datos grande y especializado. Para trabajos futuros, planean intentar usar un conjunto de contextos más flexible, tal vez incluyendo texto o múltiples tipos de imágenes. Además, quieren explorar métodos que podrían mejorar las peores predicciones de Tyche y mejorar el sistema para que pueda recomendar los mejores candidatos de segmentación. Esta investigación está financiada, en parte, por los Institutos Nacionales de Salud, el Centro Eric y Wendy Schmidt del Instituto Broad del MIT y Harvard, y Quanta Computer.