Los modelos de inteligencia fabricado para analizar imágenes de cáncer toman atajos que introducen sesgos

0 2


Las herramientas de inteligencia artificial y los modelos de aprendizaje profundo son una herramienta poderosa en el tratamiento del cáncer. Se pueden utilizar para analizar imágenes digitales de muestras de biopsias de tumores, lo que ayuda a los médicos a clasificar rápidamente el tipo de cáncer, predecir el pronóstico y guiar el curso del tratamiento del paciente. Sin embargo, a menos que estos algoritmos estén debidamente calibrados, a veces pueden hacer predicciones inexactas o sesgadas.

Un nuevo estudio realizado por investigadores de la Universidad de Chicago muestra que los modelos de aprendizaje profundo entrenados en grandes conjuntos de datos sobre la histología genética y tisular del cáncer pueden identificar fácilmente a la institución que envió las imágenes. Los modelos, que utilizan métodos de aprendizaje automático para “enseñarse” a sí mismos cómo reconocer determinadas firmas de cáncer, terminan utilizando el sitio de envío como un atajo para predecir los resultados de los pacientes al agruparlos con otros pacientes de la misma ubicación en lugar de confiar en la biología de pacientes individuales. Esto, a su vez, puede generar prejuicios y oportunidades perdidas de tratamiento en pacientes de grupos minoritarios raciales o étnicos que pueden tener más probabilidades de estar representados en algunos centros médicos y ya tienen dificultades para acceder a la atención.

“Hemos identificado un claro agujero en la metodología actual para desarrollar el modelo de aprendizaje profundo que hace que ciertas regiones y poblaciones de pacientes sean más propensas a ser incluidas en predicciones algorítmicas inexactas”, dijo Alexander Pearson, MD, PhD, profesor asistente de medicina en UChicago Medicina y coautor principal. El estudio fue publicado el 20 de julio en Comunicaciones de la naturaleza.

Uno de los primeros pasos en el tratamiento de un paciente con cáncer es realizar una biopsia o una pequeña muestra de tejido de un tumor. Se fija una porción muy delgada del tumor en un portaobjetos, que se tiñe con tintes multicolores para que un patólogo lo examine y haga un diagnóstico. A continuación, se pueden crear imágenes digitales para su almacenamiento y análisis remoto utilizando un microscopio de barrido. Si bien estos pasos son en su mayoría estándar en los laboratorios de patología, pequeñas variaciones en el color o la cantidad de tinción, las técnicas de procesamiento de tejidos y el equipo de imágenes pueden crear firmas únicas, como etiquetas, en cada imagen. Estas firmas específicas de la ubicación no son visibles a simple vista, pero son fácilmente detectables mediante potentes algoritmos de aprendizaje profundo.

Estos algoritmos tienen el potencial de ser una herramienta valiosa para permitir a los médicos analizar rápidamente un tumor y guiar las opciones de tratamiento, pero la introducción de este tipo de sesgo significa que los modelos no siempre basan su análisis en las firmas biológicas que ven en las imágenes, pero más bien los artefactos de imagen generados por las diferencias entre los sitios de envío.

Pearson y sus colegas estudiaron el rendimiento de modelos de aprendizaje profundo entrenados con datos del Cancer Genome Atlas, uno de los mayores depósitos de datos genéticos e imágenes de tejidos cancerosos. Estos modelos pueden predecir tasas de supervivencia, patrones de expresión génica, mutaciones y más a partir de la histología de tejidos, pero la frecuencia de estas características de los pacientes varía ampliamente según las instituciones que enviaron las imágenes, y el modelo a menudo se establece en la forma “más fácil” de distinguir entre muestras, en este caso el sitio de envío.

Por ejemplo, si el hospital A atiende principalmente a pacientes adinerados con más recursos y mejor acceso a la atención, las imágenes enviadas desde ese hospital generalmente indicarán mejores resultados para los pacientes y tasas de supervivencia. Si el hospital B atiende a una población más desfavorecida que lucha por acceder a una atención de calidad, las imágenes enviadas por el sitio generalmente predicen peores resultados.

El equipo de investigación descubrió que una vez que los modelos identificaron qué institución envió las imágenes, tendían a utilizarlas como sustituto de otras características de la imagen, incluida la ascendencia. En otras palabras, si las técnicas de tinción o imagenología de un portaobjetos parecieran ser presentadas por el hospital A, los modelos habrían predicho mejores resultados, mientras que hubieran predicho peores resultados si se viera como una imagen del hospital B. A la inversa, si todos los pacientes en el hospital B tenían características biológicas basadas en la genética que indicaban un peor pronóstico, el algoritmo vincularía los peores resultados con los patrones de tinción del hospital B en lugar de las cosas que vieron en el tejido.

“Los algoritmos están diseñados para encontrar una señal para diferenciar imágenes, y lo hace identificando ociosamente el sitio”, dijo Pearson. “De hecho, queremos comprender qué biología dentro de un tumor es más probable que predisponga la resistencia al tratamiento o la enfermedad metastásica temprana, por lo que necesitamos desenredar esa firma histológica digital específica del sitio de la verdadera señal biológica”.

La clave para evitar este tipo de sesgo es considerar cuidadosamente los datos utilizados para entrenar los modelos. Los desarrolladores pueden asegurarse de que los diferentes resultados de enfermedades se distribuyan uniformemente en todos los sitios utilizados en los datos de entrenamiento, ya sea aislando un sitio en particular durante el entrenamiento o probando el modelo cuando la distribución de los resultados es desigual. El resultado producirá herramientas más precisas que pueden proporcionar a los médicos la información que necesitan para diagnosticar y planificar tratamientos rápidamente para los pacientes con cáncer.

“La promesa de la IA es la capacidad de brindar una salud precisa y rápida a más personas”, dijo Pearson. “Sin embargo, para satisfacer las necesidades de los miembros sin derechos de nuestra sociedad, debemos ser capaces de desarrollar algoritmos que sean competentes y hagan predicciones relevantes para todos”.

También podría gustarte
Deja una respuesta

Su dirección de correo electrónico no será publicada.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More