Los seres humanos parecen seguir siendo mejores que la tecnología cuando se trata de la precisión para detectar posibles casos de cáncer de mama durante el cribado, sugiere una revisión publicada hoy en línea en The BMJ.
Los investigadores afirman que actualmente no hay pruebas de buena calidad que respalden la política de sustituir a los radiólogos humanos por la tecnología de inteligencia artificial (AI) en el cribado del cáncer de mama.
El cáncer de mama es una de las principales causas de muerte entre las mujeres de todo el mundo, y muchos países han introducido programas de cribado mamográfico para detectarlo y tratarlo precozmente.
Pero el examen de las mamografías en busca de signos tempranos de cáncer es un trabajo repetitivo de gran volumen para los radiólogos, y algunos cánceres se pasan por alto.
Investigaciones anteriores han sugerido que los sistemas de IA superan a los humanos y pronto podrían utilizarse en lugar de los radiólogos experimentados.
Sin embargo, una revisión reciente de 23 estudios puso de manifiesto la existencia de lagunas en las pruebas y la preocupación por los métodos utilizados.
Para hacer frente a esta incertidumbre, el Comité Nacional de Cribado del Reino Unido encargó a un equipo de investigadores de la Universidad de Warwick que examinara la precisión de la IA para la detección del cáncer de mama en la práctica del cribado mamográfico.
Los investigadores revisaron 12 estudios realizados desde 2010 con datos de 131.822 mujeres sometidas a cribado en Suecia, Estados Unidos, Alemania, Países Bajos y España.
En general, la calidad de los métodos utilizados en los 12 estudios era deficiente y su aplicabilidad a los programas de cribado de cáncer de mama europeos o del Reino Unido era escasa.
Tres grandes estudios en los que participaron 79.910 mujeres compararon los sistemas de IA con las decisiones clínicas del radiólogo original.
De ellas, 1.878 tenían cáncer detectado en el cribado o cáncer de intervalo (cáncer diagnosticado entre las citas de cribado rutinarias) en los 12 meses siguientes al cribado.
La mayoría (34 de 36 o el 94%) de los sistemas de IA evaluados en estos tres estudios fueron menos precisos que un solo radiólogo, y todos fueron menos precisos que el consenso de dos o más radiólogos, que es la práctica habitual en Europa.
Por el contrario, cinco estudios más pequeños en los que participaron 1.086 mujeres indicaron que todos los sistemas de IA evaluados eran más precisos que un solo radiólogo. Sin embargo, los investigadores señalan que estos estudios presentaban un alto riesgo de sesgo y que sus prometedores resultados no se replican en estudios más amplios.
En tres estudios, la IA utilizada como preselección para clasificar las mamografías que deben ser examinadas por un radiólogo y las que no, descartó el 53%, el 45% y el 50% de las mujeres de bajo riesgo, pero también el 10%, el 4% y el 0% de los cánceres detectados por los radiólogos.
Los autores señalan algunas limitaciones del estudio, como la exclusión de estudios no ingleses que podrían haber contenido pruebas relevantes, y reconocen que los algoritmos de IA son de corta duración y mejoran constantemente, por lo que las evaluaciones de los sistemas de IA comunicadas podrían estar desfasadas en el momento de la publicación del estudio.
No obstante, el uso de criterios estrictos de inclusión de estudios junto con una evaluación rigurosa y sistemática de la calidad de los mismos sugiere que sus conclusiones son sólidas.
Por ello, afirman: "La evidencia actual sobre el uso de sistemas de IA en el cribado del cáncer de mama está muy lejos de tener la calidad y la cantidad necesarias para su implementación en la práctica clínica".
Y añaden: "Se necesitan estudios de precisión de pruebas comparativas bien diseñados, ensayos controlados aleatorios y estudios de cohortes en grandes poblaciones de cribado que evalúen los sistemas de IA disponibles en el mercado en combinación con los radiólogos en la práctica clínica."
Fuente: BMJ