Si bien la progresión de la inteligencia artificial (IA) en el diagnóstico por imágenes dentro del campo médico ha sido rápida, los factores que afectan las conclusiones diagnósticas de los radiólogos en la interpretación de imágenes asistida por IA no se han explorado lo suficiente.
Un nuevo estudio profundizó en estos factores influyentes, particularmente en relación con la detección de nódulos pulmonares malignos durante la lectura de radiografías de tórax asistida por IA. El estudio encontró que un algoritmo de IA con alta precisión diagnóstica puede mejorar el desempeño del radiólogo en la identificación de cánceres de pulmón en radiografías de tórax y aumentar la aceptación humana de las recomendaciones de IA.
En el estudio retrospectivo realizado por investigadores de la Universidad Nacional de Seúl (Seúl, Corea), 30 lectores, incluidos 20 radiólogos torácicos experimentados y 10 residentes de radiología, evaluaron 120 radiografías de tórax sin asistencia de IA. Estas radiografías incluyeron 60 imágenes de pacientes con cáncer de pulmón y 60 imágenes de control. Para la segunda sesión, se reevaluaron las mismas imágenes con la ayuda de una IA de alta o baja precisión. No se informó a los lectores que se utilizaron dos algoritmos de IA diferentes en el estudio.
La aplicación de una IA de alta precisión demostró una mejora más significativa en el rendimiento de detección de los lectores en comparación con una IA de baja precisión. Además, la IA de alta precisión condujo a alteraciones más frecuentes en las determinaciones de los lectores, un fenómeno conocido como susceptibilidad.
En comparación con la sesión de lectura inicial, los lectores ayudados por la IA de alta precisión diagnóstica en la segunda sesión exhibieron una mayor sensibilidad por lesión (0,63 frente a 0,53) y especificidad (0,94 frente a 0,88). Por el contrario, los lectores que usaron IA de precisión de diagnóstico baja no demostraron ninguna mejora entre las dos sesiones de lectura en términos de estas métricas.
Los hallazgos resaltan la importancia de emplear IA de alto rendimiento en el diagnóstico. Sin embargo, los investigadores han señalado que la definición de «IA de alto rendimiento diagnóstico» puede ser específica del contexto, variando según la tarea y el entorno clínico.
Por ejemplo, un modelo de IA capaz de detectar todas las anomalías en las radiografías de tórax puede parecer ideal, pero puede no ser valioso para reducir la carga de trabajo en las pruebas de detección masivas de tuberculosis pulmonar. Los investigadores tienen como objetivo ampliar su investigación de la colaboración humano-IA a otras anomalías en las radiografías de tórax y las imágenes de tomografía computarizada en el futuro.
«Nuestro estudio sugiere que la IA puede ayudar a los radiólogos, pero solo cuando el rendimiento de diagnóstico de la IA iguala o supera el del lector humano», dijo el autor principal del estudio, Chang Min Park, MD, Ph.D., del Departamento de Radiología y el Instituto de Medicina de Radiación en la Facultad de Medicina de la Universidad Nacional de Seúl.
«Por lo tanto, nuestro estudio sugiere que el uso clínicamente apropiado de la IA requiere tanto el desarrollo de modelos de IA de alto rendimiento para determinadas tareas como consideraciones sobre el entorno clínico relevante al que se aplicará esa IA».