banner
Centro de Noticias
Seguimiento postventa confiable

Segmentación del tejido fibroglandular en resonancia magnética mamaria mediante transformadores de visión: un método multi

Jun 12, 2024

Scientific Reports volumen 13, número de artículo: 14207 (2023) Citar este artículo

Detalles de métricas

La segmentación precisa y automática del tejido fibroglandular en el cribado por resonancia magnética mamaria es esencial para la cuantificación de la densidad mamaria y el realce parenquimatoso de fondo. En este estudio retrospectivo, desarrollamos y evaluamos una red neuronal basada en transformadores para la segmentación mamaria (TraBS) en datos de resonancia magnética multiinstitucional y comparamos su rendimiento con la red neuronal convolucional bien establecida nnUNet. TraBS y nnUNet fueron entrenados y probados en 200 exámenes de resonancia magnética mamaria internos y 40 externos utilizando segmentaciones manuales generadas por lectores humanos experimentados. El rendimiento de la segmentación se evaluó en términos de la puntuación Dice y la distancia superficial simétrica promedio. La puntuación de Dice para nnUNet fue más baja que para TraBS en el conjunto de pruebas interno (0,909 ± 0,069 versus 0,916 ± 0,067, P <0,001) y en el conjunto de pruebas externo (0,824 ± 0,144 versus 0,864 ± 0,081, P = 0,004). Además, la distancia superficial simétrica promedio fue mayor (= peor) para nnUNet que para TraBS en el conjunto de pruebas interno (0,657 ± 2,856 versus 0,548 ± 2,195, P = 0,001) y en el externo (0,727 ± 0,620 versus 0,584 ± 0,413, P = 0,03). Nuestro estudio demuestra que las redes basadas en transformadores mejoran la calidad de la segmentación del tejido fibroglandular en la resonancia magnética de mama en comparación con modelos convolucionales como nnUNet. Estos hallazgos podrían ayudar a mejorar la precisión de la densidad mamaria y la cuantificación del realce parenquimatoso en la detección por resonancia magnética mamaria.

El cáncer de mama es el tipo de cáncer más frecuente en la población femenina y representa la segunda causa de muerte en los Estados Unidos1 entre las mujeres. Las nuevas directrices para la detección del cáncer de mama recomiendan el uso de resonancia magnética en mujeres con tejido mamario denso2,3. Ya se han desarrollado herramientas basadas en el aprendizaje profundo para la evaluación de la densidad mamaria en mamografía4, pero todavía falta una evaluación automatizada consistente y confiable de la densidad mamaria (como la relación entre el tejido fibroglandular (FGT) y el volumen mamario) en exámenes de resonancia magnética. Además de la densidad mamaria, el realce parenquimatoso de fondo (BPE, por sus siglas en inglés), es decir, el realce del tejido fibroglandular, también ha surgido como un marcador prometedor para la detección temprana del cáncer de mama5,6; sin embargo, también falta una evaluación automatizada confiable del BPE. El desarrollo de un algoritmo de aprendizaje automático capaz de segmentar FGT es un primer paso importante hacia una cuantificación automática de la densidad mamaria y la BPE en los exámenes de resonancia magnética mamaria.

Varios estudios de investigación han investigado este problema entrenando redes neuronales convolucionales (CNN) en exámenes de resonancia magnética mamaria segmentados manualmente y evaluando su desempeño en conjuntos de pruebas de un solo centro7,8,9. El alto nivel de concordancia entre los mapas de segmentación generados por humanos y máquinas en todas estas publicaciones demuestra el potencial de las CNN. Sin embargo, existe un impedimento importante para la introducción generalizada de tales algoritmos: los exámenes de resonancia magnética no están estandarizados. Diferentes centros clínicos utilizan diversos protocolos y secuencias de resonancia magnética para el diagnóstico del cáncer de mama. Ninguno de los estudios que encontramos probó su arquitectura CNN en datos independientes que no pertenecían a la institución donde se desarrollaron los algoritmos.

Además, el desarrollo de modelos robustos para la segmentación de la RM mamaria es un desafío, especialmente en presencia de lesiones, cicatrices quirúrgicas e implantes mamarios10,11. La evaluación de modelos de segmentación para resonancia magnética mamaria en el contexto de estos posibles factores de confusión ha recibido poca atención. Estudios anteriores han excluido los implantes mamarios12,13 o han reconocido la dificultad de distinguir con precisión entre FGT sanos y patológicos14.

Los modelos basados ​​en transformadores han demostrado ser más robustos, generalizables y a prueba de ataques que las CNN en otras aplicaciones de análisis de imágenes médicas15,16. Han logrado resultados de última generación para el procesamiento del lenguaje natural17,18, principalmente debido a su capacidad para manejar dependencias a largo plazo y a un entrenamiento previo autosupervisado para tareas posteriores.

Por lo tanto, nuestro objetivo era desarrollar y probar un método de segmentación robusto y preciso basado en la arquitectura del transformador que pudiera generalizarse bien a datos multiinstitucionales.

Comparamos nuestro modelo de segmentación mamaria basado en transformadores (TraBS) con el modelo actual de última generación basado en CNN (nnUNet19) en conjuntos de datos de resonancia magnética mamaria internos y externos de la Universidad de Duke20. Nuestras hipótesis fueron que el nuevo modelo basado en transformadores supera el estado actual del arte y que se generaliza mejor a datos externos.

Este estudio incluyó dos conjuntos de datos. Se utilizó un conjunto de datos interno (UKA) para entrenar y probar TraBS y nnUNet. Se utilizó un segundo conjunto de datos externo (DUKE) para probar la generalización de ambos modelos. Probamos el rendimiento de segmentación de TraBS y nnUNet en términos de puntuación de Dice y distancia de superficie simétrica promedio (ASSD).

La puntuación de Dice cuantifica la superposición entre la segmentación automatizada y la verdad fundamental, con valores que van de 0 a 1, donde 1 representa una superposición perfecta.

La distancia promedio de superficie simétrica (ASSD) mide la distancia promedio entre las superficies de la verdad del terreno y la segmentación automatizada, donde 0 mm representa una alineación perfecta con la verdad del terreno.

El conjunto de datos de UKA incluyó a 200 pacientes femeninas, con una edad media de 56 ± 10 años (rango 19-91) y un peso medio de 75 ± 27 kg. El conjunto de datos de DUKE incluyó a 40 pacientes mujeres con una edad media de 53 ± 11 años (rango 22-90) y un peso medio de 76 ± 18 kg. En los conjuntos de datos de UKA y DUKE, 9 mujeres tenían implantes mamarios, mientras que en el conjunto de datos de DUKE, ninguna mujer tenía un implante mamario. El volumen y la densidad medios de FGT fueron 117 ± 91 mm3 y 18 ± 14% para el conjunto de datos UKA y 114 ± 61 mm3 y 12 ± 7% para el conjunto de datos DUKE, respectivamente.

nnUNet logró una puntuación Dice media de 0,909 ± 0,069 para la segmentación FGT en nuestro conjunto de datos interno; consulte la Tabla 1. Nuestro modelo TraBS logró una puntuación Dice media más alta de 0,916 ± 0,067, P <0,001.

TraBS también demostró una ASSD más baja (0,548 ± 2,195) que nnUNet (0,657 ± 2,856, P = 0,001), lo que indica que TraBS evalúa con mayor precisión los detalles más finos.

Por tendencia, el rendimiento de la segmentación medido por la puntuación Dice y ASSD fue menor para ambos modelos cuando los senos eran menos densos, es decir, cuando el volumen fraccional de FGT dentro del seno era menor, ver Fig. 1.

Coeficiente de similitud de dados (DSC) y distancia de superficie simétrica promedio (ASSD) entre las segmentaciones automatizadas y manuales para todas las arquitecturas de redes neuronales examinadas. Independientemente de la red neuronal utilizada, el DSC fue menor en los exámenes de mamas de baja densidad, mientras que la densidad mamaria no influyó en la ASSD.

Además de la evaluación cuantitativa, un radiólogo experto evaluó visualmente la calidad de la segmentación y descubrió que TraBS obtuvo mejores resultados en la captura tanto de la estructura general como de los detalles finos en comparación con nnUNet. Específicamente, TraBS fue mejor para diferenciar entre implantes mamarios y FGT y para distinguir entre lesiones y tejido mamario normal, como se muestra en la Fig. 2.

Ejemplos de exámenes de resonancia magnética del conjunto de datos interno de UKA. Las dos columnas situadas más a la izquierda muestran la resta con contraste mejorado y la imagen ponderada en T1 sin contraste. La tercera columna muestra la segmentación real realizada por los radiólogos y las dos columnas restantes muestran las segmentaciones realizadas por las redes neuronales. Las segmentaciones correctas se muestran en verde y las regiones etiquetadas incorrectamente en rojo. Las flechas azules indican regiones desafiantes, como lesiones (Paciente A y B) o implantes mamarios (Paciente C).

Para investigar cómo se relaciona el rendimiento de la segmentación con las mediciones clínicas utilizadas para evaluar los riesgos de los pacientes, como la densidad mamaria, examinamos la correlación entre dichas medidas cuando se calculan en función de la segmentación real y de la segmentación automatizada. Tanto nnUNet como TraBS demostraron una correlación casi perfecta con la densidad mamaria y el BPE derivados manualmente, como se muestra en la Tabla 1. Aunque las correlaciones fueron casi perfectas para ambos modelos, TraBS mostró una correlación de densidad más alta (ρ = 0,996 con un intervalo de confianza del 95 % [ 0,995, 0,997] frente a ρ = 0,995 [0,994, 0,996]; P = 0,11) y correlación BPE (ρ = 0,992 [0,990, 0,994] frente a ρ = 0,950 [0,939, 0,959]; P = 0,06).

La aplicación de los modelos a conjuntos de datos externos invisibles con diferentes protocolos de secuencia de resonancia magnética resultó en un rendimiento general más bajo (Tabla 2).

Sin embargo, TraBS aún funcionó mejor que nnUNet, logrando una puntuación Dice media de 0,864 ± 0,081 para el conjunto de datos DUKE, en comparación con 0,824 ± 0,144 (P = 0,004) para nnUNet. De manera similar, ASSD fue mayor (= peor) para nnUNet (0,727 ± 0,620) que para TraBS (0,584 ± 0,413, P = 0,034).

La inspección visual de las segmentaciones en los conjuntos de datos externos confirmó el rendimiento superior de TraBS, ya que fue más capaz de capturar detalles finos y la estructura general en comparación con nnUNet. En la Fig. 3 se muestran imágenes de muestra.

Ejemplos de exámenes de resonancia magnética del conjunto de datos externo DUKE. Las dos columnas situadas más a la izquierda muestran la resta con contraste mejorado y la imagen ponderada en T1 sin contraste. La tercera columna muestra la segmentación real realizada por los radiólogos y las dos columnas restantes muestran las segmentaciones realizadas por las redes neuronales. Las segmentaciones correctas se muestran en verde y las regiones etiquetadas incorrectamente en rojo. Las flechas azules indican regiones desafiantes, como lesiones (Paciente A y B) o implantes mamarios (Paciente C).

A pesar de la calidad de segmentación general limitada en el conjunto de datos externo de DUKE, tanto TraBS como nnUNet aún demostraron buenas correlaciones con las segmentaciones manuales para la densidad mamaria y BPE (Tabla 2). Sin embargo, TraBS logró una mayor correlación de densidad (ρ = 0,955 [0,931, 0,971] frente a ρ = 0,901 [0,849, 0,935]; P = 0,007) y correlación BPE (ρ = 0,987 [0,980, 0,992] frente a ρ = 0,979 [0,967, 0,987]; P = 0,24) que nnUNet.

En este estudio, proponemos una arquitectura de red novedosa, TraBS, para segmentar el tejido fibroglandular (FGT) en imágenes de resonancia magnética de mama. Demostramos que TraBS supera el estado del arte anterior en conjuntos de validación internos y externos. La densidad mamaria y el BPE son factores importantes para determinar el riesgo de cáncer de los pacientes. Por lo tanto, se necesitan métodos precisos y confiables para la extracción automatizada de marcadores cuantitativos como la densidad mamaria y el BPE. Nuestra investigación contribuye al campo en cuatro aspectos.

En primer lugar, todos los grupos que han aplicado redes neuronales en la segmentación FGT solo han evaluado sus algoritmos en conjuntos de pruebas internas, es decir, exámenes que son similares en apariencia a los exámenes en los que se entrenó el algoritmo; consulte la Tabla 3 para obtener una descripción general de investigaciones anteriores. Esta es una deficiencia que debe abordarse en vista de la gran cantidad de protocolos de escáneres de resonancia magnética que se encuentran actualmente en uso clínico. Abordamos esta brecha evaluando nuestro modelo TraBS propuesto en un conjunto de datos externo y demostramos que la nueva arquitectura basada en transformadores muestra un mejor rendimiento de generalización en comparación con nnUNet.

En segundo lugar, examinamos la puntuación de Dice en función de la densidad mamaria y encontramos que una densidad más baja de FGT da como resultado una puntuación de Dice más baja. Esto explica en parte la difusión de las puntuaciones Dice reportadas en la literatura (Tabla 3), ya que el conjunto de pruebas que se utiliza para la evaluación tiene un gran efecto en la métrica Dice: si los algoritmos de segmentación se prueban en exámenes de resonancia magnética mamaria con altas cantidades de FGT, Las puntuaciones de los dados tienden a ser más altas. Este es un hallazgo importante para estudios futuros y, por lo tanto, sugerimos que los trabajos futuros sobre la segmentación de FGT contengan un informe sobre la densidad media de FGT del conjunto de prueba o un gráfico similar a la Fig. 1.

En tercer lugar, ponemos a disposición del público las segmentaciones manuales de los datos de DUKE para que sirvan como estándar de referencia para futuras evaluaciones. Esto puede contribuir potencialmente a evaluaciones externas independientes de algoritmos de segmentación para resonancia magnética mamaria.

Finalmente, demostramos el mejor rendimiento general de nuestro modelo TraBS basado en transformador en comparación con la arquitectura de última generación anterior para la segmentación del tejido mamario en todas las métricas de rendimiento seleccionadas. Ponemos nuestro código a disposición del público, junto con el modelo capacitado, para avanzar aún más en el campo y cerrar la brecha hacia la aplicación clínica.

Nuestro trabajo tiene limitaciones relacionadas con el hecho de que la obtención de segmentaciones manuales requiere mucho tiempo: primero, aunque evaluamos el modelo con datos de prueba externos, no incluimos ningún dato de entrenamiento externo. En consecuencia, el rendimiento de la segmentación disminuye cuando se aplica a datos externos y, aunque TraBS es más robusto al cambio de dominio, su rendimiento podría aumentar si se incluyen datos multidominio adicionales durante el entrenamiento. Los estudios futuros deberían centrarse en esto para hacer que el rendimiento de la segmentación sea más sólido de modo que el modelo pueda aplicarse en múltiples centros. La tarea es particularmente desafiante porque los protocolos de resonancia magnética mamaria difieren sustancialmente entre instituciones, incluida la elección de secuencias, la supresión de grasa y la orientación de la exploración. En segundo lugar, incluimos sólo 40 exámenes externos como casos de prueba de una sola institución externa. Aunque esto representa un progreso en comparación con investigaciones anteriores, la base de datos para un estudio multiinstitucional amplio puede y debe ampliarse para proporcionar una perspectiva global sobre el desempeño de los grupos de pacientes subrepresentados. En tercer lugar, nuestros datos representaron sólo una pequeña muestra de todos los escáneres y protocolos de resonancia magnética posibles. Esto puede limitar la aplicabilidad directa de la segmentación automática de FGT y debe investigarse para configuraciones específicas de resonancia magnética en estudios adicionales. En cuarto lugar, no investigamos la variabilidad entre evaluadores debido a la falta de múltiples segmentaciones por parte de múltiples lectores en los mismos exámenes. Esto debería hacerse mediante estudios futuros para evaluar la precisión de las segmentaciones generadas por humanos que sirvieron como verdad básica.

En conclusión, nuestra red TraBS propuesta demuestra un rendimiento excelente en la segmentación de FGT en imágenes de resonancia magnética de mama. Esto allana el camino para la segmentación FGT automatizada de rutina y la cuantificación automática de la densidad mamaria y el BPE.

El Comité de Ética Médica de la Facultad de Medicina de la Universidad RWTH Aachen aprobó el estudio (EK028/19) y renunció a la necesidad de consentimiento informado. Todos los métodos se llevaron a cabo de acuerdo con la Declaración de Helsinki.

En este estudio retrospectivo, se utilizaron dos conjuntos de datos de resonancia magnética mamaria a los que nos referiremos como "UKA" y "DUKE". En primer lugar, la UKA se recolectó entre 2010 y 2019 en el Hospital Universitario de Aquisgrán, Alemania21. UKA comprende un total de 9751 exámenes de resonancia magnética mamaria de 5086 mujeres. Separamos los exámenes en dos subconjuntos, que probablemente incluían exámenes malignos o benignos según las puntuaciones BI-RADS. Entre ambos conjuntos, se eligieron aleatoriamente un total de 200 exámenes de 200 mujeres, que comprendían 104 carcinomas, 55 fibroadenomas y 41 exámenes sin lesiones. La resonancia magnética dinámica con contraste (DCE) de las mamas se realizó de acuerdo con un protocolo estandarizado22 en un equipo de 1,5 T (Achieva e Ingenia; Philips Medical Systems) con una bobina de superficie de cuatro elementos de doble mama (Invivo). Se utilizaron dos paletas para inmovilizar la mama en dirección craneocaudal (Noras). Consulte la Tabla 4 para obtener una descripción detallada de los parámetros de adquisición.

En segundo lugar, DUKE se recopiló entre 2000 y 2014 en el Hospital Duke, EE. UU., y está disponible públicamente20. Los 922 casos tienen cáncer de mama invasivo confirmado por biopsia y fueron adquiridos utilizando un escáner de 1,5 Tesla o 3,0 Tesla de General Electric o Siemens. El protocolo de resonancia magnética consistió en una secuencia ponderada en T1 con supresión grasa (una exploración previa al contraste y cuatro poscontraste) y una secuencia ponderada en T1 sin supresión grasa. Para la evaluación, se seleccionaron aleatoriamente 40 exámenes y se segmentaron manualmente como se describe a continuación.

Tanto el volumen total de la mama como el tejido fibroglandular se segmentaron mediante FM y EK utilizando el software ITK-SNAP23. Las segmentaciones fueron revisadas por LH y VR, dos radiólogos con seis y tres años de experiencia en resonancia magnética mamaria. Cualquier discrepancia entre los evaluadores se discutió y resolvió por consenso. Se generaron máscaras de segmentación para el subconjunto UKA de 200 exámenes de resonancia magnética y 40 casos de DUKE seleccionados aleatoriamente, respectivamente. El contorno mamario se definió como el volumen de tejido ubicado anterior al músculo pectoral. En las figuras complementarias se muestran ejemplos de segmentaciones manuales. S1 y S2.

El proceso de segmentación comprendió dos etapas consecutivas. En la primera etapa se segmentó toda la mama, mientras que en la segunda etapa solo se segmentó el FGT (Fig. 4). En ambas etapas, fue posible el uso de una red neuronal; sin embargo, las segmentaciones manuales (verdad sobre el terreno) se utilizaron en la primera etapa con el motivo de que queremos comparar las arquitecturas de red solo para la segmentación FGT.

Ilustración del marco de segmentación. El marco se entrenó con datos de UKA. La primera red neuronal utilizó secuencias ponderadas en T1 y T2 no mejoradas y sin supresión de grasa para segmentar toda la mama. Esta segmentación se utilizó posteriormente para recortar la imagen de resta de la secuencia potenciada en T1 con contraste, así como de las secuencias no mejoradas. A partir de las imágenes recortadas, la segunda red neuronal creó una máscara de segmentación del tejido fibroglandular. Para la inferencia de máscaras de segmentación mamaria completa a partir del conjunto de datos DUKE, solo se utilizaron secuencias ponderadas en T1 no saturadas de grasa como entradas para la primera red neuronal, ya que las secuencias ponderadas en T2 solo estaban disponibles para el conjunto de datos UKA. Tenga en cuenta que las redes procesaron todas las entradas como volúmenes 3D.

Para la segunda etapa del proceso de segmentación, se utilizaron las máscaras de segmentación de la primera etapa para crear imágenes recortadas de los senos izquierdo y derecho. Las imágenes no mejoradas y con contraste se apilaron a lo largo de la dimensión del canal y posteriormente ambos lados del seno se alimentaron a la red neuronal. Las distribuciones de intensidad de todas las imágenes se normalizaron con puntuación z (media = 0, desviación estándar = 1). El proceso de segmentación se implementó con PyTorch24 en una computadora equipada con una NVIDIA GeForce RTX 3090.

A continuación, nos referiremos a nuestro nuevo modelo basado en transformador como TraBS (SwinTransformer para la segmentación del tejido mamario fibroglandular). TraBS se construyó sobre SwinUNETR25 con 2, 4 y 8 cabezas y 24, 48, 96 y 192 características de incrustación en las etapas 1 a 4. Inspirándonos en nnUNet para manejar resoluciones típicamente no isotópicas en imágenes de resonancia magnética, reemplazamos el uniforme 2 Tamaños de parche × 2 × 2 y granos de 3 × 3 × 3 en las dos capas superiores con parches no isotrópicos de 1 × 2 × 2 y granos de 1 × 3 × 3. Además, se agregaron convoluciones 1 × 1 × 1 para supervisar las capas más profundas (Fig. 5).

Ilustración de la arquitectura del modelo TraBS propuesta. Se utilizaron núcleos y zancadas no isotrópicos en las dos primeras etapas para que la profundidad permaneciera constante. Se agregó supervisión profunda para las capas de menor resolución. Los cambios con respecto al SwinUNETR original se han marcado en rojo. Consulte la publicación SwinUNETR25 para obtener una explicación detallada.

Empleamos el nnUNet19 de última generación como base. El modelo tenía dos capas de agrupación máxima con zancadas de 1 × 2 × 2 y núcleos de 1 × 3 × 3, seguidas de dos capas de agrupación máxima con zancadas de 2 × 2 × 2 y núcleos de 3 × 3 × 3. Esto fue motivado por una publicación anterior sobre segmentación FGT7.

El subconjunto de UKA se dividió aleatoriamente en conjuntos de entrenamiento y prueba mediante una validación cruzada quíntuple. El conjunto de entrenamiento dentro de cada pliegue se subdividió en un conjunto de entrenamiento dedicado (80%) y un conjunto de validación (20%). El entrenamiento de los modelos de segmentación FGT se realizó para cada uno de los cinco pliegues con las máscaras de segmentación manual como verdad básica. Se utilizó AdamW con una tasa de aprendizaje de 0,0001 para optimizar la suma de DiceLoss y CrossEntropy, siguiendo recomendaciones previas para la segmentación de imágenes médicas26. La función de pérdida se calculó adicionalmente en las resoluciones más bajas de la ruta del decodificador (Supervisión multiescala) en el modelo TraBS, siguiendo las implementaciones de nnUNet. Al utilizar la detención temprana, el entrenamiento de cada modelo se detuvo tan pronto como la pérdida dentro del conjunto de validación no disminuyó dentro de 30 épocas.

Para aumentar la diversidad del conjunto de entrenamiento y así evitar el sobreajuste, se aplicaron las siguientes operaciones de aumento de datos del marco TorchIO27: inversión, transformación afín, efecto fantasma, ruido gaussiano, desenfoque, campo de sesgo y aumento gamma. Durante el entrenamiento, se seleccionó una región aleatoria de 256 × 256 × 32 vóxeles dentro de los senos izquierdo y derecho. Durante la inferencia se utilizó una ventana deslizante de 256 × 256 × 32 vóxeles con una superposición del 50%. Se utilizó un cambio aleatorio a lo largo de todos los ejes como aumento del tiempo de prueba. El código fuente está disponible públicamente en https://github.com/mueller-franzes/TraBS.

Realizamos una validación cruzada quíntuple en el conjunto de datos interno de UKA para examinar el rendimiento de los modelos en datos de prueba invisibles. Para el conjunto de datos externo de DUKE, se aplicó un conjunto de cinco modelos de segmentación FGT del entrenamiento de validación cruzada. Se utilizó la votación mayoritaria para combinar las cinco máscaras de segmentación. El rendimiento de la segmentación se evaluó calculando el coeficiente de similitud de dados (DSC)28 y la distancia superficial simétrica promedio (ASSD)29. La densidad mamaria y el BPE son métricas clínicamente relevantes relacionadas con el riesgo de cáncer de mama5,6. Su valoración cuantitativa depende de la segmentación del FGT. Por lo tanto, medimos estas dos métricas tanto para la segmentación manual como para la automática y calculamos los coeficientes de correlación de Pearson entre las métricas derivadas manualmente y automáticamente. Tenga en cuenta que el BPE se definió como el cambio porcentual del FGT entre la imagen posterior y previa al contraste. Se empleó bootstrapping para calcular los intervalos de confianza y se utilizaron pruebas de permutación para calcular los valores p. Siguiendo la guía de Amrhein et al.30, no establecimos umbrales de significación estadística al interpretar los valores de p.

El conjunto de datos de DUKE analizado durante el estudio actual está disponible en The Cancer Imaging Archive, https://doi.org/10.7937/TCIA.e3sv-re93. El conjunto de datos de UKA analizado durante el presente estudio está disponible del autor correspondiente previa solicitud razonable.

Siegel, RL, Miller, KD, Fuchs, HE y Jemal, A. Estadísticas del cáncer, 2022. CA Cancer J. Clin. 72, 7–33 (2022).

Artículo PubMed Google Scholar

Oeffinger, KC y cols. Detección de cáncer de mama para mujeres con riesgo promedio: actualización de las directrices de 2015 de la sociedad estadounidense contra el cáncer. JAMA 314, 1599-1614 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Mann, RM y cols. Cribado del cáncer de mama en mujeres con mamas extremadamente densas, recomendaciones de la Sociedad Europea de Imagenología Mamaria (EUSOBI). EUR. Radiol. 32, 4036–4045 (2022).

Artículo PubMed PubMed Central Google Scholar

Magni, V. y col. Desarrollo y validación de una herramienta de clasificación de la densidad mamaria mamográfica impulsada por IA y basada en el consenso de los radiólogos. Radiol. Artif. Intel. 4, e210199 (2022).

Artículo PubMed PubMed Central Google Scholar

Thompson, CM y cols. La asociación del realce parenquimatoso de fondo en la resonancia magnética de mama con el cáncer de mama: una revisión sistemática y un metanálisis. Radiología 292, 552–561 (2019).

Artículo PubMed Google Scholar

Sindi, R., Sá Dos Reis, C., Bennett, C., Stevenson, G. & Sun, Z. Mediciones cuantitativas de la densidad mamaria mediante resonancia magnética: una revisión sistemática y un metanálisis. JCM 8, 745 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Huo, L. y col. Segmentación de todo el tejido mamario y fibroglandular utilizando nnU-Net en imágenes de resonancia magnética mejoradas con contraste dinámico. Magn. Reson. Imágenes 82, 31–41 (2021).

Artículo CAS PubMed Google Scholar

Dalmış, MU et al. Uso del aprendizaje profundo para segmentar tejido mamario y fibroglandular en volúmenes de resonancia magnética. Medicina. Física. 44, 533–546 (2017).

Artículo PubMed Google Scholar

Zhang, Y. et al. Segmentación automática de tejido mamario y fibroglandular en resonancia magnética mamaria mediante aprendizaje profundo mediante una red neuronal residual totalmente convolucional U-net. Acad. Radiol. 26, 1526-1535 (2019).

Artículo PubMed PubMed Central Google Scholar

Liao, GJ y cols. Realce parenquimatoso de fondo en la resonancia magnética de mama: una revisión exhaustiva. J. Magn. Reson. Imágenes 51, 43–61 (2020).

Artículo PubMed Google Scholar

Hirsch, L. y col. Rendimiento a nivel de radiólogo mediante el uso de aprendizaje profundo para la segmentación de cánceres de mama en exploraciones por resonancia magnética. Radiol. Artif. Intel. 4, e200231 (2022).

Artículo PubMed Google Scholar

Nam, Y., Park, GE, Kang, J. y Kim, SH Evaluación totalmente automática del realce parenquimatoso de fondo en la resonancia magnética mamaria utilizando modelos de aprendizaje automático. J. Magn. Reson. Imágenes 53, 818–826 (2021).

Artículo PubMed Google Scholar

Ying, J. y col. Dos estrategias de segmentación mamaria completa en 3D basadas en datos totalmente automatizadas en resonancia magnética para densidad mamaria basada en resonancia magnética utilizando registro de imágenes y U-Net con un enfoque en la reproducibilidad. Vis. Computadora. Indiana Biomed. Artículo 5, 25 (2022).

Artículo PubMed PubMed Central Google Scholar

Hu, X., Jiang, L., You, C. y Gu, Y. El tejido fibroglandular y el realce parenquimatoso de fondo en la resonancia magnética de mama se correlacionan con el cáncer de mama. Frente. Oncol. 11, 616716 (2021).

Artículo PubMed PubMed Central Google Scholar

Ghaffari Laleh, N. et al. Ataques adversarios y robustez adversarial en patología computacional. Nat. Comunitario. 13, 5711 (2022).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Tang, Y. et al. Preentrenamiento autosupervisado de transformadores swin para análisis de imágenes médicas 3D. en 2022 Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones (CVPR), 20698–20708 (IEEE, 2022). https://doi.org/10.1109/CVPR52688.2022.02007.

Devlin, J., Chang, M.-W., Lee, K. y Toutanova, K. BERT: Entrenamiento previo de transformadores bidireccionales profundos para la comprensión del lenguaje. Arxiv https://doi.org/10.48550/arXiv.1810.04805 (2019).

Artículo de Google Scholar

Radford, A., Narasimhan, K., Salimans, T. y Sutskever, I. Mejora de la comprensión del lenguaje mediante formación previa generativa (Springer, 2022).

Google Académico

Isensee, F., Jaeger, PF, Kohl, SAA, Petersen, J. y Maier-Hein, KH nnU-Net: un método autoconfigurable para la segmentación de imágenes biomédicas basada en aprendizaje profundo. Nat. Métodos 18, 203–211 (2021).

Artículo CAS PubMed Google Scholar

Saha, A. y col. Imágenes de resonancia magnética dinámica con contraste de pacientes con cáncer de mama con localización de tumores. Nat. Métodos https://doi.org/10.7937/TCIA.E3SV-RE93 (2022).

Artículo de Google Scholar

Müller-Franzes, G. et al. Uso del aprendizaje automático para reducir la necesidad de agentes de contraste en la resonancia magnética de mama mediante imágenes sintéticas. Radiología 1, 222211. https://doi.org/10.1148/radiol.222211 (2023).

Artículo de Google Scholar

Kuhl, CK y cols. Pruebas complementarias de imágenes por resonancia magnética de mama en mujeres con riesgo promedio de cáncer de mama. Radiología 283, 361–370 (2017).

Artículo PubMed Google Scholar

Yushkevich, PA y cols. Segmentación activa de contornos 3D guiada por el usuario de estructuras anatómicas: eficiencia y confiabilidad significativamente mejoradas. Neuroimagen 31, 1116–1128 (2006).

Artículo PubMed Google Scholar

Paszke, A. et al. PyTorch: un estilo imperativo, aprendizaje profundo de alto rendimiento. Biblioteca https://doi.org/10.48550/ARXIV.1912.01703 (2019).

Artículo de Google Scholar

Hatamizadeh, A. et al. Swin UNETR: Transformadores Swin para la segmentación semántica de tumores cerebrales en imágenes de resonancia magnética. (Arxiv, 2022).

Ma, J. y col. Odisea de pérdidas en la segmentación de imágenes médicas. Medicina. Imagen Anal. 71, 102035 (2021).

Artículo PubMed Google Scholar

Pérez-García, F., Sparks, R. & Ourselin, S. TorchIO: Una biblioteca de Python para carga, preprocesamiento, aumento y muestreo basado en parches eficientes de imágenes médicas en aprendizaje profundo. Arxiv https://doi.org/10.48550/ARXIV.2003.04696 (2020).

Artículo de Google Scholar

Zou, KH y cols. Validación estadística de la calidad de la segmentación de imágenes basada en un índice de superposición espacial1. Acad. Radiol. 11, 178–189 (2004).

Artículo PubMed PubMed Central Google Scholar

Nai, Y.-H. et al. Comparación de métricas para la evaluación de segmentaciones médicas utilizando un conjunto de datos de resonancia magnética de próstata. Computadora. Biol. Medicina. 134, 104497 (2021).

Artículo PubMed Google Scholar

Amrhein, V., Greenland, S. y McShane, B. Los científicos se rebelan contra la significación estadística. Naturaleza 567, 305–307 (2019).

Artículo ADS CAS PubMed Google Scholar

Ivanovska, T. y col. Un marco de aprendizaje profundo para el análisis eficiente del volumen mamario y el tejido fibroglandular utilizando datos de resonancia magnética con artefactos potentes. En t. J. COCHES 14, 1627–1633 (2019).

Artículo de Google Scholar

Ma, X. et al. Segmentación automatizada del tejido fibroglandular en resonancia magnética de mama utilizando redes generativas adversarias. Física. Medicina. Biol. 65, 105006 (2020).

Artículo PubMed Google Scholar

Zhang, Y. et al. Desarrollo del método de segmentación de la densidad mamaria U-net para imágenes de resonancia magnética con satélites grasos mediante aprendizaje por transferencia basado en un modelo sin satélites grasos. J. Dígito. Imágenes 34, 877–887 (2021).

Artículo PubMed PubMed Central Google Scholar

Ha, R. et al. Método de red neuronal convolucional totalmente automatizado para la cuantificación del tejido fibroglandular de la resonancia magnética mamaria y el realce parenquimatoso de fondo. J. Dígito. Imágenes 32, 141-147 (2019).

Artículo PubMed Google Scholar

Descargar referencias

Este proyecto de investigación fue apoyado por la Unión Europea (ODELIA—Open Consortium for Decentralized Medical Artificial Intelligence, 101057091) y por el Programa Acelerador de Investigación Aplicada de NVIDIA.

Financiamiento de Acceso Abierto habilitado y organizado por Projekt DEAL.

Departamento de Radiología Diagnóstica e Intervencionista, Hospital Universitario RWTH, Aquisgrán, Alemania

Gustav Muller-Franzes, Fritz Muller-Franzes, Luisa Huck, Vanessa Raaff, Eva Kemmer, Firas Khader, Soroosh Tayebi Arasteh, Teresa Lemainque, Sven Nebelung, Christiane Kuhl y Daniel Truhn

Centro Else Kroener Fresenius para la Salud Digital, Universidad Técnica, Dresde, Alemania

Jacob Nikolas Kather

Departamento de Medicina III, Hospital Universitario RWTH, Aquisgrán, Alemania

Jacob Nikolas Kather

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

GM-F. y DT concibió los experimentos, GM-F. y DT realizaron los experimentos, FM-F., EK, LH y VR anotan los datos, GM-F., FK, SA, TL y DT analizaron los resultados. GM-F. escribió el manuscrito, JK, SN y CK supervisaron el proyecto. Todos los autores revisaron el manuscrito.

Correspondencia a Daniel Truhn.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Müller-Franzes, G., Müller-Franzes, F., Huck, L. et al. Segmentación del tejido fibroglandular en resonancia magnética mamaria utilizando transformadores de visión: una evaluación multiinstitucional. Representante científico 13, 14207 (2023). https://doi.org/10.1038/s41598-023-41331-x

Descargar cita

Recibido: 19 de abril de 2023

Aceptado: 24 de agosto de 2023

Publicado: 30 de agosto de 2023

DOI: https://doi.org/10.1038/s41598-023-41331-x

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.