AbstractoAntecedentes El objetivo de la Inteligencia Artificial enCicatrización renal(AIRS) tiene como objetivo desarrollar herramientas de aprendizaje automático para la cuantificación no invasiva defibrosis renalde exploraciones de imágenes. Métodos Realizamos un análisis retrospectivo de pacientes que se sometieron a una o más tomografías computarizadas (TC) abdominales dentro de los 6 meses posteriores a unbiopsia de riñón. La cohorte final abarcó 152 tomografías computarizadas de 92 pacientes, que incluían imágenes de 300 riñones nativos y 76trasplante de riñones. Dos convolucionales diferentesRedes neuronales(clasificadores a nivel de corte y a nivel de vóxel) se probaron para diferenciar enfermedades graves de leves/moderadas.fibrosis renal($50% versus 50%).Fibrosis intersticialy puntuaciones de atrofia tubular debiopsia de riñónLos informes se utilizaron como verdad sobre el terreno. Resultados Los dos modelos de aprendizaje automático demostraron un valor predictivo positivo similar ({{0}}.886 frente a 0.935) y precisión (0.831 frente a 0,879). Conclusiones En resumen, los algoritmos de aprendizaje automático son una herramienta de diagnóstico no invasiva prometedora paracuantificar la fibrosis renala partir de tomografías computarizadas. La utilidad clínica de estas herramientas de predicción, en términos de evitar la biopsia renal y los riesgos de hemorragia asociados en pacientes con fibrosis grave, aún debe validarse en ensayos clínicos prospectivos.

¿CUÁNTO TIEMPO TARDA EN QUE CISTANCHE FUNCIONE PARA LOS PACIENTES RENALES?
Introducción
La biopsia renal percutánea guiada por ecografía sigue siendo el estándar de atención cuando se necesita el diagnóstico histológico para guiar el tratamiento de la proteinuria, la hematuria microscópica, el rechazo de trasplantes o la disfunción renal inexplicable (1,2). El grado de fibrosis renal o la gravedad de la ERC a menudo se desconoce en el momento de la biopsia renal (3). Una biopsia de riñón que revela fibrosis grave (0,50%) puede aclarar el diagnóstico de la enfermedad, pero es poco probable que cambie el tratamiento clínico y coloca a los pacientes en riesgo de sufrir hemorragia relacionada con el procedimiento (4). Las complicaciones posteriores a la biopsia varían desde hematuria transitoria hasta hemorragia potencialmente mortal y se correlacionan con factores de riesgo que incluyen presión arterial elevada, edad avanzada, anemia, recuento bajo de plaquetas, función renal reducida y anomalías de la hemostasia (5). Un metanálisis reciente de 118064 biopsias de riñón guiadas por ultrasonido informó tasas de incidencia de transfusiones de sangre, intervención angiográfica y muerte del 2%, 0,3% y 0,06%, respectivamente (6).

Evaluar la gravedad de la ERC es fundamental al considerar los riesgos y beneficios de una biopsia de riñón, pero las herramientas no invasivas para evaluar el grado de fibrosis están poco desarrolladas (7). Los estudios que exploraron técnicas de ultrasonido (incluidas imágenes de velocidad de onda de corte, elastografía transitoria, elastografía en tiempo real, ecografía Doppler y deformación corticomedular por ultrasonido) han observado una correlación inconsistente con el grado de fibrosis en la histología renal (3,8,9). Además, estos métodos dependen en gran medida de factores externos, como la presión arterial, el peso de los riñones, el peso corporal y la fuerza del transductor aplicada, sin mencionar la alta variabilidad intra e interobservador (3). Un informe reciente encontró una estrecha correlación entretamaño del riñón determinado por ecografía con función renal estimada (eGFR) pero no evaluadoriñónfibrosis(10). Kirpalani et al. informaron que la elastografía por imágenes por resonancia magnética era prometedora en términos de correlacionar las puntuaciones de rigidez con la fibrosis renal (11), pero no exploraron las herramientas de aprendizaje automático como medio para optimizar la precisión predictiva.
La tomografía computarizada (TC) permite obtener imágenes de alta resolución del tejido renal con una exposición mínima a la radiación del paciente (7). Tecnología de aprendizaje automático en combinaciónLa combinación con imágenes por TC es una vía prometedora para los noevaluación invasiva del riñónfibrosis, en lugar del actualestándar de atención histológica. Aprendizaje profundo convolucionalLas redes neuronales (CNN) son una nueva forma de aprendizaje automático.ing, que puede aislar patrones relevantes de supatología, imágenes u otros datos clínicos útiles para la enfermedad
caracterización (12,13). La tecnología CNN para diagnóstico se ha explorado en una variedad de entornos, desde hemorragia intracraneal y cáncer hasta neumonía yapendicitis (14-17).
El objetivo del estudio Artificial Intelligence in Renal Scarring (AIRS) es desarrollar herramientas CNN para cuantificar la fibrosis renal como una alternativa de diagnóstico asistido por ordenador a la biopsia renal. Se entrenaron dos algoritmos CNN (clasificadores a nivel de corte y a nivel de vóxel) para analizar imágenes de TC de riñones nativos y trasplantados para clasificar el grado de fibrosis, basándose en puntuaciones de fibrosis reales de biopsias de riñón en los mismos pacientes. En este análisis piloto, nos centramos en delimitar la fibrosis leve/moderada versus grave (<50% versus $50%) como una dicotomía clínicamente relevante que puede ser útil para un nefrólogo que esté considerando una biopsia de riñón para su paciente. Demostramos que los algoritmos de CNN pueden diferenciar la fibrosis renal grave de la leve/moderada con un alto grado de precisión.
Materiales y métodos
Base de datos de pacientes Este fue un análisis retrospectivo de biopsias de riñón realizadas en el Centro Médico Irvine de la Universidad de California entre 2014 y 2019. Identificamos pacientes con tomografías computarizadas abdominales de $1 completadas dentro de los 6 meses posteriores a la biopsia de riñón. Después de la evaluación inicial del sistema de registros médicos, 42 pacientes sometidos a imágenes fueron excluidos por las siguientes razones: tomografía computarizada realizada fuera del período de inclusión (0,6 meses desde la fecha de la biopsia, n53); resonancia magnética abdominal pero no se encontró TC en el sistema (n56); los pacientes se saltaron inadvertidamente el proceso de anotación (n52); riñones nativos no segmentados en un paciente trasplantado (n51); escaneo de baja calidad con artefacto de hardware (n51); y estudios de imágenes externos que no se almacenaron en los archivos de imágenes a largo plazo (n529). Se descargaron las 152 tomografías computarizadas restantes de 92 pacientes y se extrajo el volumen reconstruido del tejido blando axial para su posterior análisis. La mayoría de las tomografías computarizadas (79%) se realizaron sin contraste intravenoso; Se realizaron 129 exploraciones en un escáner Philips, 22 en un escáner Siemens y una en un escáner GE Medical Systems.
Un patólogo (JEZ) revisó una selección aleatoria de pacientes para confirmar que el grado de fibrosis estaba documentado con precisión en los informes de biopsia de riñón. En pacientes discordantes, un segundo patólogo revisó las diapositivas para determinar la verdad sobre el terreno (ver Agradecimientos). El grado real de fibrosis renal a partir de los informes de biopsia se trató como un resultado binario: leve/moderado versus grave (fibrosis intersticial y atrofia tubular, 50% versus 50%). Los riñones nativos en las tomografías computarizadas de pacientes trasplantados se calificaron automáticamente como fibrosis grave. Los datos demográficos y las condiciones comórbidas se compilaron en una base de datos REDCap y se accedió a las imágenes de TC como se describe a continuación. Todos los procedimientos de investigación fueron aprobados por la Junta de Revisión Institucional de Irvine de la Universidad de California.

Anotación
Las tomografías computarizadas se transfirieron desde el sistema de comunicación y archivo de imágenes de nuestro hospital a una base de datos interna segura. Se utilizó una herramienta de anotación personalizada basada en web para crear máscaras binarias tridimensionales reales correspondientes a los riñones derecho e izquierdo nativos, y a cualquier trasplante renal, si estuviera presente. La herramienta de anotación se implementó como una simple utilidad de pincel sin ningún umbral ni funcionalidad avanzada de contorno. Dos estudiantes investigadores (HRT, KAPR) actuaron como anotadores principales y, posteriormente, un radiólogo senior (PDC) revisó cada paciente y perfeccionó las anotaciones de las regiones de interés cuando fue necesario.
Preprocesamiento de imágenes
Utilizando las máscaras de volumen de riñón anotadas como plantilla, cada riñón se recortó y se volvió a muestrear a un volumen de vóxel isotrópico 96 3 96396. Esta ópera de remuestreoSe requirió una modificación para garantizar que todas las entradas del modelo tuvieran el mismo tamaño de matriz y para adaptarse a las limitaciones de la memoria de la unidad de procesamiento de gráficos. Dado que los volúmenes eranrecortadas por primera vez en los riñones derecho e izquierdo, y que los riñones constituyen sólo una pequeña porción del volumen de TC original, los tamaños de vóxeles remuestreados finales fueron similares en resoluciónsolución a los datos originales. Luego, cada volumen recortado se normalizó recortando todos los valores de vóxel en un rango de 2150 a 250 unidades Hounsfield y se escaló en un factor de 1:50. CualquierUn solo examen en este conjunto de datos puede contener hasta tres riñones recortados individuales utilizados para el entrenamiento de algoritmos: (nativo) izquierdo, (nativo) derecho y trasplante. Para cualquier niño en particularney, se utilizó un total de 96 imágenes bidimensionales (2D) (de tamaño 96396) para el entrenamiento.
Enfoque de CNN
Se probaron y compararon dos redes CNN 2D personalizadas diferentes para diferenciar la fibrosis renal grave de la leve/moderada. El primer algoritmo es un estándar global.Clasificador CNN corte por corte, diseñado para predecir una de tres categorías mutuamente excluyentes para cada imagen 2D: sin riñón, fibrosis leve/moderada y fibrosis grave. ElEl segundo algoritmo es un clasificador CNN a nivel de píxel implementado a través de una arquitectura U-Net totalmente convolucional para realizar segmentación y clasificación simultáneas. En
En ambos modelos, la clasificación final ignora cortes o vóxeles sin riñones, y se agrega una regla de mayoría en las predicciones restantes. Ambos algoritmos están implementados.utilizando la arquitectura de red de compresión y excitación de última generación, el modelo de mayor rendimiento del ImageNet Large Scale Visual Recognition Challenge en 2017 (18).El enfoque de red de compresión y excitación permite a las redes recalibrar de forma adaptativa las respuestas de características de los canales en función de diferentes entradas del modelo mediante el aprendizaje.
interdependencias entre canales (Figura 1).

Figura 1.|Mapas de calor de predicción generados por el algoritmo de aprendizaje profundo que identifican áreas de fibrosis "grave" sospechosa dentro del riñón. De izquierda a derecha, se muestran riñones con fibrosis normal a severa con grados progresivos de parénquima fibrótico estimado. Las predicciones normalizadas medias finales de softmax para todo el riñón se muestran en la fila inferior, y van desde 0.0 a 0.2; 0.2–0.4;{{0}}.4–0.6; 0.6–0.8; y 0.8–1,0.
Clasificador global porción por porción
El clasificador global de CNN es una arquitectura personalizada derivada de VGG implementada con módulos de excitación comprimidos en cada capa. La entrada del modelo es un único segmento 2D (96396)y la salida del modelo es un vector logit de tres elementos que representa una predicción de tres clases. La CNN consta de cuatro bloques convolucionales, donde cada bloque se define como un 333convolución, normalización por lotes y ReLU se repitieron tres veces en total. El submuestreo se realiza al final de cada bloque a través de una convolución con un paso de dos. Después
Cuatro bloques convolucionales (12 capas), el mapa de características final se aplana y se utiliza como entrada en una única capa completamente conectada.

Clasificador de nivel de vóxel
El clasificador CNN a nivel de vóxel es una arquitectura personalizada derivada de U-Net implementada con módulos de excitación de compresión en cada capa (19). La entrada del modelo es un único segmento 2D (96396) y la salida del modelo es una única máscara de segmentación 2D (96396) con una predicción de tres clases en cada ubicación de vóxel. La CNN consta de cuatro bloques convolucionales que se contraen, donde cada bloque se define como una convolución 333, normalización por lotes y Leaky ReLU repetido tres veces en total. El submuestreo se realiza al final de cada bloque a través de una convolución con un paso de dos. Después de cuatro bloques convolucionales (12 capas), las operaciones se invierten a través de una arquitectura de red idéntica, con la sustitución de convoluciones zancadas (sub-muestreo) con transposiciones convolucionales (muestreo ascendente).
Implementación de redes neuronales
Se utiliza una función de pérdida de entropía cruzada softmax para optimizar ambos modelos. La optimización se realizó utilizando la técnica de Adam (20) con tasas de caída exponencial, b1 y b2, establecidasa {{0}}.9 y 0,999, respectivamente. La tasa de aprendizaje se establece en 131023. El tamaño del lote se establece en ocho, con un total de 25000 iteraciones de entrenamiento. La normalización de Xavier se utiliza para inicializar.las pesas antes del entrenamiento (21). El código del algoritmo se escribió en Python 3.6, la biblioteca TensorFlow 2.1.0 y la biblioteca Keras 1.0.8. La red está entrenada en nuestro grupo interno de unidades de procesamiento de gráficos, que contiene 48 Nvidia GeForce RTX 2080 Ti y 12 GeForce RTX Titans. En promedio, el clasificador global se entrenó durante 30 minutos por experimento, mientras que el clasificador basado en vóxeles se entrenó durante 2 a 4 horas por experimento.
Evaluación
Se utilizó una estrategia de validación cruzada quíntuple para evaluar el proceso de capacitación. Aunque hasta tres riñones diferentes de cada paciente fueron tratados individualmente durante elEn el proceso de entrenamiento, todos los volúmenes de un solo paciente se estratifican en el mismo grupo de validación cruzada para evitar la fuga de datos. El conjunto de datos se dividió 80:20 y luego se entrenó en el80%, mientras que el 20% restante se utilizó para validación. El entrenamiento se repitió cinco veces en total con diferentes divisiones 80:20 hasta que todo el conjunto de datos estuvo completamente validado.
Además de los experimentos con toda la cohorte de datos, se realizaron análisis de subcohortes adicionales para evaluar posibles variables de confusión. Se aplicó la estratificaciónbasado en el estado del contraste intravenoso y la exclusión de riñones nativos atróficos en pacientes que recibieron un trasplante. Además, para evaluar la generalización del modelo, modLos participantes entrenados exclusivamente con escáneres Philips y GE fueron validados exclusivamente con datos de escáneres Siemens.
Estadísticas
El objetivo de nuestro estudio fue distinguir entre fibrosis leve/moderada y fibrosis grave en la tomografía computarizada del riñón. En ambos enfoques se utilizó la regla de la mayoría (global porción por porción).y basado en voxel) para determinar la gravedad defibrosis.Para evaluar el rendimiento entre los dos enfoques,exactitud, sensibilidad, especificiudad, valor predictivo positivo(VPP) y el valor predictivo negativo (VPN) se calcularonlatados y comparados. El área debajo del receptor en funcionamiento.La curva (AUC) también se calculó variando el softmaxumbral de puntuación para elfibrosis clasicoficatión y el resultadoing curva dibujada para ambos enfoques para comparar. DescripciónLas estadísticas positivas se informan como media.6DAKOTA DEL SUR.