Mejora de la proteómica de arriba hacia abajo del tejido cerebral con FAIMS Parte 2
Aug 27, 2024
Análisis de datos
La identificación de proteoformas se realizó con TopPIC versión 1.3.53. Las configuraciones para TopPIC incluyeron una ventana precursora de 3 m/z (para tener en cuenta la envoltura isotópica), una tolerancia al error de masa de 15 ppm, un desplazamiento de masa desconocido máximo/mínimo de 500 Da y un máximo número de modificaciones desconocidas permitidas de 1.
En los últimos años, cada vez más estudios han demostrado que existe una estrecha relación entre la morfología de las proteínas y la memoria. Las proteínas son las moléculas más básicas en las actividades de la vida. Pueden controlar las actividades vitales de las células y mantener el funcionamiento normal del cuerpo humano. Los estudios han descubierto que la morfología de las proteínas no sólo juega un papel importante en las actividades de la vida celular sino que también tiene una relación inseparable con la función de la memoria en el cerebro. Una vez que cambia la morfología de las proteínas, afectará la conexión entre las neuronas, afectando así la capacidad de memoria de las personas.
En las primeras etapas de la vida, los cambios en la morfología de las proteínas desempeñan un papel vital en el desarrollo y función del cerebro. Si la morfología de las proteínas no es la que debería ser, se producirán una serie de problemas neurológicos que acabarán provocando pérdida de memoria, deterioro cognitivo, etc.
Sin embargo, no hay necesidad de preocuparse. La tecnología médica moderna ha permitido a las personas ajustar la morfología de las proteínas a través de la dieta para mejorar su memoria. Una dieta rica y variada es rica en proteínas, pero a la hora de elegir proteínas, intenta elegir alimentos bajos en grasas, bajos en colesterol y bajos en carbohidratos para evitar los efectos adversos de una ingesta excesiva en el organismo.
En resumen, la morfología de las proteínas y la memoria son inseparables. Debemos prestar atención a una dieta saludable y una ingesta equilibrada de proteínas para mantener una buena salud manteniendo una buena memoria. Se puede ver que necesitamos mejorar la memoria, y Cistanche puede mejorar significativamente la memoria porque tiene efectos antioxidantes, antiinflamatorios y antienvejecimiento, que pueden ayudar a reducir la oxidación y las reacciones inflamatorias en el cerebro, protegiendo así la salud del sistema nervioso. Además, Cistanche también puede promover el crecimiento y la reparación de las células nerviosas, mejorando así la conectividad y la función de las redes neuronales. Estos efectos pueden ayudar a mejorar la memoria, la capacidad de aprendizaje y la velocidad del pensamiento, y también pueden prevenir la aparición de disfunciones cognitivas y enfermedades neurodegenerativas.

Haga clic en Saber para mejorar la memoria a corto plazo
Se buscaron espectros MS2 en una base de datos concatenada con entradas de Homo sapiens Swiss-Prot (20,352), variantes de empalme Swiss-Prot (22,000) y TrEMBL (54,436), así como contaminantes comunes. Las proteoformas identificadas se filtraron a una tasa de descubrimiento falso (FDR) del 1 % a través de TopPIC.
El análisis de datos posteriores se realizó en el entorno R para cálculo estadístico y generación de cifras.54 En el análisis posterior, las proteoformas del mismo gen con los mismos aminoácidos iniciales y finales que se encontraron dentro de ±5 Da se combinaron como una sola proteoforma para aumentar el rigor. de nuestras asignaciones.
Aunque el umbral de 5Da es arbitrario, este enfoque compensó los picos monoisotópicos asignados incorrectamente, la ambigüedad en los cambios de masa desconocidos y otras desviaciones artefactos. Para determinar la desviación estándar relativa (RSD) de las proteoformas dentro de las réplicas, utilizamos el resultado de "intensidad de características" de TopPIC.
Los mapas de cobertura de secuencias de fragmentación y los espectros asociados se generaron utilizando el software LCMs Spectator.55
Las configuraciones específicas para LCMs Spectator incluyeron una tolerancia de iones precursores de 10 ppm, una tolerancia de producción de 10 ppm, un umbral S/N mínimo de 1,5, un umbral de correlación de Pearson de 0,7, un suavizado predeterminado de 9 puntos, y un umbral de intensidad relativa del isótopo precursor de 0,1.
RESULTADOS Y DISCUSIÓN
La adición de FAIMS aumenta considerablemente la cobertura del proteoma
La muestra de tejido de la corteza de un paciente diagnosticado con Alzheimer se procesó siguiendo el flujo de trabajo, como se muestra en la Figura 1. Primero buscamos analizar el rendimiento de FAIMS en varios CV en comparación con aquellos sin FAIMS (denominados "Sin FAIMS").
Vale la pena recordar que la interfaz FAIMS produce una pérdida modesta de transmisión de iones, presumiblemente debido al recorrido más largo de los iones a través de la fuente.56 Por lo tanto, para representar mejor las condiciones típicas y asegurar comparaciones equitativas, los datos "Sin FAIMS" se recolectaron utilizando la misma muestra sin la unidad FAIMS instalada.
Estos datos "No FAIMS" se recopilaron por triplicado y se analizaron de acuerdo con el flujo de trabajo, como se muestra en la Figura 1 con un análisis de los 6 DDA MS2 principales. Los conjuntos de datos "No FAIMS" identificaron en promedio 754 ± 35 proteoformas (Figura 2A y Tabla S1) y Identificaron colectivamente 1073 proteoformas únicas (no redundantes) (Figura 2B) derivadas de 293 genes únicos (Figura 2C), que cubren 29,359 aminoácidos en todo el proteoma (Figura 2D).
La métrica "cobertura de proteoma" (Figura 2D) se define como aminoácidos no redundantes cubiertos por la secuencia de cada proteoforma. Esencialmente, esta métrica representa tanto la longitud como la diversidad de las proteoformas identificadas.
Consideramos que esta es una métrica más equilibrada en comparación con el número bruto de proteoformas y genes, ya que evita sesgos hacia proteoformas más pequeñas. Aunque los recuentos simples de proteoformas o genes son intuitivos, estas métricas parecen estar fuertemente influenciadas por fragmentos proteolíticos cortos. Los conjuntos de datos FAIMS se recopilaron de −50 a −20 CV escaneados en pasos de 5 V.
Cada uno de los 7 CV resultantes se recopiló por triplicado. En cuanto a proteoformas y genes, FAIMS superó a "No FAIMS" en todos los CV analizados dentro del rango de CV de -50 a -30 (Figura 2A-C).
Por ejemplo, los tres conjuntos de datos a −50 CV identificaron 1833 ± 17 proteoformas, un aumento promedio de ~140% por ejecución en comparación con "Sin FAIMS". En conjunto, estos tres conjuntos de datos a −50 CV identificaron 2564 proteoformas únicas de 530 genes únicos que cubren un total de 43,437 aminoácidos, un aumento del 95, 69 y 69% con respecto a los tres conjuntos de datos "NoFAIMS", respectivamente (Figura 2B-D y Tabla S1).

Además, aunque FAIMS a −25V observa menos proteoformas y genes únicos en comparación con "No FAIMS", las proteoformas en sí son mucho más largas en promedio. Por lo tanto, al considerar la longitud de la proteoforma (Figura 2D), los conjuntos de datos de −25 V cubren casi la misma cantidad de aminoácidos del proteoma (28,398) en relación con "No FAIMS" (29,359), y lo hacen con solo la mitad de proteoformas (Figura 2B). ).
También investigamos si FAIMS podría proporcionar un análisis tan sólido y reproducible en comparación con sin FAIMS. Evaluamos la reproducibilidad de la cuantificación calculando la RSD (equivalente al coeficiente de variación) de la intensidad de la característica de cada proteoforma, siempre que la proteoforma cumpliera con el criterio de ser observada en los tres conjuntos de datos replicados para cada configuración de CV.
Debido a que todos los conjuntos de datos FAIMS y "No FAIMS" se recopilaron de una sola muestra biológica, la variación entre las réplicas debe atribuirse exclusivamente a factores instrumentales.
El diagrama de caja de la Figura 3 (así como los histogramas individuales en la Figura S1) demuestra cómo se comparan las distribuciones de RSD entre los conjuntos de datos FAIMS y "No FAIMS".
Según la mediana de RSD, la adición de FAIMS dio como resultado una calidad de cuantificación similar o ligeramente mejorada en relación con "Sin FAIMS". La mejora en los RSD entre voltajes más bajos (−20 a −30 CV) puede estar relacionada con la observación de que se transmiten menos proteoformas dentro de ese rango, lo que proporciona espectros MS1 de mayor calidad y, por lo tanto, mejores estimaciones de la intensidad de las características.
Además, vale la pena señalar que los RSD determinados a partir de estas réplicas son similares a experimentos anteriores de arriba hacia abajo55 y de abajo hacia arriba57,58 realizados con instrumentación similar.
En conjunto, estos datos demuestran que la adición de FAIMS al TDP aumenta considerablemente las identificaciones de proteoformas, sin sacrificar la calidad de la cuantificación.
A continuación, investigamos la superposición en las identificaciones entre los CV, lo que podría proporcionar el conjunto más grande y no redundante de observaciones.
Utilizando coeficientes de superposición, definidos como la intersección entre dos conjuntos dividida por el menor de los dos conjuntos, determinamos la similitud entre cada conjunto de datos. El coeficiente de superposición medio general para las identificaciones de genes y proteoformas dentro de cada CV FAIMS fue 0.76.
Esto es comparable al coeficiente de superposición de los conjuntos de datos "Sin FAIMS" (0.77), lo que sugiere que las réplicas técnicas muestran una reproducibilidad similar. En las Figuras 4 y S2, respectivamente, se muestra un mapa de calor que muestra los coeficientes de superposición FAIMS de proteoformas y genes.
En particular, la superposición de identificaciones de genes en el espacio CV es mucho mayor en relación con las proteoformas, aunque es particularmente notable cuando se comparan las distancias CV más largas.
Por ejemplo, la superposición entre −50 y −20 CV es 0,64 a nivel de gen y 0,06 a nivel de proteoforma. Esto era de esperarse ya que cada gen puede estar potencialmente representado por múltiples proteoformas.

La Figura 4 demuestra que, si bien una diferencia de 5−10 V en CV produce coeficientes de superposición en su mayoría superiores a 0,5, las distancias superiores a 15 V producen mayores grados de disimilitud y, por lo tanto, están mejor espaciadas para capturar conjuntos de proteoformas suficientemente diferentes.
Con estos conjuntos de datos, a continuación buscamos determinar qué combinaciones de CV son óptimas para lograr identificaciones de genes máximas, identificaciones de proteoformas y cobertura de secuencia con restricciones en el número de CV para cada combinación.
Primero, establecimos las combinaciones óptimas para cualquier número de CV del 1 al 7 utilizando las métricas de proteoformas, genes y cobertura de secuencia de proteoma únicos (Figura 5).
Utilizando combinaciones limitadas a tres CV como ejemplo, la Figura 5A, B detalla cómo −35, −40 y −50 V son ideales si se desea maximizar el número de proteoformas o genes.
Las proteoformas y genes identificados en estos tres CV (nueve conjuntos de datos) cubren el 84% del total de proteoformas únicas y el 92% del total de genes en todo el conjunto de 21 conjuntos de datos.
Cuando se pesa la longitud de una proteoforma con la cobertura de secuencia como métrica, la combinación ideal es −30, −40 y −50 CV, cubriendo el 88% de los aminoácidos únicos de los 21 conjuntos de datos FAIMS con solo una modesta pérdida de identificaciones de proteoformas y genes ( 4221 proteoformas y 723 genes, Figura 5C). Sin embargo, estas combinaciones incluyen todas las réplicas y representan las identificaciones máximas que podrían lograrse para una combinación determinada de CV. Por lo tanto, para demostrar la ventaja del paso de CV externo, decidimos investigar qué números podrían lograrse razonablemente en promedio con solo tres ejecuciones, donde cada ejecución es un CV diferente.
Utilizando los conjuntos de datos de −50, −40 y −30 V como ejemplo, determinamos las proteoformas únicas promedio, los genes únicos y las coberturas de secuencias de proteomas en función de las 27 combinaciones únicas de las tres réplicas diferentes dentro de cada CV.
Según este análisis, podríamos lograr 2986 (±46) proteoformas únicas y 618 (±12) genes únicos que cubren 64,534 (±1089) aminoácidos en promedio. En comparación con los conjuntos de datos por triplicado "No FAIMS", que identificaron 1073 proteoformas únicas y 293 genes únicos que cubren 29,359 aminoácidos, el CV externo con un paso a −50, −40 y −30 V podría más que duplicar cada métrica.
Sin embargo, la combinación óptima de CV probablemente también dependerá del organismo y tejido del que se deriva la muestra, los pasos de preparación de la muestra aplicados, así como cualquier fraccionamiento fuera de línea adicional implementado antes del análisis LC-MS.
En general, cuando se toman en conjunto con el análisis de superposición (Figura 4), sugieren que distancias de 15 V o más entre los CV proporcionan la menor cantidad de superposición entre proteoformas, mientras que la separación de 5 a 10 V dentro de los CV de -50 a -30 maximiza los genes, las proteoformas y el proteoma. Cobertura de secuencia.
Para determinar mejor el impacto de FAIMS en la profundidad de la cobertura del proteoma, comparamos los genes identificados en nuestros conjuntos de datos de arriba hacia abajo con un análisis ascendente típico del cerebro humano.
Conjuntos completos de datos ascendentes del tejido cerebral humano nos permitieron estimar la abundancia de 8528 proteínas mediante el recuento espectral ponderado.59–61 Las proteínas se agruparon en 10 percentiles de abundancia diferentes basados en recuentos espectrales compilados a partir de varios conjuntos de datos ascendentes del cerebro humano.
Al hacer referencias cruzadas con nuestros conjuntos de datos de arriba hacia abajo, pudimos determinar de dónde se derivan los genes y las proteoformas y clasificarlos en términos de abundancia de proteínas estimada (utilizando recuentos espectrales normalizados por conjuntos de datos) en el cerebro humano (Figura 6).

Los genes que se encontraron dentro de nuestro análisis de arriba hacia abajo pero no en el conjunto de referencia de abajo hacia arriba se agruparon como "NA".
For more information:1950477648nn@gmail.com






