La comparación entre QPCR y RNA-seq revela los desafíos de cuantificar la expresión de HLA, parte 1

May 25, 2023

Abstracto

Los loci de clase I y II del antígeno leucocitario humano (HLA) son elementos esenciales de la inmunidad innata y adquirida. Sus funciones incluyen la presentación de antígenos a las células T que conducen a respuestas inmunitarias celulares y humorales, y la modulación de las células NK. Su influencia excepcional en los resultados de la enfermedad ahora ha quedado clara mediante estudios de asociación del genoma completo. Los exones que codifican el surco de unión de péptidos han sido el foco principal para determinar los efectos de HLA en la susceptibilidad/patogénesis de la enfermedad. Sin embargo, los niveles de expresión de HLA también se han implicado en los resultados de la enfermedad, lo que agrega otra dimensión a la extrema diversidad de HLA que afecta la variabilidad en las respuestas inmunitarias entre individuos.

Existe una estrecha relación entre los antígenos leucocitarios y la inmunidad. El antígeno leucocitario se refiere a la molécula en la superficie de los glóbulos blancos humanos, que puede identificar y distinguir diferentes tipos de células y patógenos. Es una parte importante del sistema inmunitario humano y un importante regulador de la respuesta inmunitaria.

Las diferencias en los antígenos leucocitarios pueden dar lugar a diferentes respuestas inmunitarias y susceptibilidad a enfermedades. Por ejemplo, ciertos antígenos leucocitarios están asociados con enfermedades autoinmunes, enfermedades infecciosas y tumores. La expresión de ciertos antígenos leucocitarios también está relacionada con la función y cantidad de células inmunitarias.

Por lo tanto, comprender las características moleculares de la superficie de los leucocitos de un individuo es de gran importancia para evaluar el estado inmunitario del individuo y el riesgo y pronóstico de la enfermedad. Al mismo tiempo, también es propicio para la formulación de tratamientos personalizados y medidas preventivas. Desde este punto de vista, necesitamos mejorar la inmunidad. Cistanche tiene un efecto significativo en la mejora de la inmunidad. Cistanche es rico en varias sustancias antioxidantes, como la vitamina C y los carotenoides. Estos ingredientes pueden eliminar los radicales libres, reducir el estrés oxidativo y mejorar la resistencia del sistema inmunológico.

cistanche adalah

Haga clic en polvo de extracto de cistanche tubulosa

Para estimar la expresión de HLA, los estudios inmunogenéticos tradicionalmente se basan en la PCR cuantitativa (qPCR). La adopción de tecnologías alternativas de alto rendimiento, como RNA-seq, se ha visto obstaculizada por problemas técnicos debido al polimorfismo extremo en los genes HLA. Recientemente, sin embargo, se han desarrollado múltiples métodos bioinformáticos para estimar con precisión la expresión de HLA a partir de datos de RNA-seq. Esto abre una oportunidad emocionante para cuantificar la expresión de HLA en grandes conjuntos de datos, pero también genera dudas sobre si los resultados de RNA-seq son comparables a los de qPCR. En este estudio, analizamos tres clases de datos de expresión para los genes HLA de clase I para un conjunto de individuos: (a) RNA-seq, (b) qPCR y (c) expresión de HLA-C en la superficie celular. Observamos una correlación moderada entre las estimaciones de expresión de qPCR y RNA-seq para HLA-A, -B y -C ({{10}}.2 Menor o igual a rho Menor o igual a 0.53 ). Discutimos los factores técnicos y biológicos que deben tenerse en cuenta al comparar cuantificaciones para diferentes fenotipos moleculares o al usar diferentes técnicas.

Palabras clave

HLA · Expresión · PCR · RNA-seq.

Introducción

La expresión génica proporciona un fenotipo molecular que se encuentra en una posición intermedia entre la variación genética y los fenotipos complejos, como el estado de enfermedad. Comprender la base genética de la expresión génica puede ser estratégico para establecer vínculos entre la variación genética y los fenotipos complejos (GTEx Consortium 2013; Lappalainen et al. 2013), incluida la susceptibilidad a enfermedades autoinmunes e infecciosas. Aunque el estudio de la variación genética en los loci del antígeno leucocitario humano (HLA), y dentro de la región del complejo mayor de histocompatibilidad (MHC) en general, se ha utilizado para diseccionar la base genética de varias enfermedades complejas (Trowsdale y Knight 2013; Dendrou et al. . 2018), la inclusión de fenotipos moleculares, en particular aquellos asociados con la expresión génica, es relativamente reciente (Apps et al. 2015; Vince et al. 2016; Ramsuran et al. 2018; Johansson et al. 2022).

La región MHC humana en el cromosoma 6p21 muestra una alta densidad de genes, con patrones únicos de desequilibrio de ligamiento (LD) y polimorfismo extremo (de Bakker et al. 2006; Radwan et al. 2020). La región MHC contiene los loci HLA de clase I y II que codifican moléculas implicadas en el desencadenamiento y la modulación de la respuesta inmunitaria. Las moléculas HLA de clase I se expresan en la mayoría de las células nucleadas y generalmente presentan péptidos intracelulares a las células T CD8 plus. Por el contrario, las moléculas HLA de clase II se expresan principalmente en células presentadoras de antígenos profesionales y presentan a las células T CD4+ antígenos exógenos que fueron internalizados por endocitosis. Las moléculas de clase I también son reconocidas por los receptores de las células asesinas naturales (NK), los receptores tipo inmunoglobulina (KIR) de las células asesinas, lo que afecta tanto la formación como la activación de las células NK (Colonna y Samaridis 1995; Goodson-Gregg et al. 2020). El emparejamiento de diferentes alotipos HLA clase I y moléculas KIR específicas influye en la actividad de las células NK (y un subconjunto de células CD8 más T), lo que genera riesgos diferenciales de cáncer, enfermedades infecciosas y autoinmunidad (revisado en Kulkarni et al. 2008).

Las asociaciones de enfermedades HLA se han atribuido principalmente a diferencias específicas de alelo en la presentación de antígenos, debido a los extensos polimorfismos en el surco de unión de péptidos. Sin embargo, los niveles de expresión de HLA contribuyen a algunas de las asociaciones observadas entre los polimorfismos de HLA y los resultados de la enfermedad. El nivel de expresión de HLA es un modificador importante de la autoinmunidad y de la fuerza de la respuesta inmunitaria mediada por HLA frente al cáncer y las infecciones (revisado en René et al. 2016).

Hay múltiples ejemplos de asociaciones entre los niveles de expresión de HLA y los resultados de la infección viral. Está bien documentado, por ejemplo, que los niveles más altos de expresión de HLA-C, tanto a nivel de ARNm como de proteína en la superficie celular, están asociados con un mejor control del VIH-1 (Thomas et al. 2009; Kulkarni et al. 2011; Apps et al. 2013; Parolini et al. 2018; Bachtel et al. 2018), mientras que la expresión elevada de HLA-A se asocia con un control deficiente del VIH (Ramsuran et al. 2018). La infección por SARS-CoV-2 regula a la baja la expresión del gen HLA-C (Loi et al. 2022) y la expresión de HLA clase I en la superficie celular (Zhang et al. 2021; Arshad et al. 2023), así como la expresión de HLA clase II expresión génica, incluidos HLA-DPA1, -DPB1, -DRA y -DRB1 (Wilk et al. 2020).

cistanche adalah

Además, existen asociaciones entre los niveles de expresión de HLA-DPA1 (Ou et al. 2019) y HLA-DPB1 (Thomas et al. 2012; Ou et al. 2021) con la eliminación del VHB; Expresión de HLA-DRA con susceptibilidad a la infección por virus de influenza A de murciélago en líneas celulares humanas (Karakus et al. 2019); y amplias asociaciones entre variantes reguladoras y niveles de expresión en genes HLA de clase II, incluidos HLA-DQA1, -DQB1, -DQB2, -DRB1 y -DRB5 con respuesta de anticuerpos contra múltiples virus prevalentes (Kachuri et al. 2020).

Los niveles de expresión de los loci HLA también están asociados con la autoinmunidad (ver Johansson et al. 2022 para una revisión). Los niveles de expresión de HLA-C en la superficie celular (Apps et al. 2013; Kulkarni et al. 2013), así como los niveles de HLA-G en la superficie celular y en plasma (da Costa Ferreira et al. 2021), se han asociado con el riesgo de enfermedad inflamatoria intestinal. Se observó un aumento de la expresión de HLA-B27 en la superficie celular entre pacientes con espondilitis anquilosante (Cauli et al. 2002), al igual que la expresión general de HLA clase I entre pacientes con enfermedad de Graves (Weider et al. 2021). Los niveles de expresión de HLA clase II también influyen en el riesgo de enfermedades autoinmunes.

La expresión de los genes HLA-DQA1 y -DRB1 y la expresión de las moléculas DQ y DR en la superficie celular aumentan en los monocitos de sangre periférica de pacientes con vitíligo (Cavalli et al. 2016); las variantes reguladoras asociadas con una mayor expresión de los genes HLA-DQA1, -DQB1 y -DRB1 y la expresión de DQ y DR en la superficie celular están asociadas con el riesgo de lupus eritematoso sistémico (Raj et al. 2016); La expresión del gen HLA-DRB5 es mayor en pacientes con esclerodermia y enfermedad pulmonar intersticial (Odani et al. 2012); los alelos HLA-DRB1 específicos se expresan en gran medida en pacientes con artritis reumatoide (Houtman et al. 2021); y una mayor expresión de DRB1*15:01 se asocia con riesgo de esclerosis múltiple (Alcina et al. 2012). Por lo tanto, comprender la variación de la expresión de HLA entre individuos y los mecanismos que regulan los niveles de expresión de HLA será clave para descubrir la base genética de los fenotipos de las enfermedades.

Tradicionalmente, la expresión de HLA se ha estimado mediante técnicas basadas en anticuerpos para niveles de expresión en la superficie celular (Thomas et al. 2012; Apps et al. 2013) o mediante PCR cuantitativa (qPCR o RT-PCR) para niveles de transcripción de ARNm (Bettens et al. 2014; Ramsuran et al. 2015, 2017). Es un desafío comparar los resultados entre estudios o incluso comparar distintos loci HLA dentro del mismo estudio, ya que se utilizan diferentes procedimientos experimentales para cada análisis y para cada locus HLA, lo que puede resultar en diferentes eficiencias de amplificación en qPCR o afinidades de anticuerpos en citometría de flujo.

Las tecnologías de alto rendimiento, como RNA-seq, proporcionan estimaciones de expresión para todos los genes del genoma, incluidos los genes HLA, lo que permite evaluar la expresión de HLA en un contexto de todo el genoma. Sin embargo, estas tecnologías presentan muchos desafíos cuando se utilizan para estimar los niveles de expresión de los genes HLA. Además de los sesgos bien documentados asociados con los ensayos de RNA-seq (por ejemplo, efectos por lotes, preparación de bibliotecas, contenido de GC ('t Hoen et al. 2013), la dificultad para estimar los niveles de expresión de los genes HLA se debe al hecho de que la cuantificación implica la alineación de lecturas cortas con un genoma de referencia, lo que no proporciona una representación completa de la diversidad alélica de HLA.

Por lo tanto, es posible que algunas lecturas no se alineen debido a la gran cantidad de diferencias relacionadas con el genoma de referencia (Brandt et al. 2015). Además, los genes HLA son parte de una familia de genes formada después de rondas sucesivas de duplicaciones y, a menudo, contienen segmentos que son muy similares entre parálogos, lo que da como resultado alineaciones cruzadas entre genes y cuantificación sesgada de los niveles de expresión. Estas dificultades motivaron el desarrollo de canalizaciones computacionales (ver Johansson et al. 2022 para una revisión) que dan cuenta de la diversidad HLA conocida en el paso de alineación y se ha demostrado que proporcionan niveles de expresión precisos para los genes HLA (Boegel et al. 2012; Lee et al. 2018; Aguiar et al. 2019; Gutierrez-Arcelus et al. 2020; Darby et al. 2020).

Si bien los enfoques de RNA-seq y qPCR estiman la expresión de HLA al cuantificar la abundancia de transcritos, los métodos involucran diferentes procedimientos de procesamiento bioinformático y experimental. Hasta donde sabemos, no se ha realizado una comparación cuantitativa de los resultados de RNA-seq con los derivados de qPCR para genes HLA. En este estudio, buscamos comparar diferentes técnicas y fenotipos moleculares para la cuantificación de la expresión de HLA clase I, teniendo en cuenta que ninguna técnica puede considerarse un estándar de oro. Para reducir el efecto de la variación técnica y biológica en la comparación de diferentes estudios, realizamos un ensayo de RNA-seq en un conjunto de 96 individuos para los cuales estaban disponibles las estimaciones de expresión de qPCR (para HLA-A, -B, -C) y para un subconjunto del cual también estaba disponible la expresión de superficie celular basada en anticuerpos HLA-C. La cuantificación de RNA-seq se realizó con una tubería adaptada a HLA que permite una estimación precisa de la expresión, minimizando el sesgo de los enfoques estándar que se basan en un único genoma de referencia.

cistanche whole foods

Materiales y métodos

Muestras

Se obtuvieron muestras de sangre de 96 donantes de sangre sanos inscritos en el programa de donantes voluntarios del Laboratorio Nacional de Investigación del Cáncer de Frederick (FNLCR). Se obtuvo el consentimiento informado por escrito de todos los sujetos y las muestras se anonimizaron mediante procedimientos aprobados por el IRB del Instituto Nacional del Cáncer. El ARN se extrajo de células mononucleares de sangre periférica (PBMC) recién aisladas utilizando el kit RNeasy Universal (Qiagen). El ARN se trató con ADNasa libre de ARNasa para la eliminación del ADN genómico. El ARN total extraído de las PBMC se cuantificó utilizando un chip de laboratorio de ARN HT (Caliper, Life Sciences). Todas las muestras que mostraron una puntuación de calidad de ARN superior a 8 se utilizaron en los análisis de expresión génica.

Tipificación HLA

Los alelos HLA se determinaron mediante secuenciación de Sanger. Además, ejecutamos HLApers (Aguiar et al. 2019) y Kourami (Lee y Kingsford 2018) para inferir alelos HLA directamente de RNAseq y verificamos la concordancia con las llamadas basadas en la secuenciación de Sanger. Si consideramos llamadas consistentes entre HLApers y Kourami, observamos solo 10 discordancias con las llamadas de Sanger de 288 comparaciones (3 loci × 96 individuos). La mayoría de ellos (n=5) mostraron compatibilidad con RNA-seq para un alelo muy cercano al determinado por la secuenciación de Sanger, por lo que optamos por mantener las llamadas basadas en RNA-seq. Para 3 genotipos, observamos llamadas homocigotas de RNA-seq probablemente porque no se expresó un alelo, y mantuvimos las llamadas de la secuenciación de Sanger. Esto no afecta la estimación de la expresión, ya que ninguna lectura se alinea con el alelo no detectado a través de RNA-seq. Para un genotipo, observamos un buen soporte para una llamada heterocigota, mientras que la secuenciación de Sanger se denominó homocigota. En ese caso, mantuvimos la llamada basada en RNA-seq ya que explicaba mejor las lecturas observadas. Para una llamada de alelo, consideramos un error de las llamadas basadas en RNA-seq debido a una cobertura de lectura insuficiente.

PCR cuantitativa (qPCR)

Los niveles de transcripción de ARNm de HLA para HLA-A, -B y -C se midieron mediante qPCR en un ensayo que garantiza la amplificación imparcial de los alelos comunes en cada locus y evita la amplificación de todos los demás loci. Los cebadores utilizados fueron: HLA-A (F, GCTCCCACTCCATGAGGTAT; R, AGTCTG TGACTGGGCCTTCA); HLA-B (F, ACTGAGCTTGTG GAGACCAGA; R, GCAGCCCCTCATGCTGT); HLA-C (F, CTGGCCCTGACCGAGACCTG; R, CGCTTGTAC TTCTGTGTCTCC). La transcripción inversa se realizó utilizando el kit de ARN a ADNc de alta capacidad (Applied Biosystems). La amplificación de HLA y el ADNc de la microglobulina (B2M) del gen de limpieza 2 se realizó utilizando la mezcla maestra verde Power SYBR (Applied Biosystems), en una máquina ABI 7900HT. Las secuencias de cebadores para B2M se describen en la Tabla S4 de Kulkarni et al. (2013). El nivel de expresión promedio de cada gen HLA se normalizó al de B2M y se calculó usando el método 2-∆∆Ct (donde Ct es el ciclo umbral).

Los niveles de expresión específicos de alelo promedio de los alelos HLA comunes se estimaron mediante un modelo lineal como se describe en Ramsuran et al. (2015). Específicamente, modelamos la expresión como una función lineal de los dos alelos que porta cada individuo y extrajimos los efectos de cada alelo en la expresión génica. Este paso lo realizamos en R (ver apartado Disponibilidad de código).

expresión superficial

La expresión de la superficie celular de HLA-C se midió en células CD3 plus de PBMC recién aisladas mediante citometría de flujo utilizando el anticuerpo monoclonal DT9 específico de HLA-C (Apps et al. 2013). Para el análisis de HLA-A en un subconjunto de individuos portadores de A*03 y A*11, teñimos las células con el anticuerpo 0554HA (One Lambda, Inc.).

secuencia de ARN

preparación de ARN

RNA-seq se realizó en RNA almacenado a -80 grados. El ARN total se cuantificó mediante el ensayo Qubit RNA HS (Thermo Fisher). La calidad del ARN se evaluó utilizando un instrumento Bioanalyzer 2100 y un kit Agilent 6000 RNA Pico (Agilent Technologies). Para cada muestra, se usaron 500 ng de ARN total como entrada para la preparación de bibliotecas empobrecidas en ARNr de transcriptoma completo. Se preparó una biblioteca ligada con adaptador con el kit KAPA HyperPrep (KAPA Biosystems, Wilmington, MA) utilizando adaptadores con código de barras de ADN Bioo Scientific NEXTfex™ (BioScientifc, Austin, TX, EE. UU.) de acuerdo con el protocolo proporcionado por KAPA.

Agotamiento de ARNr usando RiboErase

El ARN ribosómico se agotó incubando el ARN total con sondas complementarias a las secuencias de ARNr. Después de la hibridación, se usó RNase H para degradar enzimáticamente el rRNA. La limpieza y la digestión con ADNasa se realizaron utilizando Kapa Pure Beads y ADNasa de acuerdo con el protocolo de Kapa.

Fragmentación, síntesis de ADNc y construcción de bibliotecas

Las muestras empobrecidas en ARNr se fragmentaron a 85 grados durante 4,5 minutos en presencia de magnesio antes de la síntesis de la primera y la segunda cadena y las reacciones de cola A. Los adaptadores con código de barras de ADN NEXTfex (1,5 uM) se ligaron a ADNc de cola A con un código de barras único para cada muestra. Los productos se purificaron con Kapa Pure Beads y se realizaron 8 ciclos de Library Amplification. Después de la amplificación, se realizó una limpieza final de la biblioteca y se evaluaron la cuantificación de la biblioteca y el control de calidad mediante el ensayo Qubit DNA HS (Thermo Fisher) y el kit Agilent DNA HS en el instrumento 2100 Bioanalyzer.

Secuenciación

Las bibliotecas de secuenciación multiplexadas resultantes se usaron en la formación de grupos en un cBOT de Illumina (Illumina, San Diego, CA, EE. UU.) y la secuenciación se realizó con un Illumina HiSeq 2500 siguiendo los protocolos proporcionados por Illumina para secuenciación de extremo emparejado de 2 × 126 pb. Cada transcriptoma se secuenció a una profundidad objetivo de 40 a 50 millones de lecturas.

RNA-seq en muestras frescas de 11 individuos

Para investigar la posibilidad de degradación de la muestra del material almacenado a -80 grados antes de la secuenciación del ARN, una posible fuente de desacuerdo con las estimaciones de qPCR, volvimos a extraer sangre de 11 donantes y realizamos RNA-seq en las nuevas muestras. El experimento se llevó a cabo con la misma preparación de la biblioteca y los mismos métodos que antes, pero se secuenció con un Illumina NextSeq con lecturas de 2 × 150 pb.

pure cistanche

Cuantificación de la expresión de RNA‑seq

transcriptoma de referencia

Utilizamos Salmon (Patro et al. 2017) para estimar los niveles de expresión de todas las transcripciones anotadas en la base de datos Gencode v37. Utilizamos todas las opciones para la corrección del sesgo en Salmon (sesgo GC, sesgo posicional y sesgo específico de secuencia).

Personalizado

Igual que el "transcriptoma Ref", pero con transcripciones HLA personalizadas de acuerdo con los genotipos HLA-A, -B y -C que porta cada individuo. La personalización se llevó a cabo alineando la secuencia del alelo HLA del genoma de referencia con el genoma para obtener las coordenadas. Luego, al usar la alineación multisecuencial del alelo presente en el genoma de referencia con todos los demás alelos (disponible en IPD-IMGT/HLA versión 3.43.0 (Robinson et al. 2020)), atribuimos genómica posiciones a todos los alelos HLA. Finalmente, construimos una transcripción personalizada basada en la combinación de información sobre las coordenadas de la transcripción y la secuencia del alelo HLA. Este procedimiento se realizó en R (R Core Team 2020), utilizando el paquete Biostrings (Pagès et al. 2020) y el meta paquete tidyverse (Wickham et al. 2019).


For more information:1950477648nn@gmail.com


También podría gustarte