Ensamblaje de transcriptoma de novo basado en RNA-Seq y descubrimiento de genes del tallo carnoso de Cistanche Deserticola-Ⅱ
Jul 26, 2024
Clasificación funcional de todas las transcripciones expresadas según la ontología genética y las bases de datos KEGG
La anotación de Gene Ontology (GO) se obtuvo del archivo de asociación de identidades y anotaciones de UniProt. En total, se asignaron 20.907 transcripciones, que representan el 32,69% del total de secuencias expresadas, a 1.745 términos funcionales. Del total de términos GO funcionales, las asignaciones al proceso biológico constituyeron la mayoría (1.116, 63,95%) seguidas del componente celular (329, 18,85%) y la función molecular (300, 17,20%). Las funciones asignadas de las transcripciones expresadas cubrieron una amplia gama de categorías GO, y los 10 términos GO principales con las transcripciones más anotadas se enumeran en la Tabla 3. Proporcionamos la distribución de todas las transcripciones expresadas en tres categorías de ontología genética (función molecular, componente celular y proceso biológico) en el archivo complementario (conjunto de datos S3). Los términos GO relacionados con funciones de unión y actividad transferasa estuvieron representados predominantemente en la categoría de funciones moleculares. En cuanto a las funciones de unión, la unión de cationes (4.394 transcripciones) representó la más abundante, seguida de la unión de nucleótidos/nucleósidos (3.404 transcripciones en promedio) y la unión de proteínas (2.422 transcripciones). Mientras que en el grupo de actividad transferasa, la mayoría son aquellos con grupos que contienen fósforo transferidos (2.256 transcritos, 65,77%). Entre la categoría de componentes celulares, las transcripciones se ubicaron más intracelularmente (10,581 transcripciones en promedio), mientras que entre la categoría de procesos biológicos, las transcripciones estuvieron más involucradas en el proceso metabólico del biopolímero (6,683 transcripciones en promedio), seguido de la regulación del proceso celular (4,841 transcripciones). ), expresión génica (4.678 transcripciones) y transporte (3.512 transcripciones).

CISTANCHE TUBULOSA NATURAL PARA PREVENIR LA ENFERMEDAD DE ALZHEIMER PHGS75% ECH 30% ACT 12%
Para extraer genes implicados en la biosíntesis de lignina y PhG, se buscaron 21.358 secuencias de proteínas potenciales no redundantes frente a secuencias de genes de 13 organismos vegetales en la base de datos KEGG, y se asignaron a 275 vías KEGG con al menos 5 resultados. Las 10 vías principales con secuencias más alineadas se enumeran en la Tabla 4. La mayoría de las vías estuvieron involucradas en procesos metabólicos primarios, como el metabolismo de aminoácidos o proteínas (ko01230, ko04141 y ko04120), el metabolismo de carbohidratos (ko01200 y ko00500) y el de nucleótidos o Metabolismo de nucleósidos (ko03018, ko00230 y ko00240). Además, existen 27 vías secundarias relacionadas con el metabolismo (Fig. 2), como la biosíntesis de la cadena principal de terpenoides, la biosíntesis de fenilpropanoides, la biosíntesis de carotenoides, la biosíntesis de alcaloides de isoquinolina y la biosíntesis de alcaloides de tropano, piperidina y piridina. Estos resultados proporcionan una indicación adicional de que se estaban llevando a cabo procesos metabólicos activos en elC. deserticolatejido del tallo. Todas las transcripciones expresadas asociadas con las vías KEGG se enumeraron en el archivo complementario (conjunto de datos S4). Aunque existen algunas vías significativamente modificadas entre C. deserticola y otras plantas, como el arroz (conjunto de datos S5), nuestro principal objetivo en este estudio es revelar el perfil transcriptómico completo del tallo de C. deserticola y representar las vías relacionadas de la biosíntesis de PhG. lo que podría ser útil para guiar el cultivo.

Genes candidatos que codifican enzimas implicadas en la biosíntesis de lignina
La lignina es el segundo polímero terrestre natural más abundante en el reino vegetal y constituye hasta un tercio del material que se encuentra en las paredes celulares de las plantas. Como componente importante de las paredes celulares, las ligninas ayudan al transporte de agua, proporcionan soporte mecánico e integridad estructural y defienden contra patógenos y herbívoros. Esas funciones de la lignina son muy valiosas para apoyar el crecimiento erectivo subterráneo de C. deserticola en el desierto. En este estudio, presentamos la imagen completa de las vías de biosíntesis de lignina en C. deserticola (Fig. 3), en las que los monómeros de lignina se biosintetizan a partir de fenilalanina a través de una serie de reacciones enzimáticas, que incluyen procesos de hidroxilación, metilación, reducción y polimerización oxidativa. Se detectaron enzimas relacionadas con la biosíntesis de lignina para tres formas principalmente sintetizadas en el tejido vascular (p-hidroxil-fenil (H), guaiacil (G) y siringil (S) lignina) y 5-hidroxil-guaiacil lignina, que solo se identificó en plantas deficientes en COMT (ácido cafeico 3-O-metiltransferasa, EC 2.1.1.68) (como las derribadas).

La fenilalanina amonio-liasa (PAL, EC 4.3.1.24) es la primera enzima clave en la vía de biosíntesis de la lignina (Fig. 3) que transforma la fenilalanina en ácido cinámico mediante desaminación no oxidativa. Se secuenciaron un total de 6297 lecturas de PAL y se ensamblaron 7 transcripciones de PAL en C. deserticola (Tabla 5). Mediante comparación de similitudes de secuencia, encontramos que 4 de ellos (comp28550_c1_seq1/2/3/5) tenían más del 95% de similitud con la secuencia de ARNm conocida de C. deserticola (gi| 289595227|gb|ADD12041.1|), mientras que comp28550_c1_seq4 y comp25940_c0_seq1 tuvieron un 77% y un 82% de similitudes, respectivamente. La predicción de ORF reveló que 5 transcritos tenían potenciales de codificar proteínas y portaban un dominio de aminoácido liasa aromático (PF00221.14). Entre ellos, solo el transcrito comp28550_c1_seq4 podría codificar una secuencia proteica completa de 718 residuos de aminoácidos. Se ha informado que PAL estaba codificado por una pequeña familia multigénica en la mayoría de las especies de plantas, como 4 en Arabidopsis thaliana, 5 en Populus trichocarpa, 3 en Scutellaria baicalensis y 7 en Cucumis sativus, etc. Nuestro análisis filogenético sugirió que había 4 Los genes que codifican PAL en C.


deserticola y los llamamos CdPAL1, CdPAL2, CdPAL3 y CdPAL4, respectivamente (S2 Fig). La 4-cumarato-CoA ligasa (4CL, EC 6.2.1.12) y la transcinamato 4-monooxigenasa (CYP73A, EC 1.14.13.11) son dos enzimas responsables de transformar el ácido cinámico en dicumarol-CoA en dos procesos inversos. pedidos. También se encuentran en las columnas vertebrales y sus valores de expresión FPKM son 39,57 y 51,93, respectivamente.

Los cuatro tipos de ligninas se biosintetizaron mediante diferentes vías controladas por tres enzimas clave, cinamoil-CoA reductasa (CCR, EC 1.2.1.44), shikimato o-hidroxicinamoiltransferasa (HCT, EC 2.3.1.133) y ferulado{{1{. {56}}}}hidroxilasa (F5H, EC 1.14.-.-). Se informó que la CCR es un punto de control de la vía de las ligninas [50, 51] que catalizó X-CoA (X que incluye dicumarol, cafeoilo, feruloilo, 5-hidroxiferuloilo y sinapoilo) en Y-aldehído (Y que incluye p -puma, cafeoil, coniferilo, 5-hidroxil-coniferilo y snap), mientras que HCT catalizó p-cumaroil-CoA a ácido p-cumaroil shikímico/ácido p-cumaroil quínico. Las dos enzimas, como un interruptor, regulaban la biosíntesis de las P-hidroxifenilligninas o de los otros tres tipos de ligninas. F5H era otro interruptor de rama que regulaba la siringil lignina y la 5-hidroxil-guaiacil lignina. Otras enzimas importantes incluyen ácido cafeico 3-O-metiltransferasa (COMT, EC 2.1.1.68), cafeoil-CoA O-metiltransferasa (CCoAOMT, EC 2.1.1.104) y cinamil-alcohol deshidrogenasa (CAD, EC 1.1.1.195). ) también se detectaron expresados. La información detallada sobre la expresión se incluye en la Tabla 6. Estos genes enzimáticos identificados en este estudio proporcionarán un recurso valioso para estudios genómicos funcionales en esta importante planta medicinal. Se seleccionaron 10 genes relacionados con la ruta de biosíntesis de ligninas en la Tabla 6 para la verificación por RT-qPCR para confirmar nuestros resultados de RNAseq (Fig. 4), y sus altas correlaciones (coeficiente de correlación de Pearson: 0,90343) indicaron una alta precisión y reproducibilidad de nuestro análisis del transcriptoma. El conjunto de datos S1 enumera las secuencias de cebadores utilizadas en este análisis.

CISTANCHE TUBULOSA NATURAL PARA MEJORAR LA FUNCIÓN SEXUAL PHGS75% ECH 30% ACT 12%
Genes candidatos que codifican enzimas implicadas en la biosíntesis de PhG
Se sabe que los glucósidos feniletanoides (PhG) son los principales ingredientes activos de C. deserticola con actividades para mejorar la potencia sexual, eliminar los radicales libres y antienvejecimiento. Tres componentes químicos de los PhG son el ácido orgánico, el sacárido y el feniletanol aglicón (Fig. 3). Los ácidos orgánicos, incluidos el ácido cafeico, el ácido ferúlico y el ácido cumálico, son productos de la vía de biosíntesis de fenilpropanoides. Los componentes del sacárido, incluidas la glucosa y la ramnosa, son productos de las vías del metabolismo de los carbohidratos, como el metabolismo del almidón y la sacarosa, el metabolismo de los aminoácidos y los azúcares nucleótidos, el metabolismo de la fructosa y la manosa, etc. Sin embargo, la vía de biosíntesis de la parte del feniletanol aún no está clara. Aquí, propusimos dos posibles vías de biosíntesis de feniletanol basadas en nuestros datos de secuencia. Una es la vía del ácido cafeico o del ácido ferúlico, también conocida como vía del ácido cinámico, que es similar a la vía principal de la biosíntesis de lignina. Otro se basa en la vía del metabolismo de la fenilalanina (Fig. 3), en la que la conversión de fenilalanina a feniletanol se logró mediante una conocida 'vía de Enrlich' que se encontró por primera vez en la levadura hace un siglo y se validó en flores de petunia, tomate y rosa. Se detectaron expresados en el tallo de C. deserticola cuatro genes enzimáticos que codifican aspartato/tirosina aminotransferasa, histidina-fosfato aminotransferasa y amina oxidasa primaria, que son responsables de la conversión de fenilalanina en feniletanol. El producto de feniletanol puede oxidarse aún más mediante monooxigenasa o metilarse mediante metiltransferasa en sus derivados (feniletanol aglicon) que participan en la biosíntesis de PhG. En resumen, se propusieron dos supuestas vías de biosíntesis de feniletanol aglicona paraC. deserticolapero aún necesita más estudios en más profundidad.
Discusiones
En los últimos años, la genómica de las plantas se ha desarrollado rápidamente con la aplicación de tecnología de secuenciación de próxima generación, mientras que pocas investigaciones se han centrado en la genómica de las plantas medicinales del desierto. Es urgente realizar investigaciones genómicas o transcriptómicas para comprender su adaptación a ambientes de sequía y salinidad y la ruta de biosíntesis de los principales componentes bioactivos. El descubrimiento del transcriptoma de novo para algunas plantas medicinales,


como Panax ginseng, Ginkgo biloba y Glycyrrhiza uralensis se explotaron por primera vez utilizando la plataforma Roche 454 por su larga duración de lectura. Debido a la eficaz capacidad de ensamblaje con lecturas cortas, especialmente las lecturas ventajosas de extremos emparejados, la secuenciación y el ensamblaje del transcriptoma basado en Illumina también se han utilizado ampliamente para organismos modelo y no modelo. En el presente estudio, generamos alrededor de 8G de lecturas de extremos pares de 101 pb y produjimos secuencias unigene más largas con una longitud promedio de 725 pb. Los datos del transcriptoma específico del tallo a gran escala podrían proporcionar datos de referencia útiles y usarse para extraer el metabolismo secundario de los componentes bioactivos de C. deserticola. El 81,62% del total de lecturas sin procesar pasaron filtros de calidad estrictos (incluido el recorte del adaptador y el descarte de lecturas de baja calidad) antes del ensamblaje, lo que sugiere la alta calidad de nuestros datos de secuenciación, y el 82,08% de las lecturas de alta calidad fueron útiles para el ensamblaje. Otras lecturas que no se pudieron utilizar para el ensamblaje pueden deberse a errores de secuencia, parámetros de ensamblaje, etc. Esas lecturas de alta calidad no utilizadas siguieron siendo útiles para mejorar el ensamblaje de novo combinado con lecturas más largas de otra plataforma (como Roche 454) en el futuro.

CISTANCHE TUBULOSA NATURAL PARA MEJORAR LA FUNCIÓN SEXUAL PHGS75% ECH 30% ACT 12%
Una gran cantidad de transcripciones ensambladas (30.098) mostraron altas similitudes de secuencia con genes conocidos en bases de datos públicas, lo que sugiere que nuestros datos de extremos emparejados basados en Illumina cubrían una fracción sustancial de las transcripciones de C. deserticola. Las transcripciones sin coincidencias BLAST pueden deberse a regiones 3' o 5' no traducidas, ARN no codificante o nuevas secuencias genéticas de C. deserticola. Las transcripciones expresadas se anotaron en una amplia gama de categorías GO y vías KEGG (Tablas 3 y 4), en las que muchas transcripciones se asignaron a vías secundarias relacionadas con el metabolismo. Como sabemos, el fenilpropanoide puede funcionar como un compuesto antimicrobiano inducible con gran beneficio para un estilo de vida clandestino [1], y también actuar como una molécula señal en las interacciones entre plantas y microbios, además de su utilidad medicinal [68, 69]. El terpenoide se utiliza para la biosíntesis de componentes bioactivos (como 6-desoxicatalpol) [70]. Descubrimos que los genes implicados en la vía de biosíntesis de la columna vertebral de fenilpropanoides y terpenoides eran muy abundantes en C. deserticola. Más importante aún, el descubrimiento de vías bien representadas de biosíntesis de lignina (Fig. 3) indicó el proceso metabólico activo de la lignina en el tallo de C. deserticola. Se detectaron expresión de todos los genes enzimáticos conocidos implicados en la biosíntesis de lignina (Fig. 3), y cuatro enzimas clave, incluidas PAL, CCR, HCT y F5H, tuvieron una menor abundancia de expresión (FPKM 26,47, 3,89, 3,4 y 3,83, respectivamente) en comparación con otros genes enzimáticos (Tabla 6). Merece la pena estudiar más a fondo si el cambio de expresión de esos tres genes podría influir o no en la producción de lignina en C. deserticola. PAL es una enzima clave en la biosíntesis de lignina y también participa en la biosíntesis de fenilpropanoide, resveratrol, flavonoide y cumarina [71–74]. Detectamos cuatro genes PAL distintos en el genoma de C. deserticola (Fig. S2), lo que coincidía con el hecho de que PAL estaba codificado por una pequeña familia multigénica [39, 43, 45–49] y demostramos además que puede desempeñar funciones importantes en el flujo metabólico de carbono. .
PhG es el principal ingrediente activo de C. deserticola. Los genes implicados en la biosíntesis de feniletanol son importantes para la calidad de C. deserticola. Dedujimos dos vías de biosíntesis diferentes de feniletanol y 17 genes enzimáticos involucrados en la biosíntesis de PhG en el tallo de C. deserticola. Los posibles procesos post-ácido cafeico/ferúlico (Fig. 3) también se dedujeron por primera vez basándose en una fórmula estructural de intermedios y propiedades catalíticas de las enzimas correspondientes, en las que el ácido cafeico/ferúlico se oxidaría primero en un derivado de fenilpiruvato; luego, el grupo carboxilo fue privado por descarboxilasas; finalmente, la deshidrogenasa volvió a convertir el grupo aldehído en un grupo alcohol. Esta es la primera aplicación de la tecnología de secuenciación de extremos emparejados de Illumina para investigar el transcriptoma completo de C. deserticola y ensamblar lecturas de RNA-seq sin un genoma de referencia. Este estudio proporcionará recursos útiles y secuencias de genes para la investigación de genómica funcional y proteómica de C. deserticola en el futuro.
Conclusiones
En este estudio, perfilamos el transcriptoma del tallo de C. deserticola basándose en datos de secuenciación de alto rendimiento, identificamos genes involucrados en las vías de biosíntesis de la lignina y también inferimos por primera vez la posible vía de biosíntesis de las PhG, lo que sin duda acelerará la comprensión. de los ambiguos procesos fisiológicos y del gran valor medicinal a nivel molecular. Hasta ahora, este es el primer intento de ensamblar de novo todo el transcriptoma del tallo de C. deserticola y detectar la vía de biosíntesis de componentes medicinales utilizando conjuntos de datos de secuenciación basados en Illumina. Nuestro estudio puede promover el desarrollo de medicinas naturales y la selección de cultivares con rasgos medicinales.

CISTANCHE TUBULOSA NATURAL PARA MEJORAR LA FUNCIÓN SEXUAL PHGS75% ECH 30% ACT 12%







