论文部分内容阅读
目的:人类免疫缺陷病毒(Human Immunodeficiency Virus,HIV)早期感染是从HIV病毒入侵宿主到感染后6个月内,在此阶段,血浆中病毒载量迅速升高,先天免疫细胞产生促炎细胞因子,同时适应性免疫反应逐渐增强,随后病毒载量下降至一个稳定水平。HIV感染早期宿主与病毒的相互作用影响HIV病毒传播率、疾病进展以及HIV相关的发病率和死亡率。然而早期HIV感染的发病机制仍不完全清楚。因此,探索早期感染过程中HIV致病机制以及宿主抗病毒反应,能够为筛选疾病相关标志物及研发有效的HIV治疗策略提供新的思路。长链非编码RNA(long noncoding RNAs,lncRNAs)是一类长度大于200nt但却不编码蛋白质的RNA,近年来受到了广泛的关注。在各种复杂的生物过程中,lncRNAs可作为引导分子、支架分子、诱饵分子和信号分子等发挥作用;也可以作为cis或trans调控元件靶向基因组位点或通过反义干扰靶向基因;其中,lncRNAs能够作为“miRNA sponges”或被称为竞争性内源性RNA(competing endogenous RNAs,ceRNAs)与特定的miRNA结合并调控miRNAs的表达和功能。与HIV相关的几个转录组分析研究从不同角度探索了 lncRNAs在HIV感染中的潜在功能,发现lncRNAs影响HIV病毒复制,影响HIV潜伏感染的建立和逆转,与疾病进展有关等。然而,lncRNAs在早期HIV感染中的作用尚未见报道。本研究应用RNA-seq和miRNA-seq技术获得了 3名未经抗病毒治疗的早期HIV感染者和3名健康对照者的lncRNA、miRNA和mRNA表达谱,并且进一步筛选出差异表达的lncRNAs、miRNAs和mRNAs,通过预测lncRNA顺式调控mRNA靶标以及构建lncRNA-miRNA-mRNA ceRNA调控网络两种生物信息学方法,来分析lncRNAs的潜在作用。结果提示lncRNA可能参与了早期HIV-1复制和免疫激活,上述研究结果为有助于我们进一步了解HIV的致病机制,为治疗策略提出新的潜在靶点。研究方法:1、研究对象:本研究招募的未治疗HIV早期感染者和健康对照者均来自中国辽宁一个大规模前瞻性的高危男男同性性行为(men who had sex with men,MSM)人群队列。HIV早期感染定义为HIV感染180天内。3例未治疗HIV早期感染者和3例健康对照者被纳入RNA-seq和miRNA-seq研究,健康对照者来自HIV阴性的MSM人群,上述研究对象均无单纯疱疹病毒、梅毒、乙型肝炎病毒以及丙型肝炎病毒感染。8例未治疗HIV早期感染者和10例健康对照者纳入本研究用于差异表达基因(mRNA,lncRNA,miRNA)qRT-PCR验证。2、总RNA提取以及质控:分离3例未治疗HIV早期感染者和3例健康对照者全血中的PBMC,使用TRIzol获得PBMC中的总RNA,使用NanoDrop ND-2000仪/NanoDrop ND-1000仪测量每个样品的RNA浓度和纯度用于后续测序。3、RNA测序及分析:使用Ribo-ZerorRNA removal kits将总RNA中的核糖体RNA分子(rRNA)去除。RNA预处理以及测序文库的构建使用TruSeq Stranded Total RNA Library Prep Kit 来完成。在 Illumina HiSeq 2500测序仪上进行 150 个周期测序后获得双端reads。使用Cutadapt(v1.9.3)软件获取高质量清洁reads,使用hisat2软件(v2.0.4)将其与人类参考基因组(UCSC hg19)比对。然后,使用cuffdiff软件来获得mRNAs和lncRNAs的表达谱。4、miRNA测序及分析:使用总RNA制备miRNA测序文库。随后在Illumina HiSeq 4000测序仪上进行测序。使用Cutadapt(v1.9.3)软件获得长度>=15 nt的reads。然后,使用miRDeep2软件(v2.0.0.5)预测新的miRNAs。使用miRbase和NovoAlign软件比对trimmed reads来获得已知的和新预测的pre-miRNAs。miRNA的原始表达水平是通过每条成熟miRNA上的tag数来确定的,并使用TPM(tag counts per million aligned miRNAs)方法进行标准化。5、差异表达lncRNA的顺式调控靶mRNA分析:使用LncRNA Disease database预测与非基因间(non-intergenic)差异表达lncRNAs重叠的mRNAs。然后,通过 HIV 相互作用数据库、LncRNADisease database 和 Genecard database三个数据库共同确定与HIV感染相关的顺式调控靶标mRNAs。此外,对每个差异表达lncRNA转录起始位点和转录终止位点的上游或下游300 kb基因组距离内的邻近差异表达的mRNA进行筛选。6、ceRNA调控网络构建:使用LncLocator和iLoc-LncRNA筛选定位于细胞核的lncRNAs被排除在ceRNA 1网络分析之外。使用DIANA tools-LncBasev.2和miRDB databases预测差异表达lncRNAs的潜在差异表达靶miRNAs。使用TargetScan和miRDB databases预测差异表达miRNAs潜在差异表达mRNAs靶标。根据上述预测到的相互作用关系构建ceRNA网络,并使用Cytoscape软件(v3.6.0)进行可视化。此外,使用miRTarBase database查询经过实验验证的miRNA-mRNA相互关系。7、ceRNA网络中差异表达mRNAs的GO和KEGG分析:对于ceRNA网络中差异表达 mRNAs,使用 DAVID 6.8 数据库(Database for Annotation,Visualization and Integrated Discovery)对其进行 GO(Gene ontology)和 KEGG(Kyoto Encyclopedia of Genes and Genomes)分析。p<0.05 为差异有统计学意义。8、lncRNAs,mRNAs 和 miRNA 差异表达验证:使用 miRNasy Mini Kit 提取总RNA。使用PrimpScript(?)RT试剂盒反转录总RNA以验证lncRNA和mRNA,用 Mir-XTM miRNA First-Strand Synthesis Kit 反转录总 RNA 以验证 miRNAs。TB Green PreMix Ex TaqTMI 用于 qRT-PCR。分别以 GAPDH 和 U6 为内源性对照进行 lncRNA/mRNA qRT-PCR 和 miRNA qRT-PCR。用 2-ΔΔCt 法计算 lncRNAs、mRNAs和miRNAs的相对表达量。9、统计分析:GraphPad Prism v8.0用于进行统计分析和制图,p<0.05为差异有统计学意义。结果:1、未进行抗逆转录病毒治疗的早期HIV感染者与健康对照者之间存在差异表达的 lncRNAs、mRNAs 和 miRNAs根据3名早期未治疗HIV感染者和3名健康对照者PBMC的RNA-seq结果,共检测到17235个lncRNA转录本的表达,其中242个lncRNAs在两组之间差异表达倍数变化高于2(P<0.05),包括36个上调的lncRNAs和206个下调的lncRNAs。同时我们共检测到16410个mRNA转录本,1240个mRNAs表达有显著性差异,包括344个上调的mRNAs和896个下调的mRNAs。根据miRNA-seq结果,共检测到1090个成熟miRNA,21个miRNAs表达有显著性差异,包括7个上调的miRNAs和14个显著下调的miRNAs。2、RNA-seq 和 miRNA-seq 结果验证我们从差异表达的mRNAs、lncRNAs和miRNAs中随机选择了 3个lncRNAs(ENST00000488545,ENST00000571722和 ENST00000602507),3 个mRNAs(ATF3,FOS和 CDCA7)和 3 个 miRNAs(miR-3 1-5p,miR-484和 miR-3174)进行 qRT-PCR 验证,qRT-PCR结果与 RNA-seq 和 miRNA-seq 结果一致(P<0.05),表明上述测序研究结果的可靠性,可用于后续分析。3、差异表达的lncRNAs特征差异表达的lncRNAs被分为六大类。此外,差异表达的lncRNAs的长度为131nt~6000 nt以上,大部分差异表达的lncRNAs分布在501-1000、1001-2000和2001-3000nt这3个区间。差异表达的lncRNAs分布在22个常染色体和X染色体上。4、lncRNAs通过顺式调控机制调节mRNAs影响早期HIV病毒感染通过预测与非基因间lncRNAs重叠的mRNAs,发现4个差异表达的lncRNAs可能调控4个差异表达的mRNA,且上述mRNA可能与HIV病毒感染有关;通过预测差异表达lncRNAs临近的潜在mRNAs靶标,发现3个上调的基因间 lncRNAs(ENST00000364880、ENST00000571722、ENST00000577988)可能调节下调的mRNA-GRAP,下调的基因间lncRNAs ENST00000492960和TCONS00006930可能分别靶向下调的mRNA-ZAP70和-BTLA,推测上述lncRNA可能与T细胞激活和HIV-1复制有关。5、lncRNAs通过ceRNA调控网络影响早期HIV病毒感染为了进一步阐明HIV早期感染差异表达lncRNAs、miRNAs和mRNAs之间的相互作用,我们构建了 lncRNA-miRNA-mRNA网络。160个差异表达lncRNAs、21个差异表达miRNAs和175个差异表达mRNAs被纳入分析,构建了两个ceRNA网络:一个包含136个下调的lncRNAs、7个上调的miRNAs和97个下调的mRNAs;另一个包含24个上调的lncRNAs、14个下调的miRNAs和78个上调的mRNAs。此外,在ceRNA网络中发现了 31个实验验证的miRNA-mRNA相互作用,134个差异表达lncRNAs可能通过上述验证的miRNA-mRNA发挥作用。为了探索差异表达lncRNAs及其相关ceRNA网络在HIV早期感染中的作用,我们对ceRNA网络中175个差异表达的mRNAs做了 GO分析和KEGG通路分析,前十条GO通路大多数与转录相关,KEGG分析发现了 5条显著富集的通路,其中5个上调的mRNAs:HIF1A、TCF7L2、FOS、FOSB和JUN在多个通路中出现,上述基因可能参与了 HIV病毒复制及细胞活化过程。进一步分析发现,17个差异表达的lncRNAs可能通过竞争性吸附hsa-miR-548ah-3p解除对靶基因HIF1A和TCF7L2的限制,20个差异表达的lncRNAs可能通过4个差异表达的 miRNAs(miR-101-3p,miR-139-5p,miR-548ah-3p 和 miR-27b-3p)影响FOS、JUN和FOSB基因表达,上述lncRNAs对靶基因的调控及在HIV感染中的作用有待于进一步验证。结论:本研究系统分析了 HIV感染早期lncRNA、miRNA和mRNA表达谱的变化,发现部分lncRNAs以顺式调控机制调节ZAP70、BTLA和GRAP的表达,通过ceRNAs网络调控HIF1A、TCF7L2、FOS、FOSB和JUN等基因的表达,从而影响HIV病毒复制及细胞活化。上述结果有待于进一步实验验证。我们的结果为有助于进一步了解HIV的致病机制,为治疗策略提出新的潜在靶点。