论文部分内容阅读
第一章RP1-276N6.2、TARID基因遗传变异与中国汉族人群冠心病的关联研究目的:研究RP1-276N6.2基因区域的遗传变异rs611950、rs10499313、rs505000位点以及TARID基因区域的遗传变异rs1966248、rs2327429、rs2327433、rs12190287、rs6569912位点与冠心病发病风险的关系,并探索RP1-276N6.2和TARID基因表达水平与冠心病的潜在关联。方法:本研究采用病例对照研究的方法,严格按照纳入排除标准在医院收集冠心病患者及对照人群的血样、临床检测信息和流行病学资料。本研究共在中国重庆汉族人群中纳入949例冠心病病例和892例对照。采用Taq Man Assay基因分型法对位于RP1-276N6.2基因上的单核苷酸多态性rs611950、rs10499313、rs505000位点和位于TARID基因上的rs1966248、rs2327429、rs2327433、rs12190287、rs6569912位点进行基因分型。采用Haploview软件分析各SNPs之间的连锁关系,采用SHEsis软件进行各SNPs组合的单倍型分析及频率估计,采用SPSS22.0软件完成统计分析。采用GTEx数据库完成e QTL分析,采用R 3.6.0完成基因表达水平的相关分析与作图。结果:1.病例对照基本情况分析结果显示:冠心病病例组具有较高的吸烟率、空腹血糖和收缩压,而舒张压、总胆固醇、高密度脂蛋白、低密度脂蛋白、饮酒史率、高血压病史率和糖尿病病史率较低,以上差异均具有统计学意义(P<0.05)。2.SNPs与冠心病发病风险的关联分析结果显示:按照年龄分层分析显示,在早发CAD组,rs611950位点的基因型和等位基因在病例组和对照组中的频率分布差异均具有统计学意义(P<0.05),rs611950的T等位基因较C等位基因能明显增加早发CAD发病风险(OR=1.32,95%CI:1.05-1.66,P=0.02),rs10499313位点的AG基因型较AA基因型明显增加早发CAD的发病风险(OR=2.11,95%CI:1.31-3.39,P<0.01),rs505000位点的GG基因型和G等位基因在病例组中的分布频率明显低于对照组,差异具有统计学意义(P<0.05),且rs505000的G等位基因较C等位基因明显降低早发CAD发病风险(OR=0.74,95%CI:0.59-0.93,P=0.01),rs1966248的AA基因型在病例组中的分布频率高于对照组,差异具有统计学意义(P<0.05);在迟发CAD组,rs505000位点CG基因型较CC基因型能明显增加迟发CAD发病风险(OR=1.39,95%CI:1.03-1.89,P=0.03)。按照性别分层分析发现,在男性CAD组中,rs2327433位点的基因型和等位基因在病例组与对照组中的频率分布差异具有统计学意义(P<0.05),且G等位基因较A等位基因能明显增加男性CAD的发病风险(OR=1.38,95%CI:1.07-1.78,P=0.01);在女性CAD组中,rs10499313位点的AG基因型在病例组中的分布频率明显高于对照组,差异具有统计学意义(P<0.05)。在心肌梗死组中的分析结果显示,rs505000的G等位基因较C等位基因能明显降低MI的发病风险(OR=0.78,95%CI:0.63-0.98,P=0.04),rs2327429位点的CC基因型较TT基因型能明显降低MI的发病风险(OR=0.55,95%CI:0.31-0.97,P=0.04)。3.e QTL分析结果显示:RP1-276N6.2基因上的rs611950位点的基因型在骨骼肌、食管粘膜等组织中与RP1-276N6.2基因表达水平显著相关,还与临近的CAD易感基因SLC22A3的表达水平显著相关(P<1×10-5);TARID基因上的rs2327429、rs6569912和rs12190287位点的基因型在冠状动脉组织中与TARID和下游临近的CAD保护基因TCF21基因表达水平显著相关(P<1×10-5)。4.基因表达水平相关分析:在血管组织中的分析结果显示,TARID基因与TCF21基因的表达水平线性相关(R=0.62,P=6.28×10-67),再分别在颈动脉、冠状动脉和胫动脉组织中的分析结果显示,TARID与TCF21表达水平仍然显著相关,且在冠状动脉组织中的相关系数值最大(R=0.50,P=7.52×10-9);且TARID基因在动脉粥样斑块中的表达水平明显低于正常组织,差异具有统计学意义(P=5.52×10-4)。结论:1.分层分析发现,rs611950、rs10499313、rs505000、rs1966248与早发CAD发病风险有关,rs505000的CG基因型能显著增加迟发CAD的发病风险;rs2327433、rs10499313分别与男性CAD、女性CAD发病风险有关;本研究还发现,rs505000的等位基因与MI有关,rs2327429的CC基因型能显著降低MI的发病风险。2.e QTL分析结果显示,RP1-276N6.2上的rs611950位点基因型、TARID上的rs2327429、rs6569912、rs12190287位点基因型在不同组织中既与宿主基因表达水平相关又与邻近冠心病易感基因表达水平显著相关。3.在冠状动脉组织中,TARID与TCF21表达水平显著相关,且TARID在动脉粥样斑块中的表达水平显著下调。第二章通过加权基因共表达网络分析(WGCNA)构建冠心病发生进程相关的关键Lnc RNA网络目的:采用加权基因共表达网络分析(WGCNA)为主的生物信息学分析工具,筛选可能与冠心病发生发展相关的关键lnc RNA基因,并分析其潜在的生物学功能,为冠心病的筛查和诊疗提供科学依据。方法:利用WGCNA算法对141例CAD病例与对照人群外周血单核细胞基因表达谱进行分析,将差异基因划分在不同模块,并结合疾病分组信息,选取与CAD高度相关的基因模块进行网络构建。通过GO功能注释和KEGG通路富集分析基因模块的分子功能以及参与的信号通路。在基因模块内构建ce RNA调控网络,根据基因显著性(GS)和模块身份(MM)筛选基因网络中的枢纽lnc RNA基因,绘制受试者工作特征曲线来判断候选lnc RNA的生物标志物特性。结果:对48例正常样本和93例冠心病样本的基因表达数据进行差异分析,绘制火山图和热图展示基因差异分析结果,选取5000个差异基因(包括前2500个lnc RNA和前2500个m RNA)的表达矩阵和疾病分组信息进行WGCNA分析,结果显示turquoise模块与冠心病有关,且相关系数最大(R=0.75,P=7.00×10-27)。通过GO分析发现turquoise模块内基因主要参与转录调控和免疫调控等生物过程,KEGG分析显示基因主要参与炎性反应和免疫反应相关信号通路。对turquoise模块构建ce RNA调控网络,利用Cytoscape对网络进行可视化处理,构建出lnc RNA-mi RNA-m RNA的网络图形,结合GS与MM相关分析,共发现10个lnc RNA既可能参与ce RNA网络调控也是turquoise模块内的枢纽基因,同时ROC分析结果显示这10个lnc RNAs可能具有冠心病诊断标志物的潜力(AUC>0.9,P<0.05)。结论:通过WGCNA分析,共筛选到10个关键lnc RNAs基因,包括DGCR5、LINC00161、LINC00222、LINC00315、LINC00461、LINC00504、PWRN1、DSCR10、LINC00092和TTTY14,这些lnc RNAs很可能通过ce RNA网络调控冠心病发生发展过程,且具有较好的冠心病诊断标志物潜力。