论文部分内容阅读
目的:应用DNApooling全基因组重测序技术初步筛查CAD易感基因变异位点并进行功能分析。方法:分别收集CAD病例组血液样本和正常对照组血液样本各100例。提取病例组和对照组DNA,制作DNApooling进行建库测序,将两组测序结果分别与NCBI人类基因库hg19进行比对,初步在SNPs、InDels、SVs和CNVs四大类变异位点进行筛选,并应用ANNOVAR软件对所有的变异位点进行分类。再将两组检测到的基因变异位点数据,进行比对分析,初步筛查出与CAD相关的变异位点;再应用PPI网络分析软件进行第二次筛选,并用GO功能软件将这些筛选出的基因变异位点进行初步功能分析。结果:(1)病例组和对照组分别产生了1057326436个和1016731048个的原始reads,分别以45.77倍和43.85倍的测序深度得到了99.94%和99.95%的极高覆盖率。所得到病例组和对照组的数据与参考序列之间分别有994931429个和956586404个的reads与参考序列相匹配,匹配率分别达到了95.62%和95.68%,错误匹配率分别为0.57%和0.57%;其中高质量reads分别达到了966749987个和930497682个,分别占到所有数据的95.62%和97.27%。(2)通过实验组和对照组对比分析得到28,772个SNPs位点、17,654个InDels位点、278个SVs位点和882个CNVs位点,发现无论是在全基因组范围内还是在编码区C:G→T:A的变异类型最多,分别达到14,457个和85个位点。(3)利用cytoscape软件构建蛋白质互相作用(protein-protein interaction,PPI)网络,最终获得SERPINA3,ABL,ADRA1A,FAS,ATBF1,BDKR-B2,BSG,SERPING1,C3,DDR1,CASR,CD4,CD9,COL4A3,COL5A1,CP,CR1,CSNK2B,CSPG2,EPHB1,PTK2B,FBLN2,FBN2,GLG1,GNA12,GNAS,GRM5,HD,HLA-A,HLA-B,HLA-DQA1,HLA-DQA2,HLA-DQB1,HLA-DRA,IGF1R,RBPSUH,IL1A,I L1RN,IL4R,ITGA2B,ITGB3,KNG1,LCT,LRP2,MAPT,MSR1,NFKB1,P2RX7,PLC G2,PPYR1,PRKDC,MAPK8,MAPK9,MASP1,RAF1,SELL,TG,TGFBR2,TNR,USH 2A,LRP8,CUBN,RAPGEF4,AKAP13,CARD8,MACF1,CABIN1,HIPK2,MUC16等73个与CAD显著相关易感基因。(4)通过GO功能分析发现73个变异位点,大部分的变异基因功能集中在炎症、细胞粘附、脂代谢调节、凝血及纤溶、信号转导、细胞凋亡、细胞增殖等方面,其中ADRA1A,CABIN1,CP,GRM5,LCT,NPY4R,TNR,TG8个位点为新发现变异位点。CD4,FAS,C3,IGF1R,IL1A,IL1RN,IL4R,HLA-A,HLA-B,HLA-DQA1,HLA-DQA2,HLA-DRA,HLA-DQB1,SELL参与免疫反应,CD4,CD9,COL4A3,COL5A1,DDR1,ITGA2B,ITGB3,MUC16,SELL,TNR,VCAN参与细胞粘附,FAS,BDKRB2,C3,IL1A,KNG1,NFKB1,P2RX7,SERPINA3参与炎症反应,GNAS,ITGA2B,CD9,GNA12,RAF1,ITGB3,PLCG2,KNG1,SERP2NG1参与血液凝集,FAS,RAF1,ADRA1A,CARD8,HTT,IL1A,NFKB1,PTK2B,TGFBR2参与细胞凋亡,ABL1,FAS,IL4R,PTK2B,TGFBR2参与细胞增殖,LRP2,LRP8,IL1RN,PLCG2,MAPT,C3,NFKB1参与脂质代谢,DDR1,ITGB3,ADRA1A,BDKRB2,参与平滑肌细胞收缩调节,ADRA1A,BDKRB2,参与血管收缩调节,CD4,FAS,LRP8,RAF1,ADRA1A,CSNK2B,C3,IGF1R,IL4R,NFKB1,PTK2B,TG参与信号转导。其中CD4,FAS,C3,SELL,CD9,IL4R,RAF1,LRP8,DDR1,ADRA1A,ITGA2B,NFKB1,PTK2B分别参与了两种以上功能,这也从一个侧面说明每一个功能有多个基因参与,而每一个基因可能参与不同的功能。结论:1、通过全基因组重测序技术在全基因组水平上筛查CAD易感基因,并应用PPI网络分析筛查出73个与CAD相关易感基因变异位点:SERPINA3,ABL,ADRA1A,FAS,ATBF1,BDKRB2,BSG,SERPING1,C3,DDR1,CAS R,CD4,CD9,COL4A3,COL5A1,CP,CR1,CSNK2B,CSPG2,EPHB1,PTK2B,FBLN2,FBN2,GLG1,GNA12,GNAS,GRM5,HD,HLA-A,HLA-B,HLA-DQA1,HLA-DQA2,HLA-DQB1,HLA-DRA,IGF1R,RBPSUH,IL1A,IL1RN,IL4R,ITGA2B,ITGB3,KNG1,LCT,LRP2,MAPT,MSR1,NFKB1,P2RX7,PLCG2,PPYR1,PRKDC,MAPK8,MAP K9,MASP1,RAF1,SELL,TG,TGFBR2,TNR,USH2A,LRP8,CUBN,RAPGEF4,AKA P13,CARD8,MACF1,CABIN1,HIPK2,MUC16。2、通过GO功能分析发现73个变异位点,大部分的变异基因功能集中在炎症、细胞粘附、脂代谢调节、凝血及纤溶、信号转导、细胞凋亡、细胞增殖等方面,其中ADRA1A,CABIN1,CP,GRM5,LCT,NPY4R,TNR,TG8个位点为新发现变异位点;CD4,FAS,C3,SELL,CD9,IL4R,RAF1,LRP8,DDR1,ADRA1A,ITGA2B,NFKB1,PTK2B分别参与了两种以功能,这也从一个侧面说明每一个信号通路有多个基因参与,而每一个基因可能参与不同的信号通路。3、DNApooling技术的应用为相关疾病的基因研究大大减少了时间和研究经费的消耗。