论文部分内容阅读
背景精神分裂症是所有重大精神疾病综合征中最难被定义和描述的。虽然遗传因素在精神分裂症的发病中起着重要的作用,但迄今为止,没有发现某一个基因可以完全解释精神分裂症的发生。精神分裂症的遗传模式具有很高的异质性,所有的风险基因可能仅有较低的相对危险性,或者基因的致病风险是由于大量的单核苷酸多态性(Single nucleotide polymorphism, SNP)变异所引起。遗传连锁分析和候选基因的关联分析研究发现了与精神分裂症一些可能相关易感基因,如6p24-22、13ql4-q33、8p22-p21等,但效应值(effect size)都很小(0R<1.5),且每项研究结果不尽相同,重复性差。在揭示精神分裂症分子遗传学机制,找到与精神分裂症发生强相关的多个易感基因和易感位点的方向上立题具有重要生物学意义。目的寻找到与精神分裂症发生强相关的多个易感位点和基因,探究这些易感位点所在基因是否存在协同效应,为精神分裂症病因学研究提供相关分子遗传学证据和生物学线索。方法基于前期300例精神分裂症患者的GWAS性结果数据,使用R语言筛选出P<5×10-8的前500个强阳性SNPs,再到NCBI网站和HapMap数据库搜索与精神分裂症相关联的基因,算出阳性SNPs与假阳性率(false positive rate, FPR)的OR值,选出OR值在0.9-1.1之间,P值排名前20的强阳性SNPs。筛选出Catalog数据库202个精神分裂症的GWAS基因,使用WEB pathway行代谢途径和信号通路显著性富集分析,再使用K-clique方法进行疾病一代谢相互作用网络分析。为进一步提高预验证SNPs的价值和真关联,去除假阳性SNPs,结合生物信息Catalog和dbGaP共享数据库,将性状对回数据库,筛选出已有研究但未见报道的两个数据库,对已获取的数据进行基因本体功能显著性富集分析(Gene Ontology, GO)。利用GESA分析对筛选出Catalog数据库202个基因中与前期300精神分裂症GWAS数据是否具有相似功能学背景进行验证。通过所有pathway分析中共同提示具有统计学意义的通路,结合Pathway分析筛选出与精神分裂症强相关的易感基因,利用NCBI网站和HapMaP数据进一步定位相关基因和SNPs。对筛选出与精神分裂症相关的易感位点进行大样本群体验证,选择n=1000例的中国的汉族精神分裂症患者作为病例组,n=1000例中国的汉族健康正常人作为对照组,应用基因芯片技术对上述所有单核苷酸多态性位点进行基因分型,统计分析采用P值做检验,筛选出P<0.05,OR>1.2的SNPs。并进行频率分析寻找与精神分裂症相关的单倍型,从而揭示与精神分裂症发生强相关的易感基因和易感位点,并探究这些易感位点所在多个基因是否存在协同效应。结果本研究筛选出了7个可用于精神分裂症强相关的SNPs位点,分别是:rs 12991836 (ZEB2),rs1261117(TCF4),rs7172342(RORA),rs893290(RORA),rs7045881(PLAA), rs1006737 (CACNA1C), rs10503256 (CSMD1).结论ZEB2, TCF4, RORA, PLAA, CACNA1C, CSMD1基因可能是精神分裂症的易感基因。