论文部分内容阅读
研究背景麻风是一种由麻风分枝杆菌感染引起的慢性炎症性皮肤病。它影响皮肤和周围神经,并可造成不可逆的神经功能损害以及后续不可逆的慢性残疾。宿主遗传因素被认为会影响对感染的易感性以及疾病进展。麻风风险与主要组织相容性复合体(MHC)区域内的变异强相关,尤其是人分白细胞抗原HLA-DRβ1。2009年我们对中国汉族人706例麻风患者和1225例对照进行全基因组关联分析(GWAS),发现HLA-DR区域与麻风易感性显著相关,但对于HLA的整个区域目前尚未完全阐明。HLA区域定位于6p21.3,在生物体中发挥着重要的遗传学和免疫学作用,该区域已被确定与超过200种疾病或性状有关联,包括原发性免疫缺陷、自身免疫性疾病、感染、恶性肿瘤和精神疾病。目前一般将其分为三分,HLA-I分基因、HLA-II分基因、HLA-III分基因,经典的HLA-I分基因包括HLA-A、HLA-B、HLA-C等,经典的HLA-II分基因包括HLA-DP、HLA-DR、HLA-DQ等,HLA区域的遗传学特点包括单倍型遗传、共显性遗传、连锁不平衡性,由于HLA区域的高度复杂性,进一步确定HLA区域与很多疾病之间的具体关联一直是个难以攻克的难题。基因型填充(Imputation)是指运用已知的基因分型数据对没有进行基因分型的和基因分型数据缺失的位点进行预测的技术,是一种目前被广泛应用的精细定位方法。基因型填补能增加GWAS数据中的中单核苷酸多态性(single—nucleotide polymorphism,SNP)的密度,使得我们在已经发现的关联性位点的周围去寻找疾病位点为可能,同时也能提高对于采用了不合适的标签SNP进行标记的SNP位点的检验效能。汉族人MHC参考变异谱(Han-MHC reference panel)是我们研究团队2016年从总的MHC遗传变异数据库中提取最小等位基因频率≥0.5%的变异位点构建的,与既往研究所用的相关变异谱相比,其拥有更深的测序深度、有着更完整精确的变异信息。研究目的1)对既往研究中麻风全基因组关联分析的数据进行基因型填补;2)通过逐步条件回归分析发现麻风相关独立位点;3)发现HLA区域麻风易感基因,进一步阐明HLA区域与麻风的风险关联性。研究方法利用既往GWAS数据,使用SNP2HLA软件,运用汉族人群特异性参考数据可做为参考序列对HLA区域(I分和II分HLA基因和相应的氨基酸位点)进行基因型填补分析。选择区域内有潜在意义HLA位点,进行逐步条件回归分析,以及蛋白质空间构图。研究结果本课题研究利用前期麻风GWAS数据,以汉族人特异性参考序列做为参考平台,通过SNP2HLA对HLA区域进行了基因型填补分析,经过质控后发现了23,508SNP位点,发现总共30个HLA等位基因、184个氨基酸变异位点达到全基因组关联水平,其中P值最显著的等位基因为HLA-DRB1*15(P=1.28×10-42,OR=2.71,95%CI=2.34-3.14),为既往多个研究报道的麻风易感位点。为了进一步确定麻风相关性独立位点,运用逐步条件回归分析对质控后数据进行进一步分析,显示有六个独立信分达到研究范围的显着性阈值(P<1.67×10-6),HLA-DPβ1分子第71位氨基酸残基(P=1.28×10-42,OR=2.71,95%CI=2.34-3.19),HLA-DPβ1分子第35位氨基酸残基(P=1.75×10-14,OR=0.60,95%CI=0.52-0.68),HLA-C分子第116位氨基酸残基(P=5.12×10-11,OR=1.68,95%CI=1.44-1.96),HLA-A分子第152位氨基酸残基(P=1.16×10-11,OR=2.24,95%CI=2.83-6.79),HLA-DRB1*13:02(P=8.58×10-7,OR=2.28,95%CI=1.64-3.17),HLA-B*07:02(P=9.14×10-6,OR=2.40,95%CI=1.61-3.41)。通过对四个氨基酸位点的蛋白质空间构象分析,发现四个HLA分子氨基酸残基都位于抗原结合区域。研究结论本研究对HLA区域进行基因型填充精细定位,发现了6个麻风相关性的独立信分,增加了新的麻风相关位点,为麻风病的预防、诊断、治疗提供了新的方向。