论文部分内容阅读
慢性乙型肝炎病毒(hepatitis B virus,HBV)感染是世界范围内主要的感染病之一,慢性感染约3.5亿人,从无症状携带、急性肝炎、慢性肝炎、重型肝炎到肝硬化、肝细胞癌(HCC),形成了复杂的疾病谱。持续感染的形成和疾病进程与多种因素有关,如年龄、性别、宿主的免疫状态(婴幼年感染/成人感染)、HBV基因型、丙型肝炎病毒(HCV)/丁型肝炎病毒(HDV)/人类免疫缺陷病毒(HIV)重叠感染等。东亚地区HBV的感染率、慢性携带率、疾病严重程度、流行程度等都明显高于欧美地区。宿主因素,尤其是宿主基因,影响HBV感染和疾病进程的许多阶段。分离分析和双生子研究提示宿主遗传因素对疾病表型起着关键的作用。探讨慢性HBV感染的宿主遗传易感性,将为我们从另一角度认识HBV感染及发病机制提供新的线索,并为临床防治提供新的、合理的策略。文献已报道MHC-Ⅰ、Ⅱ位点,甘露糖结合蛋白,TNF-α启动子,IL-10启动子及维生素D受体等基因的多态性与慢性HBV感染有关。常见复杂疾病(肿瘤、高血压、糖尿病、精神分裂症、哮喘、自身免疫疾病、感染病等)由许多微效累加基因与环境因素共同作用而决定,对于其遗传易感性的研究,连锁不平衡-关联研究的统计效能显著强于经典的家系连锁分析。免疫组化和分子生物学研究提示雌激素受体α(ESR1)、雄激素受体(AR)、MHC-II反式激活因子(C2TA)、CXCL10和CD209在慢性HBV感染中起作用,但这些基因的多态性在群体水平与慢性HBV感染的关系尚未有研究。我们选择上述5个基因作为侯选基因,拟在中国人群中筛查其单核苷酸多态性(single nucleotide polymorphism,SNP)分布及频率,选择单倍体标签SNP(htSNP)在慢性HBV感染病例/对照及核心家系中分型,并对阳性关联SNP位点的生物学功能意义进行验证。我们用代表中国人群的32个基因组DNA为参考样本进行SNP发掘。在基于医院的样本收集中,从4 112人中筛选出2 489名无亲缘关系的慢性HBV感染者(病例)、自限性恢复者(对照)和参考人群,最终确定了1 405名慢性HBV感染者和749名自<WP=12>限性恢复者作为我们研究所用的病例/对照样本,74名暴露未感染者和261名献血员作为参考样本为了对阳性关联位点进行传递不平衡测试(TDT),另外还收集了315个慢性HBV感染核心家系(慢性HBV感染者及其父母)。提取了研究对象的基因组DNA,并制作成分型所用DNA 模板。针对5个基因的5’侧翼(转录起始位点前约2 kb)、编码区、5’ 和3’ 非编码区、内含子/外显子交界及3’侧翼序列设计引物。扩增片段长度约500~600bp,相邻片段之间重叠120~200bp。PCR产物进行双向测序,序列峰图通过PolyPhred软件检读SNP。个体基因型数据经PHASE软件构建单倍型,计算群体遗传学参数(θ、π、Tajima’s D、Fu and Li’s D、重组分析等);单倍型数据经Stata7.0软件确定单倍型标签SNP;通过LDA软件计算SNP位点之间连锁不平衡参数(D’和r 2),经GOLD软件绘制连锁不平衡图谱,确定连锁不平衡模块。选择有代表性的10个SNP位点,综合采用PCR-RFLP、扩增折射变异位点PCR和直接测序法在病例对照进行分型和核心家系中进行分型。基因型数据采用SPSS9.0统计软件进行率的比较((2检验)和非条件logistic回归分析。采用TDT/S-TDT program1.1进行核心家系传递不平衡测试(TDT)。测序发掘关联位点两侧基因组区域的SNP(每隔30~40kb),采用LDA和GOLD软件分析两侧区域的LD关系,进行LD作图。通过MGB-TaqMan荧光定量PCR检测阳性关联的ESR1外显子1 T49641C杂合子细胞mRNA 相应位点的等位特异性表达量是否存在差异。通过电泳移动漂移分析(electrophoretic mobility shift assay, EMSA)研究阳性关联的CXCL10 5’侧翼G50787A位点两种等位结合核蛋白的能力是否存在差异。我们的主要研究结果如下:1) 5个基因测序覆盖的长度约为41 kb,总的测序长度约为1.312 Mb;共发掘出124个SNPs,6个基因内微卫星位点。在所筛查的基因组区段中,平均SNP分布密度是330 bp/SNP或3 SNP/kb。SNP的分布在基因间的差异很大,如AR基因SNP密度最低,平均2145bp才发现1个SNP(θ=5.86 × 10- 5);而在CXCL10基因约4.2 kb的序列中发现21个SNPs,其密度为201 bp/SNP(θ=10.9 × 10- 4)。Tajima’s D和Fu and Li’s D检验表明5个基因在群体中的变异均无正选择趋势,符合中性进化模型。2) 经Stata7.0软件分析, 14个单倍型标签SNP的组合足以代表5个基因90%以上的单倍型。采用连锁不平衡测度Lewontin系数D’和相关系数r 2对SNP之间的连锁<WP=13>不平衡程度进行了分析,结果显示,CD209、CXCL10、AR基因内均存在高度连锁不平衡,每个基因均位于一个连锁不平衡模块内;ESR1基因内分为两个连锁不平衡模块,在内含子3~4之间有基因内重组;C2TA基因存在3个连锁不平衡模块,在内含子4和内含子13有基因内重组。3) 经非条件logistic回归校正年龄和性别因素,在隐性模式或共显性模式下,T49641C位点与持续性HBV感染显著关联。和49641T/C或C/C基因型个体相比,T/T基因型的个体对持续性HBV感染的易感性显著升高(隐性模式:OR = 1.41, 95% CI = 1.17~1.71, P < 0.001)。阳性关联的ESR1外显子1 T49641C位点在293个核心家系中进行TDT检验,观察到杂合子父母传递等位风险T给慢性HBV感染子女的频率显著高于非风险?