论文部分内容阅读
正选择是指在群体进化的历程中,具有选择优势的遗传多态通过自然选择的作用被保留并且在群体中持续积累的过程。使用正选择信号检测的方法研究群体的遗传多态,能找到群体基因组上受到正选择的基因和功能区段,有助于理解群体的适应机制,分析选择压力来源,了解群体进化历史。 为了研究不同种生物之间适应性进化机制的特点,确定进化过程中可能起重要作用的遗传多态和基因,本研究选用了不同的正选择信号检测方法,以乙型肝炎病毒(hepatitis B virus,HBV)和高原世居人群为研究对象,分别扫描其基因组,进行正选择信号定位。 HBV是人类健康的威胁之一,感染HBV的患者往往容易罹患各种肝炎病症,如慢性肝炎、肝衰竭、肝硬化等。为了研究HBV适应性进化与肝炎患者病程以及病毒基因型之间的关系,共收集486条具有患者诊断信息的B型和C型全长HBV基因组。按照相应宿主的诊断信息将这些病毒基因组划分为急性肝炎、慢性肝炎和重型肝炎组。采用基于密码子的最大似然法,对HBV的所有基因进行正选择信号分析,在HBV基因组上总共发现95个氨基酸位点受到正选择。在慢性肝炎组和重型肝炎组中受正选择的氨基酸位点数显著多于急性肝炎组中受到正选择的氨基酸位点数。一些氨基酸位点只在特定的肝炎病程组或HBV基因型中受到正选择。对HBV蛋白产物HBcAg的进化保守性分析显示,受到正选择的氨基酸大多分布在病毒蛋白的高变区。此外,对各病程组的HBV基因组进行基于核苷酸等位基因频率的分析,发现B型和C型HBV中共有8个核苷酸位点的等位基因频率在不同病程组中有显著差异,且这8个核苷酸位点的突变频率随着病程的加重而升高,而另有3个核苷酸突变,A1762T、G1764A和A2739C,在HBV的进化历程中趋向固定。将HBV基因组上所有受到正选择的氨基酸和核苷酸突变对回病毒蛋白或基因组上的功能区段,发现60%左右的受到正选择的突变,其选择压的来源是宿主的免疫监视、抗病毒治疗,以及病毒的复制效率。 为了研究世界不同高海拔地区的世居人群在低氧适应机制方面的异同,选用多种正选择信号检测方法,扫描藏族人和安第斯高海拔世居人群的基因组。对藏族人的全基因组等位基因频率分化检测发现,汉族和藏族人在EPAS1基因上的等位基因频率差异最为显著。而后的数量性状关联分析发现并验证了EPAS1基因遗传多态和藏族人血红蛋白水平显著相关。此外还发现ACE基因的遗传多态和藏族人群血管紧张素转换酶水平具有显著相关性,NOS2A基因的遗传多态和藏族人群心脏收缩压水平显著关联。随后对藏族和安第斯人群采用基于等位基因频率、单体型的方法检测其基因组上的正选择信号,发现在这两个人群中,有些受到正选择的SNP位点位于基因组的调控元件区段。通过寻找受选择的SNP位点周围的蛋白编码基因,发现低氧诱导因子(hypoxia-inducible factor,HIF)通路的基因,如EPAS1、EGLN1、ARNT、ARNT2、EP300经历了正选择。作为HIF通路的核心调控元件,EPAS1和EGLN1在藏族人中受到选择。ARNT2、EP300作为HIF通路的重要参与者,在安第斯高海拔世居人群中也经历了正选择。凝血通路基因F2和呼吸反应相关的基因OPRM1在藏族人和安第斯人中也都受到选择。上述结果提示在世界不同地区的高原人群中,涉及到低氧适应机制的通路和相关基因具有一定程度的一致性,但是由于起作用的关键基因在不同人群之间存在差异,所以他们的具体的适应机制有所不同。