论文部分内容阅读
欧亚草原幅员辽阔,西起喀尔巴阡山脉和黑海沿岸,东至蒙古高原,长约8000公里,是横贯欧亚大陆的天然通道。生活在欧亚草原上的诸民族,具有共同的生业形态和相近的习俗,在东西方经济、文化交流等方面曾发挥了不可替代的历史作用。中国北方位于欧亚大草原东南部,地处北方游牧民族和南方农业文明的接壤地带,很多重要的历史事件都发生在这个“舞台”上,北方民族与中原民族的每次接触都大大促进了南北两个人群的交流,对中国历史乃至世界历史都产生了深远影响。因此,研究中国北方古代人群的遗传组成对了解东西方人群与文化的交流以及追溯中华文明的起源都有重要的意义。DNA测序技术以及古DNA处理技术的进步,使得古人类基因组测序成为可能,基因组数据由于包含大量的遗传信息位点,避免了以往古DNA基于单倍型频率分析所造成的偏移,并且能够对人群内部的遗传结构进行分析,从而得到不同人群间的遗传成分,对人群的来源与组成提供更加确凿的证据。欧洲在古人类基因组研究方面做了大量的研究,并且对欧洲不同时期人群的迁徙和扩散以及不同人群间的混合有了非常清楚的认识。中国的古人类基因组研究才刚刚开始,目前我国境内还没有可以利用的古人类基因组数据,相信在不久的将来随着更多中国古人类基因组数据的发表,我们将对中国史前人群的历史有更加清醒的认识。本研究选取中国北方具有人群及地域代表性的两处墓葬----新疆下坂地青铜时期古代人群(西北)和吉林大安后套木嘎中石器至辽金时期古代人群(东北)为研究对象,分别从的线粒体基因组、全基因组范围内常染色体位点捕获(包括Y染色体分型位点)以及全基因组测序三个不同层面进行研究,结合周边现代及古代人群的数据进行分析,为了解中国北方不同时代人群的遗传结构及其与周边地区的文化交流提供基因组学证据。第一,从新疆下坂地墓地青铜时期AII墓葬31个古代个体中成功获得了16个真实可靠的线粒体全序列。这些序列归属于14个不同的单倍型,分别为U4c1a、U1a1c、I1b、H5b、U4a1、H11b、HV、U2e3、H6a1a、U2e1、I4a、R1b、U2e2a4以及T2a1b1。这些单倍型全部来自欧亚大陆西侧并且几乎所有单倍型都能在青铜时期草原人群的线粒体基因库中找到共享,说明下坂地人群是典型的欧亚大陆西部人群,而且可能和草原人群关系密切。基于线粒体单倍型分布频率的主成分分析也同样表明下坂地人群与青铜时期草原人群有非常近的遗传关系。奠基者测试结合线粒体分子钟理论表明下坂地人群迁离其祖先人群的时间为4500年前后。因此,从迁出时间以及线粒体单倍型来源上看,下坂地最有可能来源于青铜时期草原人群(颜那亚文化相关人群),并且伴随其扩张来到帕米尔地区。另外我们也对下坂地M29个体进行了全基因组范围内常染色体位点捕获,这些位点中也包括Y染色体分型位点。M29个体的Y染色体分型为R1a-Z94,该单倍型的产生时间不早于5000年,并且该单倍型在距今4900-4500年的欧洲个体(63.7%基因来自于欧亚草原的颜那亚人群,36.3%基因来自于新石器中期中欧人群)发现,说明单倍型R1a-Z94起源于欧洲,南亚高频分布的R1a-Z94来自于颜那亚文化相关的草原人群的扩散,这与学术界普遍认可的印度-伊朗语支(Indo-Iranian)从欧亚草原到南亚的快速扩张相契合。常染色体表型分析同样表明下坂地人群最有可能是金发、碧眼以及浅色皮肤的欧洲人,尽管常染色体由于与公用数据库共享位点不足导致其分辨率不高的问题,但从常染色体主成分分析及混合度分析上,我们同样可以看到下坂地人群与现今欧亚草原人群以及青铜时代颜那亚相关人群有非常近的遗传关系。基于以上结果,我们可以基本可以确认下坂地人群来自于青铜时代草原人群,其迁徙的动力可能与印度-伊朗语支的快速扩张相关。第二,从吉林大安后套木嘎遗址中石器至铁器时代104例样本中成功获得了20个样本的全基因组数据,其中中石器时代样本的测序深度为34X,为后续的古DNA研究提供了高质量的参考基因组。从20例个体的基因组中我们成功获得了10个个体的线粒体单倍型信息,分别为D4h1、D4b1b2、D4e5a、A、M5a2a3、B4c1a2、C4a2、F1a1c以及G2a1,这些单倍型都是中古北方常见单倍型。全基因组主成分分析结果显示后套木嘎不同时期的人群内部以及与同一地理区域的现代人群(如鄂伦春和赫哲)能够很好的聚类,说明自中石器时代起,嫩江流域人群的基因结构并没有发生大的变化,人群表现出非常强的遗传连续性。为了进一步验证嫩江流域不同时间梯度人群的基因联系,我们应用f3-statistics对人群的基因流动进行检测,与主成分分析的结果一致,嫩江流域古代与现代人群表现出很强的基因流。由于f3-statistics很容易受到人群瓶颈效应的影响,我们对其进行了f4-statistics分析,Z-score的绝对值远小于3,表明从中石器时代至今,嫩江流域不同时期人群结构并没有发生明显改变。人群混合度分析(Admixture)显示从中石器时期至今,整个嫩江流域人群的基因结构非常相似,后套木嘎中石器时代个体检测到低频的现代俄罗斯远东人群的遗传成分,而在新石器至早期铁器时代的样本中均没有发现,说明该遗传成分来自于中石器以前与远东地区祖先人群的混合,而在后期由于没有继续发生混合,因此该成分在基因漂变的作用下逐渐消失。尽管嫩江流域紧邻辽河地区,该地区自新石器时期以来人群以及生业模式经历了多次替换,加之南方农业人群向北方的大规模扩张,然而嫩江流域人群自中石器至今一直保持着高度的遗传联系性。一方面原因是可能由于其独特的地理位置导致该区域相对较为封闭,加之干燥少雨的环境不适合游牧及农业的发展。另一方面,该区域丰富的渔业以及林业资源为当地人狩猎-采集-渔猎的生活方式提供了丰富的食物来源。中国北方地域广阔,所处的自然地理环境决定了中国北方人群在其来源与组成上差异显著,中国西北人群,特别是新疆地区与青铜时期欧亚草原人群以及中亚人群的联系更加紧密。中国东北,嫩江流域自11000年以来人群遗传结构表现出高度的区域连续性,没有经历外来基因的流入以及人群的替换。