论文部分内容阅读
人类群体遗传学(population genetics)是一门通过研究人群的遗传结构及其变化规律来探讨人群进化机制的遗传分支学科。人群遗传结构是指遗传变异在群体内或群体间的分布样式以及在空间、时间上具有其特定的结构性和异质性。人类群体遗传结构是人口迁移、人群融合、自然选择、漂变、地理和社会隔离、突变等众多因素综合作用下的时空随机过程。研究人群的遗传变异在空间上的结构性、异质性及其变化规律(即空间遗传结构)具有十分重要的理论和现实意义:①对于阐明特定地区内人口迁移、人群融合、自然选择、漂变、地理和社会隔离、突变等因素对人群进化的影响和探讨人类起源与扩展等方面具有重要的遗传学和人类学意义;②对于开展复杂疾病基因定位的关联研究(特别是全基因组关联研究)具有实际应用价值;③对于药物基因组学研究和区域化疾病预防和治疗措施的制定具有指导意义;④对于区域化法医DNA数据库的构建具有指导作用。
中国人群空间遗传结构十分复杂,国内外许多相关的中国人群的群体遗传学研究已取得了一大批重要研究成果,阐明了中国人群的遗传结构呈现出空间异质性和空间结构性的特征,从分子遗传学角度,勾画出了中国人群迁移的路线草图,描绘出了中国人群基因流动的空间轨迹,比较系统地分析了南北人群遗传差异及其地理界限,但不同学科或同一学科的不同研究的结论并非完全吻合,甚至互相矛盾。例如,姓氏遗传信息显示出南、北人群的区别,并且地区分界限在南方的武夷山和南岭一带,而采用经典的血清学和酶学标记发现南、北人群之间的地理界限大约以长江为界。
因此,面对不同研究得出的不同结论,甚至是相互矛盾的结论,要求我们必须从不同侧面入手,深入研究中国人群的空间遗传结构特征,以揭示中国人群南、北差异空间异质性的表现形式和内在机制,特别是要推断南、北人群之间的空间遗传的地理界限。本课题组在以往的研究中已经系统地分析了基于mtDNA(母系)和Y染色体(父系)的中国人群空间遗传结构特征,为了对比分析不同遗传标记(和不同位点)的空间遗传结构差异和挖掘利用其遗传结构特有信息,本研究将基于大规模人群调查的中国人群13个STR位点(选择中性)和HLA-A,B位点(被认为有选择压力)标记多态性空间数据库,在GIS框架内,采用空间遗传学和空间统计学方法,系统研究中国人群STR和HLA多态性的空间遗传结构特征;并通过对比分析,探讨不同标记不同位点的空间遗传结构在空间自相关特征、地理遗传梯度和地理遗传界限等方面的差异。主要研究结果如下:
(1)基于STR分子遗传标记系统的中国人群空间遗传学特征:①不同STR位点之间的空间自相关、地理遗传梯度及地理界限特征各不相同,提示中国人群的STR遗传结构具有位点异质性特征。② STR在中国人群中的地理遗传梯度以南.北走向为主,东-西走向为次;南-北走向与东-西走向的混合出现可能反映了中国历史上群体的迁徙和融合的南-北迁移和东-西迁移过程。③不同语系之间存在潜在的遗传差异,同一语系往往具有同质的遗传结构地理区域。④地理界限主要分布在边远山区、不同语系群体之间的局部的特殊地理地带,说明群体间存在地理隔离和语言屏障造成的遗传差异;⑤中国人群sTR位点空间遗传结构的地理界限具有空间尺度依赖性。根据所有汉族和非汉族群体资料进行的地理界限分析结果显示,具有统计学意义的地理界限主要分布在周边地区汉族与少数民族之间的地带;而仅用汉族群体资料分析时,具有统计学意义的地理界限只分布在一些汉族分布区域内某些局部的地理区域。⑥在秦岭-淮河流域,STR(选择中性)的南、北汉族人群之间虽然存在一些贯穿东西的地理界限,但没有发现贯穿于秦岭-淮河一线具有统计学意义的任何连续性的地理遗传界限。
(2)基于HLA分子遗传标记系统的中国人群空间遗传学特征:①HLA-A,B位点的空间自相关、地理遗传梯度及地理界限特征各不相同,提示中国人群的HLA遗传结构具有位点异质性特征。② HLA-A与HLA-B的地理遗传梯度分布不一致。HLA-A位点的地理遗传梯度主方向为南-北走向,这与中国人群迁移主方向基本一致。而HLA-B位点却没有呈现明显的地理遗传梯度方向性,但分布于中国北部地区的阿尔泰语系群体与其它中国群体之间HLA-B差异明显。③ HLA-A与HLA-B的地理遗传界限分布也不一致。包括所有群体时,对于HLA-A位点,仅在淮河流域,有一条闭合的有统计显著性的局部地理界限。对于HLA-B位点,新疆地区的阿尔泰语系与内地汉族群体之间有一条具有统计学意义的地理界限。④对于HLA位点,在南方汉族和北方汉族之间,检测到一条与mtDNA标记地理界限类似的贯穿秦岭-淮河的东-西方向地理界限,但缺乏统计学意义。对于HLA-B位点在南、北汉族人群之间没有发现具有统计学意义的任何连续性的地理遗传界限。⑤HLA-A位点的地理遗传梯度主方向与选择中性的STR位点的地理遗传梯度主方向一致(均为南-北走向),且与中国人群迁移的主方向吻合,结合亚洲人群HLA-A位点选择中性的研究结论,提示中国人群HLA-A位点南北走向的地理遗传梯度方向性,主要是人口迁移的结果,受选择压力的可能性很小。⑥HLA-B位点缺乏与HLA-A和STR那样的南-北走向的地理遗传梯度主方向,也与南-北走向的中国人口迁移主方向不吻合,结合亚洲人群HLA-B位点受自然选择的研究结论,本研究推测可能因HLA-B位点受选择的主方向和人口迁移的主方向相反,抵消了其南-北走向的选择性地理遗传梯度。
(3)中国人群四种不同遗传标记系统(mtDNA、Y-染色体、HLA和STR)的空间遗传学特征对比:①四种不同遗传机制标记系统的空间自相关、地理遗传梯度及地理界限特征各不相同,提示中国人群的遗传结构具有明显的位点异质性特征。②不同遗传机制标记系统的地理遗传梯度存在差异性,但是四种不同遗传标记的分析结果均显示:中国人群之间基因流动的主导方向为南-北方向,这与过去很长时期内中国人口的由南向北或由北向南扩张迁移方向基本一致,说明中国人群之间基因流动的最主要的因为应当是人群扩散。③南、北人群之间存在遗传结构差异,南.北汉族的遗传结构分界限在秦岭淮河一线,与划分的中国自然、人文南.北地理分界限吻合,但不同遗传标记系统所展示的南-北人群遗传结构的地理分界限不同,存在位点异质性。此外,南、北人群之间的地理遗传界限,只有在仅使用汉族群体资料时才会出现,这说明中国人群空间遗传结构的地理界限具有明显的空间尺度依赖性,汉族与少数民族之间的遗传距离(Fst)明显大于汉族群体之间的遗传距离。
概括总结本课题组对中国人群的mtDNA(母系)、Y-染色体(父系)、STR(选择中性)和HLA(被认为受选择压力)四种不同遗传与进化机制标记系统的空间遗传学特征,得出如下结论:
(1)中国人群空间遗传结构存在明显的位点异质性特征:mtDNA(母系)、Y-染色体(父系)、STR(选择中性)和HLA(被认为受选择压力)四种不同遗传机制标记系统的空间自相关、地理遗传梯度及地理界限特征各不相同。涉及中国人群的空间遗传学问题时,必须表明具体的遗传标记工具,不能笼统的一概而论。
(2)尽管不同位点间存在异质性,但中国人群基因流动的主方向为南-北方向。中国人群之间基因流动的最主要的因为应当是人群扩散所致,受自然选择的影响很小。这种南-北走向的地理遗传梯度主方向是中国历史上多层面的、定向的、连续的人群迁移和族群混合所遗留下的空间遗传结构痕迹,反映了因群体扩张、迁移和混合所致的基因流动的主方向。
(3)中国南北人群之间存在遗传结构差异,南-北汉族的分界限在秦岭-淮河一线,与中国自然、人文南-北综合地理分界限吻合;但不同遗传标记系统所展示的南-北人群遗传结构的地理分界限不同,存在位点异质性。概括而言,母系群体空间遗传结构是造成中国南、北汉族间地理界限的本底和基础,而以父系为主的二千年来的群体向南多次扩张和迁移一次又一次地冲淡了南、北群体差异的程度,自然选择因素并没有使南-北人群之间产生具有统计学意义的地理分界限。
本研究的创新点在于:①对中国人群的四种遗传标记mtDNA(母系)、Y-染色体(父系)、STR(选择中性)和HLA(被认为受选择压力)的空间遗传结构进行了系统分析,指出中国人群空间遗传结构具有位点异质性特征。②明确了中国人群因流动的主方向为南-北方向,其主要因为应当是人群扩散和迁移所致,受自然选择的影响很小。③阐明了中国南、北汉族的分界限在秦岭-淮河一线,与中国自然、人文南-北地理分界限吻合,但不同遗传标记系统所展示的南、北人群遗传结构的地理分界限不同,存在位点异质性。