论文部分内容阅读
背景与目的: 人类的基因组DNA约有3×109bp,其中约10%为串联重复序列,称之为卫星DNA,一般情况下,按照其重复单位长短的不同分为大卫星、中卫星、小卫星和微卫星。其中微卫星(microsatellite analysis)由2~6bp的重复单位组成,又被称为短串联重复序列(Short Tandem Repeat,STR)。然而由于在DNA复制过程中的滑动、复制和修复时滑动链与互补链碱基的错配,会导致一个或几个重复单位的缺失或插入,从而产生短串联重复序列。短串联重复序列是具有长度多态性且存在于人类基因组DNA中的一类DNA序列,核心序列根据数目不同而呈串联重复排列,并且呈现出100-300bp片段长度的多态性。人类基因组DNA中平均每6~10kb为一个STR位点间隔,一般认为,不同个体的基因组卫星DNA也会有不同的重复单位数目,从而形成了复杂的等位基因片段长度多态性;因短串联重复序列遗传符合孟德尔遗传定律,鉴于此特点,其多态性被广泛应用于法医物证检验个体识别和亲子鉴定中。比较容易扩增的基因座片段一般在400bp以下,且PCR扩增成功率高,检测灵敏度好,对DNA的质量要求不高,且重复性好,非常适用于陈旧、微量甚至腐败检材的DNA分型鉴定,STR基因座分型程序明确、方法规范简便,分型判型准确,所得分型结果图形简单,有利于实现DNA的分型标准化和自动化,广泛的应用在人类的遗传学研究中。河南地区是拥有一亿多人口的大省,其汉族群体的遗传学特征对北方汉族人群有很好的代表性,本实验通过24个STR基因座进行PCR复合扩增对河南汉族人群进行分析,以获得河南汉族人群这些基因座的群体遗传学数据。通过收集中国其他省份、其他民族12个群体的STR基因座频率数据,从而计算分析不同民族群体间的遗传距离,构建了多个民族间的系统发生树,以探讨他们的遗传关系。并选取巨细胞病毒及人乳头瘤病毒进行扩增,分析验证PowerPlex?Fusion System扩增系统能否对自然界中常见的病原微生物产生检测信号,从而证明PowerPlex?Fusion System扩增系统是否有特异性。 材料和方法: 采集1503名无亲缘关系的河南汉族个体血样样本,2%EDTA抗凝,全自动核酸提取仪、Chelex-100法提取基因组DNA;用PowerPlex? Fusion System荧光标记试剂盒复合扩增24个基因座,包含22个STR基因座(D3S1358,D1S1656,D2S441,D10S1248,D13S317,PentaE,D16S539,D18S51,D2S1338,CSFlPO,PentaD,TH01,vWA,D21S11,D7S820,D5S818,TPOX,D8S1179,D12S391,D19S433,FGA,D22S1045),1个Amelogenin基因座以及1个Y-STR基因座(DYS391);利用毛细管电泳荧光自动检测系统对复合扩增产物进行检测和分型,以Genemapper ID-X软件判读各检测个体的基因型。χ2检验判断各STR位点的基因型分布是否符合Hardy-Weinberg平衡定律,PowerStatsV12软件计算各基因座频率,观察杂合度(Observed heterozygosity,Hob),期望杂合度(Expected heterozygosity,Hex),个体识别率(power of discrimination,PD),多态性信息含量(Polymorphism information content,PIC),非父排除率(Power of exclusion,PE)及匹配概率(Matching probability,MP),并计算23个基因位点累积PD、PIC、MP等统计量。通过收集不同地区或不同民族的12个参考人群的STR基因座频率数据并对这些群体计算遗传距离矩阵;增加至14个参考人群来计算Neis的距离和建立系统发生树。通过对12个地区人群的原始基因型计算,从而对每两个民族在每个位点上的差异值进行分析(Fst值分析)。采集巨细胞病毒及人乳头瘤病毒阳性标本各30例,用PowerPlex? Fusion System荧光标记试剂盒复合扩增24个基因座,计算成功率。 结果: 1.22个常染色体STR基因座具有高度多态性:对1503例河南地区汉族人群无亲缘关系的无关个体的22个常染色体STR位点及1个Y-STR位点基因座进行检测,分别检出了10、17、13、10、11、29、9、21、13、10、12、6、10、20、12、8、9、13、17、21、21、9、6个等位基因。其基因频率分别分布在:0.0003-0.3600、0.0003-0.3070、0.0003-0.3270、0.0010-0.3960、0.0003-0.2740、0.0003-0.1230、0.0003-0.2890、0.0003-0.2290、0.0003-0.2100、0.0003-0.3860、0.0003-0.3060、0.0180-0.5270、0.0003-0.2500、0.0003-0.2880、0.0003-0.3440、0.0020-0.3430、0.0003-0.4970、0.0003-0.2450、0.0003-0.2310、0.0003-0.2860、0.0003-0.2320、0.0030-0.2490、0.0010-0.7200之间。 2.遗传距离和进化树分析得出了以下结论:山东、吉林、甘肃汉族人群与北方汉族聚为一类。系统发生树的结果显示:傣族、广东汉族、江苏汉族3个族群紧密的聚在一起,究其原因,从西晋永嘉之乱时期到五代时期中原大乱,中原汉族大批迁往广东、福建、广西、云南等地,从而可以看出他们在起源、迁移上关系甚为密切。 3.从MDS或系统发生树可以看出:广东汉族与傣族有着紧密的关系,甚至从发生树中看出广东汉族与傣族是最为接近的族群,出现这种结果可能是由于缺乏其它中国南方人群数据的比较。而同是河南汉族,但在MDS图及系统发生树上也存在小的差异。 4.Fst值比较显示,吉林汉族、山东汉族、甘肃汉族、北方汉族、西北地区汉族、河南汉族聚为一大类。然而,尽管不同的地区汉族人群的遗传距离接近,但由于存在地域的差异,青海汉族、蒙古族、维吾尔族、傣族、广东汉族等与河南地区汉族人群的遗传距离要明显大于山东、吉林、甘肃、西北地区汉族与河南地区汉族人群的遗传距离。由此可以看出,中国汉族人群STR基因频率分布与地理距离呈平行关系。中国南北方汉族人群之间存在遗传差异。 5.通过对巨细胞病毒及人乳头瘤病毒阳性样本检测分析显示,巨细胞病毒及人乳头瘤病毒均未产生检测信号。 结论: 该PowerPlex? Fusion System试剂盒所含22个常染色体STR联合使用时,在河南汉族中具有极高的多态性、个体识别力和父权排除率,完全可以用于河南汉族的亲子鉴定和个体识别工作,并可用于DNA数据库建设的候选或补充位点;对23个STR基因座的检测灵敏度及实际案件中的应用效率等问题进行研究,结果表明23个STR基因座具有较高的检测灵敏度,应用多位点复合PCR扩增技术及毛细管电泳分型技术在实际检案中具有良好效果。该PowerPlex? Fusion System扩增系统所包含的24个STR位点只能对人类的DNA进行检测,而对自然界中常见的病原微生物不能产生检测信号,不会产生假阳性及交叉反应,PowerPlex? Fusion System扩增系统具有很强的特异性。