论文部分内容阅读
目的:在人类的23对染色体中,有22对为常染色体,另1对为性染色体。在不同性别中,男性性染色体组成为XY,女性为XX。Y染色体仅存在于男性细胞中,属于近端着丝粒染色体。在人类Y染色体上有五类多态性遗传标记,包括卫星DNA、小卫星DNA、微卫星DNA、InDel及SNP。而对Y染色体进行分析的意义在于Y染色体仅存在于男性个体中,且Y染色体STR稳定的由父代男性遗传给子代男性。Y染色体STR基因座呈单倍体父系伴性遗传的特性,与常染色体STR基因座相比较而言在法医学鉴定中具有其独特性。随着科技的发展进步,测序技术的进步也是日新月异。目前使用的测序技术主要有Sanger测序、焦磷酸测序以及正在迅速发展的新一代测序技术。新一代测序技术一次可对多个样本的几十万到几百万条DNA分子进行序列测定,测序准确度可达99%以上,其单次测序所产生的高质量数据在平均水平下已经足以覆盖人类基因组30倍以上,为DNA分析提供了一种全新的技术手段。DYF155S1基因座是被报道的第一个Y染色体上的小卫星多态性位点,同时具有长度多态性和序列多态性,而且不同民族间存在重复序列排列差异。因此本研究拟在以下三方面做探索:1、使用新一代测序技术分析Y染色体STR及其侧翼SNP,探索新一代测序技术在Y染色体STR核心序列测定的准确程度并探讨新一代测序技术在解决混合斑检验中的作用。2、利用二次PCR及Sanger测序技术对包括中国汉族群体在内的4个群体的样品进行了研究,探讨DYF155S1位点的遗传多态性及群体间差别。3、进行群体遗传学研究,探索中国吉林省延边地区朝鲜族人群的Y-STR数据特征,为Y染色体STR位点在法庭科学中的应用提供基础数据。研究方法:本研究选取了20例无父缘关系个体样品,选取其中两例无关个体样品混合形成各组份DNA含量不同的混合斑样品,两组确定父子关系的4个样品。使用ABI Y Filer Plus试剂盒对所有样品进行Y染色体STR分型。针对Y染色体各STR位点上下游各1.5Kb范围设计序列特异性引物,扩增出包含各Y染色体STR核心序列在内的DNA片段。在携有两端接头的转座酶作用下,对扩增出的DNA片段随机片段化,同时于片段末端连接接头。修复转座连接处,然后进行PCR反应,对文库进行富集,并加上测序所需全长接头。用AMPure XP Beads对片段长度进行筛选,使目的片段长度范围在300-400bp。将文库混合、变性后,加入到Illumina HiSeq测序平台进行高通量并行测序,对文库两端分别进行测序(即paired-end,PE),因此每个样本会生成reads1(R1)和reads2(R2)两个数据文件。对测序原始数据进行质量控制与质量检测,确认测序原始数据可靠性后将原始数据与参考序列进行比对获取各样品的STR及SNP数据。观察各样品的Y染色体STR位点核心序列能否准确读出,观察混合样品的STR位点能否通过数据比对获得准确的分型,能否组装出不同样本的单倍型。利用二次PCR及Sanger测序技术对中国境内的4个群体:汉族、朝鲜族、藏族、维吾尔族的共200例样品的DYF155S1位点进行调查研究,统计分析这四个民族间DYF155S1位点的遗传多态性及群体间差别。对257个中国吉林省延边地区朝鲜族男性样品的Y染色体STR数据进行统计分析。按不同区域统计相应的法医学参数包括单倍型数目、单倍型多样性,随机匹配概率、单倍群数目等。用R语言基于10个群体的单倍群频率进行主成分分析,判断不同群体间的遗传距离。结果:1、本研究建立了区域捕获技术与新一代测序技术相结合对Y染色体STR基因座测序分析的方法。探讨了新一代测序技术对STR位点重复序列及其重复次数进行研究的可行性,证明在单一重复序列STR位点新一代测序技术可以较好地对其进行测序分析,而对于重复次数较多或重复单元较多STR位点则测序结果表现不佳。研究结果表明,使用新一代测序技术对结构较复杂的STR位点如DYS385、DYS387S1位点重复序列及其重复次数进行研究存在一定局限。2、本研究结果表明,使用新一代测序技术可以对混合样品STR位点重复序列及其重复次数进行研究分析。3、本研究共发现DYF155S1位点重复序列5种,分别为1型、3型、4型、6型和7型。包括本研究在内,DYF155S1位点的重复序列已发现有9种类型。研究发现,DYF155S1位点的结构有较明显的民族差别。本研究中发现的6型重复序列仅在维吾尔族个体和藏族个体中检出,7型重复序列仅在藏族个体和朝鲜族个体中检出。4、在本研究中,50名汉族个体样本检出48种结构组合,50名维吾尔族个体样本检出48种结构组合,50名朝鲜族个体检出了49种结构组合,50名藏族个体检出了42种结构组合。合计200名个体在DYF155S1位点共检出187种结构组成,可以提示该位点的多态性非常高,是法医学亲权鉴定、个人识别的重要遗传标记。5、经过对延边地区朝鲜族257例男性个体Y染色体STR检测分析,19个STR位点中DYS385基因座的GD值最高,为0.9666,DYS391基因座的GD值最低,为0.2260。除DYS385之外的18个STR基因座中,DYS391等位基因数最少,为3个,DYS456、DYS447基因座等位基因最多,均为8个。4、将延边地区男性和YHRD数据库中北京汉族、江苏汉族、吉林汉族、云南汉族、辽宁回族、辽宁朝鲜族、辽宁满族、广西苗族、日本人群、韩国人群等共10个群体进行遗传距离分析。分析结果表明,延边地区朝鲜族与辽宁朝鲜族和韩国人群遗传距离相近,而与其他民族遗传距离较远,尤其与广西苗族遗传距离最远。结论:1、本研究使用区域捕获加序列分析的方法分析了Y染色体STR位点,确认该方法能够更高效、更准确的对Y染色体STR及其侧翼序列进行分析。2、对DYF155S1位点在中国四个民族内的多态性分布进行了调查研究,证实该位点在核心序列及排列方式分布上具有一定的民族差异,可以为个体的民族区分提供帮助。3、对中国延边地区朝鲜族群体的19个Y染色体STR位点进行了频率调查并获取了相应数据。延边地区朝鲜族与辽宁朝鲜族和韩国人群遗传距离相近,而与其他民族遗传距离较远。