论文部分内容阅读
单倍型是单倍体基因型的基因序列中的一部分,包含着一系列位于同一染色体邻近多个位点上进行共同遗传的基因。在生物科学领域中,目前常用的研究手段及基因测序的方法大多数都是将基因组DNA混合在一起,对其整体进行分析和研究,以染色体对为单位发现可能存在的突变位点。但是,某些突变有可能只发生在其中某个染色单体上,这种情况目前还不能够通过普通的方法加以确定,这就需要对该样本的单倍型进行检测和分析。对单倍型的研究可以用于发现遗传变异多态位点,确定人类遗传的相似性和差异性,了解疾病与基因之间的关系,为预防、诊断和治疗疾病提供新的方法和思路,从而对人类健康做出贡献。因此,对单倍型的研究将是一项新的挑战和机遇。 然而,普通的全基因组范围上的测序手段很难完成对单倍型的研究和确定,已有的许多统计学或实验方法虽然对人类单倍型进行了探索和分析,但都存在着许多缺点和不足。同时,在单倍型分析研究领域,目前还没有对肿瘤细胞进行过大量有效的研究。因此,本论文针对以上问题,建立了一种简便有效的单倍型测序技术,以人红白血病细胞系K562细胞基因组DNA为研究对象,通过梯度稀释基因组DNA至亚单倍型水平,全基因组扩增,以及在Illumina Hiseq测序平台进行双端测序等手段对其进行单倍型研究。样本测序结果的生物信息分析表明本论文所建立的方案成功地获得了较高含量的单倍体基因型片段,与普通二倍体测序结果相比,本文方法能够得到较多长程的单倍型片段,可以用于后续完整单倍型的拼接组装,证明了此单倍型测序技术在K562肿瘤细胞系中能够进行有效的分析。此研究结果也是单倍型测序技术首次应用于肿瘤细胞领域的探索与实践,为单倍型测序技术在肿瘤基因组研究中的应用做出了基础性工作。论文的具体研究内容为: 1.利用数学分析软件MATLAB,根据单倍型的相关理论知识,设计并编写理想情况下相应DNA稀释的模拟实验程序,对基因组DNA稀释至亚单倍型水平后的单倍型片段获取情况进行计算机模拟。分别讨论了经由酚-氯仿抽提法和长片段试剂盒法提取出的不同片段长度的DNA稀释结果,各自对比了在不同稀释倍数下获得的单倍型片段平均概率特征,综合分析得到可行的稀释倍数(0.1和0.4),为建立具体的单倍型测序方案提供理论依据。 2.在计算机模拟研究得到合适的稀释倍数的基础上,建立以K562细胞基因组DNA为研究对象的单倍型测序技术,完成包括基因组DNA样本提取、梯度稀释至亚单倍型水平、全基因组扩增和看家基因PCR检验等实验及结果分析,得到三组样本(其中,2组为原始基因组DNA稀释至0.1×单倍型、1组为稀释至0.4×单倍型),通过Illumina Hiseq2000测序平台得到测序数据,并分析数据质量,获得初步的测序片段统计结果。 3.利用多种生物信息处理软件,对测序所得数据进行与人类参考基因组(RefSeqHg19)的序列比对、单核苷酸多态性SNP检验、重叠群contig拼接及染色体分布的生物信息分析,得到基因组覆盖率、平均测序深度、片段拼接质量等相关结果。对三组样本的数据进行讨论,以普通二倍体基因组测序的杂合比率作为评价基准,得到样本中单倍SNP的比例均大于60%;拼接筛选后得到的长程非杂合contig也都达到70%以上,从这两个角度分别验证了本文所建立的单倍型测序技术能够有效地获取覆盖K562细胞基因组大量单倍型区域的片段,且它们在染色体上分布均匀,进一步表明了本方法可以被应用于肿瘤细胞基因组的单倍型研究。