多重置换扩增中嵌合序列的生物信息分析及其在单体型研究中的应用

来源 :东南大学 | 被引量 : 0次 | 上传用户:jiandancaozuo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,基于多重置换扩增的全基因组扩增技术已经得到了广泛的运用。该技术使用的phi29 DNA聚合酶具有起始DNA需求量低、保真度高、校读性好、产物片段长并且偏向性低等优点,克服了传统扩增技术的一些缺陷。然而,phi29DNA聚合酶的缺点却很少被人报道,一定程度上掩盖了这种酶也有缺点的事实。本研究采用数据挖掘的方式,在2013年一项研究使用的上百GB二代测序数据中,针对phi29 DNA聚合酶扩增产生嵌合序列这一特性,从嵌合序列的比例、种类、分布特点等方面对嵌合序列进行系统的统计分析,尝试从热力学、动力学的角度解释嵌合序列的产生。此外,本研究还针对嵌合序列在结构上的特点,通过实验和生物信息分析证明其在人类全基因组单体型组装上具有潜在的应用价值。  本研究获得的主要结果包括:  (1)开发了一套基于Illumina HiSeq测序平台的嵌合序列分析流程,可以实现嵌合序列总数、在测序数据中所占比例、各级各类嵌合体数量的统计。在这一批phi29 DNA聚合酶扩增产生的测序数据中,嵌合序列比例达到了统计显著水平(~6%);  (2)嵌合序列在常规序列比对中属于废弃数据,针对这一特点,本研究中开发了一套实现嵌合序列重复利用的小型流程,并将该流程不断简化、改善,从而能够实现嵌合序列的再利用,提高测序数据的利用率;  (3)针对嵌合序列结构上的两个关键统计指标,在数据分析流程中配合画图软件进行制图,呈现嵌合序列的分布情况,从而在热力学、动力学的角度尝试解释嵌合序列的产生,创造性地从二代测序数据分析的角度阐释phi29 DNA聚合酶的特性;  (4)通过分析两种不同大肠杆菌的phi29MDA测序数据,本研究证实组成一条嵌合序列的两部分片段在模板DNA分子水平上具有高度同源性。由于针对嵌合序列两部分片段之间距离的统计已经发现,片段之间的距离最长可以达到5kbp以上,这使得嵌合序列在单体型构建上具有一定的应用价值,能够在传统方法组装结果的基础上进一步提高N50、scaffold平均长度等组装结果指标。
其他文献
用透射电镜技术研究了秀丽白虾精子的形态结构,结果表明:秀丽白虾精子属无鞭毛、单棘型精子.其外形呈图钉样,由主体部和棘突构成.主体部包括帽状体、细胞质带和精核.帽状体由
学位
换热器结垢已经成为普遍现象,结垢不仅增大流动阻力,而且严重削弱传热效率。射流冲击作为最高效的对流换热方式,已经广泛应用于工业冷却过程和电子设备冷却领域。虽然射流冲击强
液力机械调速系统具有成本低、寿命长的优点,应用在风力发电液力调速装置上可实现变输入恒输出的自动控制,从而使用同步电机。风力发电液力机械传动装置需要液力变矩器的高效区
随着当今世界各国对节约能源、环境保护方面的要求不断提高,市场对空调核心部件压缩机也不断提出严格的要求。转子压缩机被广泛应用于房间空调器中。随着HCFC22替代进程的加快
本文通过对荣华二采区10
期刊
油田注水是采油生产过程中的重要工作,油田回注水的质量直接影响到油田的开发效果。国内油田低渗透区块的逐渐增加,对回注水水质要求越来越高。开发稳定、高效的含油污水处理
目前我国经济发展迅速,但同时能源紧缺、环境污染问题也日益严重,节能减排的重要性逐渐凸显,在这样的背景之下,社会逐渐加强对传统能源的充分利用和对新能源的开发研究。太阳能作为一种绿色、清洁、可再生的能源成为了研究焦点,我国太阳能使用条件十分良好,太阳能的利用也在逐渐增多。基于此背景,本文旨在利用太阳能供暖系统代替传统变电站的供暖系统,降低变电站暖通空调系统运行能耗。本文首先通过研究影响太阳辐射强度的各
车牌识别是近年发展起来的智能交通管理系统的核心部分之一。其研究内容是将图像处理与模式识别结合起来。国内车牌识别的研究有其特殊性--汉字的识别。汉字识别准确率一直是
本学位论文依托国家自然科学基金(No.50876106,No.51076152)和国家973基础研究发展计划(No.2010CB227301)等科研任务,对能源利用问题的代数显式解析解及中低温太阳热能与化石能