新一代基因测序的数据处理中的相关问题

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:zq867123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着下一代基因测序技术(NGS, Next Generation Sequencing)的发展,实验设备和流程日趋成熟,越来越多的公司推出了自己的测序平台,基因测序已经逐渐脱离了专业的基因实验室,让更多的研究组和研究人员都开始进入该领域。与之而来的,NGS数据处理面临着越来越高的要求和挑战,研究人员已经不能满足于使用基因测序机器厂商所提供的基本的数据处理程序,转而使用更开放的、灵活的第三方处理软件。在本文中,我们重新审视了NGS基因数据处理的过程,从原始的图像数据处理到碱基识别,完成了一整套NGS基因测序数据的处理算法。其中,在现有的一些NGS数据处理工具中,图像处理部分一般采用的水平集分割法或简单的使用拉普拉斯算子进行处理。在我们仔细分析了这些结果之后,发现他们其实并不能精确的完成基因簇定位以及识别的任务,为此,我们重新设计了处理算法(NRDPT, NGS Raw Data Processing Tool)。不同于已有的几种处理方法的是,该方法使用了基于边缘和霍夫变换的基因簇定位算法,有效提高了定位准确度。并且,在基因簇定位准确的基础上,我们设计了一个两步的配准策略,极大的提高了效率(~9倍提高于传统算法)。在本文中我们会详细讨论这部分的算法。在碱基识别部分,目前已经有的一些研究均基于Illumina测序平台的测序数据,这些研究主要用来试图修正使用该仪器所经常会出现的相位错乱问题,这些问题一般是来源于所采用的生化反应的缺陷。而在新的一些测序方法中(如SoLiD、HYK等),因为更新了测序流程,这些问题并不存在。在本文中,我们讨论了在不同的测序方法中会出现的问题及其对于碱基识别过程的影响,在仔细考虑了几种不同的碱基识别策略后,我们完成了基于连接反应测序过程的碱基识别方法,并得到了不错的结果。基因测序技术的发展很快,我们的研究过程基于我国完全自主知识产权的华因康公司的P-STARII型基因测序仪展开,在整个的研究过程中,机器和测序流程也在不断升级,这些不确定性常常增加了我们研究的难度,但这也正说明本领域正在飞速的发展。在这里,我们期待NGS测序技术的真正成熟,并最终走入临床领域。
其他文献
案例教学一直以来是课堂教学中的一种重要教学方法,这种教学方法能够以实例的形式将教学内容动态、有效的传递给学习者。这样的教学方法在中学美术课堂教学中的应用也是较多的
在教学中培养学生的听说读写能力是语文教学的基本任务,教师通过调动学生阅读的好奇心,制定确实可行的激励措施,开展班级和学校的各种趣味活动,加强学校和家长之间的互动、沟通、
课堂教学是以学生为主的师生互动。在多年的语文教学实践中,我们深深体会到,通过巧妙创设情景,可以更好地唤起学生的情感体验,激发“阅读期待”,使学生进入最佳的学习状态,进行有效
叶轮是汽轮机的主要部件之一。汽轮机运行时,叶轮的轮缘在叶片离心力和自身离心力的作用下应力很大,因此必须对其进行强度计算,以确保运行时安全可靠。但用传统方法计算带小脚T型
引进300MW汽轮机次末级叶根的强度计算刘岩,余耀,诸玉喜1前言外高桥电厂1号机为我厂生产的引进型300MW机组,该机在运行1646小时后,次未级叶片(474mm叶片)叶根第1对肯发生断裂。为此,有必要对该叶根进行三维
在对矿业城市产业生态系统适应性内涵进行界定的基础上,基于易损性、敏感性、稳定性和弹性等适应性要素构建了矿业城市产业生态系统适应性评价指标体系和评价模型,并据此对东
高中学生在生理发展和心理特征上的差异是客观存在的;“分层次教学”是一种符合因材施教原则的教学方法,它能面向全体学生,为学生的全面发展创造条件,有利于学生数学素质的普
生物是本世纪发展最迅猛的学科,进入二十一世纪,生物教研成果愈发丰富。作为素质教育有机组成部分之一,初中生物正在受到人们的关注,但是,由于长期以来的教学误区以及历史遗留问题
购物搜索网站汇集全网电商网站商品信息,为用户提供商品搜索和促销商品信息服务,购物搜索网站的主要任务是在海量商品中提高筛选效率,满足不同用户的个性化需求。随着中国网购人