桉树基因测序数据SNP的模式识别方法的研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:sun_zhimin_dl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的发展,新一代测序技术已经兴起并广泛应用,但传统的PCR片段测序仍非常重要。单核苷酸多态性(single nucleotides polymorphism,SNP)和插入/缺失(insert/deletion,InDel)是新一代DNA分子标记技术,需要一种高效的算法进行验证分析。由于测序厂家提供的软件只能识别各序列位置的最高峰所对应的碱基,对于双峰位置的识别需要第三方软件。而第三方软件均需参考序列,具有局限性,不能有效用于一些序列的分析,并且操作上较为繁琐。因此,本研究运用模式识别方法构建了SNP和InDel自动检测系统,主要内容如下:1.通过传统测序文件格式提取出序列信号,分别运用Haar小波,Symlets小波,Coiflets小波以及ReverseBoir小波滤除杂峰信号,并对比了4种小波函数的滤波结果,为双峰碱基的可靠判读提供了高质量的序列。将去噪后的4种碱基数据融合成完整的桉树基因数据,并提取出波峰距离、高度比值以及起伏度比值作为SNP位点检测的特征参数。之后运用模糊推理器生成可供SNP位点分类器训练的测试数据。2.研究了SNP及InDel的检测算法。根据获取的训练数据,分别应用基于LM算法的BP神经网络、支持向量机以及稀疏识别分类器进行SNP位点检测,并对三种模式识别算法进行对比分析。运用了PrimeIndel算法及错位对应的数学算法进行InDel检测分析。3.采用LabWindows/CVI9.0以及MATLAB2012作为的桉树测序数据系统开发平台,并根据LabWindows/CVI以及MATLAB的混合编程原理,搭建了基于模式识别的二倍体个体内SNP及In Del多态性检测系统。系统集成了数据显示、人工调整以及数据存储等模块。4.本文采用桉树基因识别系统DiSNPIndel分别进行了SNP位点与InDel片段检测的准确性验证,并与现存常用软件进行了对比分析。实验证明,DiSNPIndel的SNP识别率为88.5%,高于novoSNP的1.5%及Mutation Sruveyor的17%。并且,DiSNPIndel检测InDel片段的识别率为53.1%,高于PrimeIndel(6.1%)、novoSNP(7.4%)以及Mutation Sruveyor(6.8%)。证实DiSNPIndel在检测无参考序列二倍体个体内SNP位点及InDel片段时,准确率优于其他软件。
其他文献
近几十年来,自动人脸识别技术取得到了很大的进步,各种各样的人脸识别算法相继被提出。另外,受到公共安全、金融安全、人机交互等领域潜在的需求的驱动,计算机人脸识别技术面
乘性噪声出现在很多图像应用领域,如医学超声图像、SAR(Synthetic Aperture Radar)图像,它与信号强度息息相关,因此乘性噪声的去除更具挑战性。然而传统乘性噪声去噪方法往往
Retinex图像增强方法是近年来研究较为热门的图像增强方法,该方法以人类视觉系统的色彩恒常性为理论基础,通过模拟人眼观察场景的方式,恢复因图像采集设备限制而丢失的场景细
编程题在线评判技术是协调庞大编程学习者群体和稀缺的教学资源矛盾的手段之一,它弱化了学生数量对教师工作量的影响,使大规模编程在线教育成为可能。当前流行的编程题在线评
杂草是影响我国农产品质量和产量的重要因素之一。目前除草主要靠喷洒除草剂,而且是大面积的均匀喷洒。.这种喷洒方法不仅提高了农业的成本,也破坏了土地的质量,污染了环境,
特征选择是数据挖掘领域中一个重要的研究课题,特征选择可以剔除学习过程中冗余的、无关的和有噪声的特征,从而得到一个维数最少而判别能力更强的信息特征子集。可以有助于提高
Web应用系统以其易于部署和良好的可维护性等特点,以及能够提供丰富的用户界面而变得越来越流行。随着国家和企事业单位信息化建设的高速发展和信息量的快速膨胀,传统模式的Web应用系统越来越显露出许多问题,例如,较低的响应速度和较差的服务性能。一种新的Web开发技术—Ajax正在成为Web应用领域的研究与应用热点。Ajax技术使用异步调用模式对Web页面进行局部刷新,以“按需取数据”的方式向服务器发送和
随着我国城市化进程和城市基础设施建设的加快,如何保障城市排水管网的运行安全是急需解决的问题。建立城市排水管网安全运行动态监测系统是必要的。在山地环境中,有线网络存
网格计算环境日益成为一种不受地域限制的廉价的超级计算环境,它试图聚合分布在世界各地的计算、存储、知识、通信和信息等各类资源,以服务大众为目的,实现资源共享与协同工作。
在各种犯罪活动中文档伪造是一种常见的伪装手段,由于其易于实施而难于分辨,文档伪造的检测技术显得更加重要而迫切,通过对文档中笔迹改动的检测辨别文档真伪是其中重要的手段。