基于FSA的DNA重复体频率统计算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:forest_28
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有DNA重复体频率统计算法效率低、灵活性差等不足,基于字符串多模式匹配的有限状态自动机,构造DNA子序列比对自动机,利用KMP算法对自动机进行状态转移优化,由此提出一种高效的重复体频率统计算法。该算法通过对DNA数据库的线性扫描,得到每个DNA子序列在全局数据库中重叠与非重叠的重复体频率统计信息以及指定DNA序列集合的最长公共子序列信息。实验结果表明,该算法具有效率高、匹配精确、信息获取方式灵活、支持在线操作等优势。
其他文献
自2018年以来,随着资本市场水位的下降,上市公司中的股权质押问题逐渐浮出水面。而很多人,居然对这个概念,极为陌生,这相当于蒙着眼睛在股票市场中碰撞。本文对股权质押的概
当今社会,市场经济在快速发展,企业作为国民经济建设中的重要组成部分,是人们稳定生活的保障。在这样的背景下,一个企业想要健康、稳定的发展,那么一定要十分重视财务管理这一方面
为实现数据在同一个地点进行处理而无须移动,介绍一种基于高性能云的分布式数据并行处理方法。使用一个专用的网络服务分层结构,适用于高性能广域网络连接的计算机集群所产生的
我国教育体系中,职业教育是十分重要的组成部分。当前社会经济快速发展,我国的职业教育也实现了良好的建设,但是在职业教育中师资力量不足、教学质量不高的问题依然存在,并制
随着我国社会主义市场经济的快速发展,我国一些上市公司的会计披露存在诸多问题。会计披露的主要内容有关企业财务状况、经营成果和现金流量等消息的重要报道,包括招股说明书
目的探讨在手术室如何更好地预防手术切口感染。方法对2011年5月-2012年5月2520例手术中的12例手术患者手术切口感染的相关因素进行调查分析。结果手术切口感染除了与手术类
当前,金融业已经成为经济发展的主引擎,金融业的兴衰直接关系着经济的发展速度和水平。随着金融创新的不断发展,金融衍生品的形式也越来越多样化。金融创新一方面直接推动了
通过近8年的引种试验研究,摸清和掌握了"华特"猕猴桃(Actinidia Chinensis)在河南西峡的生物学特性与生长表现。
针对DSmT混合规则计算和存储复杂度高的问题,提出一种矩阵计算法。该算法对辨识框架的基本元素进行集合编码,从而简化混合规则的组合过程。实验结果表明,该算法使执行时间随辨识
为实现无人直升机的地标跟踪,将在线特征选择过程嵌入粒子滤波算法,采用自适应的状态转移模型,在跟踪过程中利用R、G、B值的线性组合作为候选特征集,对特征的目标区域和背景区域的颜色直方图分布进行统计,根据获得的对数似然比,选择区分度最好的特征计算似然图像,并通过2种途径获得2组粒子,用于估计目标位置。实验结果表明,该算法跟踪精度较高,鲁棒性较强。