一种基于尾匹配q-gram的近似串匹配算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户：qiuzy

【摘要】

：

近似串匹配是生物信息学、文本检索、信号处理等领域的一个基础问题,如何提高近似串匹配的速度一直都是研究的关键问题.提出一种新的在大文本库中快速查找近似匹配的无损过滤

【作者】

：

孙德才王晓霞

【机构】

：

渤海大学信息科学与技术学院,渤海大学大学计算机教研部

【出处】

：

计算机科学

【发表日期】

：

2014年6期

【关键词】

：

近似串匹配过滤算法 q-gram过滤 q元语法 Approximate string matching Filter algorithm q-gram f

【基金项目】

：

辽宁省社科联2014年度辽宁经济社会发展立项重点课题（2014lslktzdian-04）,国家自然科学基金项目（61173142,61202462）,辽宁省教育厅一般项目（L2013422,L2012397）,辽宁省“百千万人才工程”项目（2012921058）资助.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近似串匹配是生物信息学、文本检索、信号处理等领域的一个基础问题,如何提高近似串匹配的速度一直都是研究的关键问题.提出一种新的在大文本库中快速查找近似匹配的无损过滤算法.为保证在大文本库中的匹配速度,本算法使用了查询速度较快的q-gram索引.为通过提高过滤算法的过滤效率达到提升算法整体性能的目的,详细分析了含有匹配串的文本区域,提取了一些基于尾匹配q-gram特征的新过滤条件,然后用这些特征优化了过滤算法的过滤标准.实验数据表明,新过滤条件有效地提高了算法的过滤效率,提升了算法的整体性能.结果显示新算法适

其他文献

T—Minicore嵌入式时间可预测操作系统的设计与实现

目前学术界对时间可预测性尚无统一定义，而时间可预测系统研究也主要集中在体系结构层和编程语言层。根据目前认可度较高的时间可预测性定义，提出对时间可预测性系统进行粒度划

期刊

嵌入式操作系统时间可预测性逻辑执行时间服务体执行流Embedded OSTiming predictability Logical executio

障碍空间中的移动对象位置预测

移动对象的运动基本是在障碍空间里进行的.近几年,已有较多针对障碍空间中范围查询、近邻查询、聚类查询等的研究,但是目前尚没有对障碍空间中移动对象的位置预测进行研究.为

期刊

障碍空间移动对象预测灰模型Obstructed space Moving object Prediction Gray model

高校基建档案管理存在的问题及对策

一、高校基建档案的特点1．专业性。集中表现在基建档案的形成领域和内容性质都具有鲜明的专业性特点。

期刊

基建档案管理高校文件材料档案知识

浅谈企业人事档案管理工作

人事档案是党政机关、企事业单位在管理所属人员时形成的以个人为单位集中保存的一种特殊的专门档案，是全面、历史地考察了解一个人和党的组织工作、人事工作不可缺少的重要参

期刊

人事档案管理工作企事业单位企业党的组织工作人才合理流动使用人才党政机关专门档案

企事业单位档案编研工作初探

档案编研工作作为档案业务建设中的一个重要组成部分，已在档案界引起高度重视。近年来，随着《档案法》的深入贯彻实施，全社会档案意识的普遍增强，企事业单位档案工作进入了一个新

期刊

档案编研工作企事业单位档案信息开发利用档案信息服务档案业务建设社会档案意识档案信息管理档案管理工作

试论声像档案管理的职能强化和机制创新

声像档案作为档案管理的一项重要内容,其形成必须依赖现代化的管理设施和手段,如照像机、录音机、摄像机、放影机(电脑、电视机、VCD、DVD机)、刻录机,以及所使用的胶卷(片)

期刊

和谐档案人刍议

构建社会主义和谐社会是我党执政理论的升华，其根本任务就是要形成全体人民各尽所能、各得其所而又和谐相处的社会。社会主义和谐社会，就是以人为本的社会，档案作为记载人类思想

期刊

构建社会主义和谐社会档案工作执政理论各尽所能和谐相处以人为本思想认识科学技术

基于精英的量子粒子群优化的Ad hoc能耗研究

在Ad hoc网络中,随着多播应用领域的日益扩大,如何构造最小能耗多播树是一个重要问题.针对选择不同的中继节点对构造最小能耗多播树产生的影响,提出了一种优化最小能耗多播树

期刊

AdHOC网络精英学习量子粒子群优化多播路由最小能耗Ad hoc networks Elitist learning Quantum-behav

新形势下国防科技工作企业产品科技档案应用研究

产品档案是在产品的设计、研制和生产、制造活动中形成的科技档案，是反映产品的设计、研制和生产、制造活动的真实记录。产品档案是企业产品发展的基础和成果积累，不仅凝聚着企

期刊

国防科技工业企业产品科技档案应用企业科技档案企业技术开发产品档案科研成果科技工作者

电子文件与电子档案管理的研究

一、电子档案管理的现状及问题的根源1．对电子档案管理的认识存在一定局限性电子文件之所以涉及范围迅速扩展、数量急剧增加，最主要的原因就是计算机网络化的快速发展。多数办

期刊

电子档案管理电子文件计算机网络化办公自动化网络档案工作者涉及范围档案部门

一种基于尾匹配q-gram的近似串匹配算法

与本文相关的学术论文