一种基于尾匹配q-gram的近似串匹配算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:qiuzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近似串匹配是生物信息学、文本检索、信号处理等领域的一个基础问题,如何提高近似串匹配的速度一直都是研究的关键问题.提出一种新的在大文本库中快速查找近似匹配的无损过滤算法.为保证在大文本库中的匹配速度,本算法使用了查询速度较快的q-gram索引.为通过提高过滤算法的过滤效率达到提升算法整体性能的目的,详细分析了含有匹配串的文本区域,提取了一些基于尾匹配q-gram特征的新过滤条件,然后用这些特征优化了过滤算法的过滤标准.实验数据表明,新过滤条件有效地提高了算法的过滤效率,提升了算法的整体性能.结果显示新算法适
其他文献
目前学术界对时间可预测性尚无统一定义,而时间可预测系统研究也主要集中在体系结构层和编程语言层。根据目前认可度较高的时间可预测性定义,提出对时间可预测性系统进行粒度划
移动对象的运动基本是在障碍空间里进行的.近几年,已有较多针对障碍空间中范围查询、近邻查询、聚类查询等的研究,但是目前尚没有对障碍空间中移动对象的位置预测进行研究.为
一、高校基建档案的特点1.专业性。集中表现在基建档案的形成领域和内容性质都具有鲜明的专业性特点。
人事档案是党政机关、企事业单位在管理所属人员时形成的以个人为单位集中保存的一种特殊的专门档案,是全面、历史地考察了解一个人和党的组织工作、人事工作不可缺少的重要参
档案编研工作作为档案业务建设中的一个重要组成部分,已在档案界引起高度重视。近年来,随着《档案法》的深入贯彻实施,全社会档案意识的普遍增强,企事业单位档案工作进入了一个新
声像档案作为档案管理的一项重要内容,其形成必须依赖现代化的管理设施和手段,如照像机、录音机、摄像机、放影机(电脑、电视机、VCD、DVD机)、刻录机,以及所使用的胶卷(片)
期刊
构建社会主义和谐社会是我党执政理论的升华,其根本任务就是要形成全体人民各尽所能、各得其所而又和谐相处的社会。社会主义和谐社会,就是以人为本的社会,档案作为记载人类思想
在Ad hoc网络中,随着多播应用领域的日益扩大,如何构造最小能耗多播树是一个重要问题.针对选择不同的中继节点对构造最小能耗多播树产生的影响,提出了一种优化最小能耗多播树
产品档案是在产品的设计、研制和生产、制造活动中形成的科技档案,是反映产品的设计、研制和生产、制造活动的真实记录。产品档案是企业产品发展的基础和成果积累,不仅凝聚着企
一、电子档案管理的现状及问题的根源1.对电子档案管理的认识存在一定局限性电子文件之所以涉及范围迅速扩展、数量急剧增加,最主要的原因就是计算机网络化的快速发展。多数办