外存中高效的字符串相似性查询处理

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户：Raistlin_M

【摘要】

：

字符串相似性查询是众多应用的基础操作,如数据清洁、拼写校验、生物信息学和信息集成等.随着数据的爆炸性增长,大规模字符串数据日益普遍,现代的信息系统中也广泛使用字符串

【作者】

：

王金宝高宏李建中杨东华

【机构】

：

哈尔滨工业大学基础与交叉科学研究院高性能计算中心,哈尔滨工业大学计算机科学与技术学院

【出处】

：

计算机研究与发展

【发表日期】

：

2015年3期

【关键词】

：

字符串相似性查询外存查询处理编辑距离 string similarity search external memory query processing

【基金项目】

：

国家“九七三”重点基础研究发展计划基金项目（2006CB303005）, 国家自然科学基金项目（60903016,60533110,60773063,61272046）, 教育部新世纪优秀人才支持计划基金项目（NCET-05-0333）, 黑龙江省教育厅科学技术研究项目（11531276）, 中国博士后科学基金第六批特别资助项目（2013T60372）, 黑龙江省自然科学基金项目（F201317）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

字符串相似性查询是众多应用的基础操作,如数据清洁、拼写校验、生物信息学和信息集成等.随着数据的爆炸性增长,大规模字符串数据日益普遍,现代的信息系统中也广泛使用字符串作为数据的表达形式.现有支持字符串相似性查询的方法大多是基于q-gram的内存倒排索引,在处理大规模字符串集合会消耗无法忍受的内存容量,甚至在数据量过大时造成内存容量不足而无法支持查询处理.现有的外存倒排索引Behm-Index在查询的过滤阶段只支持少数过滤器,不能有效地减少查询I/O代价.提出了LPA-Index：一种支持长度过滤器和位置过滤

其他文献

关于实验教学改革的思考

本文论述了实验教学在高等教育中的地位与作用,针对实验教学的现状,从转变教育观念、构建实验教学的新模式、实验教学体系及实验教师队伍出发,探讨了实验教学的改革思路.

期刊

实验教学改革实验教师队伍教育观念实验教学体系地位与作用高等教育构建改革思路新模式现状experiment teaching Teaching

加味四逆散治疗慢性浅表性胃炎40例

慢性浅表性胃炎是胃黏膜的慢性炎症病变。胃的通降是其生理特征，治疗着重疏通气机，气行则血行，畅通无阻则胃痛自除。宜肝胃同治，待肝气疏，脾胃气机调畅，从而达到和胃止痛之目的。四

期刊

浅表性胃炎加味四逆散治疗

呼市科技局赴成都考察调研

10月22日-25日，呼和浩特市科技局局长张振民、剐局长工新厚一行考察了四川省拓丰生态农业科技开发有限责任公司核桃种植基地建设和成都美溢德生物技术有限公司生物肽饲料两个

期刊

科技局成都调研农业科技开发生物技术呼和浩特市种植基地四川省

2014我市高新技术企业状况分析

高新技术企业是指知识密集、技术密集型的经济实体，它是先进生产力的集中体现和主要标志。高新技术及其产业的发展对推动我市先进生产力的发展，增强我市的综合经济实力，提高广大

期刊

高新技术企业技术密集型先进生产力综合经济实力经济实体人民群众生活水

智能温室的设计

本文介绍用于营造人工环境、生产绿色无公害植物的智能温室.较系统地阐述了自动化温室的结构设计,控制系统的软、硬件设计及实现.

期刊

智能温室天窗起闭机构外遮阳机构外侧膜运动机构微雾系统降温机构控制电路数据处理系统控制软件intelligent greenhouse blur

中西医结合治疗乙肝相关性肾炎研究进展

从中医对乙肝相关性肾炎病因病机的认识、辨证分型论治、专方专药治疗、发病机制的现代研究、中西医结合治疗等方面对中西医结合治疗乙肝相关性肾炎研究作了综述。指出，发病机

期刊

乙型肝炎病毒相关性肾炎中西医结合治疗综述

半夏泻心汤加减治疗消化性溃疡37例

消化性溃疡多寒热并见，虚实挟杂，湿瘀交结。治宜寒温并用，攻补兼施。可分肝胃不和、肝胃郁热、瘀血阻络、脾胃虚寒、脾胃阴虚等五型。六腑以通降为顺，应贯穿于治疗的始终。方用半

期刊

消化性溃疡半夏泻心汤加减中医药疗法

汽机高压调门断销事件的浅析

2014年9月23日,茂名热电厂#6机组发生一起由于#2高调门门杆销子断裂,调门反馈无法关闭到位,#6机组被迫申请停机的不安全事件。汽轮机运行中,一旦调门卡涩关闭不到位极有可能

期刊

高压调门断销汽轮机High-pressure governing valve dowel broke turbine

2012年呼和浩特市农业科技培训行动实施方案

近年来．我市农业生产的科技水平不断提高．有力的支撑了农牧业又好又快发展。随着现代农业建设的快速推进，农业科技创新、技术推广普及、农业农村人才队伍培养和农业科技培训服务

期刊

农业科技培训呼和浩特市人才队伍培养农牧业生产农业科技创新服务体系建设农业生产农业建设

六自由度机械臂轨迹规划算法研究

机械臂在运行过程中,一旦出现不连续、不平稳问题,会降低工作效率且增加机体维护成本,由此提出了一种4-5-4多项式分段插值算法来解决此类问题。针对PUMA560机器人,运用D-H参

期刊

六自由度机械臂运动学D-H参数分段插值轨迹规划6-DOF manipulatorkinematicsD-H parameterspiecewise i

外存中高效的字符串相似性查询处理

与本文相关的学术论文