分布式环境下重叠分块FM-index算法的设计

来源 :中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会 | 被引量 : 0次 | 上传用户:lgs0519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和数据库发展,数据急剧增长,对信息检索提出了挑战。压缩查询技术实现了在压缩状态下查询文件,其中压缩查询索引FM-index是该领域的一种先进的算法。但FM-index在建立索引时却要消耗很大的内存。而重叠分块FM-index方法在内存空间的占用上得到了改进,但是对于GB级以上的数据,性能上还需进一步改进。以重叠分块的FM-index和网格计算技术为基础,通过对参数及结果传递的各种方案比较,结合重叠分块FM-index和网格计算的特点,给出了设计并具体实现算法,同时分析了性能的改进。
其他文献
提出了一种基于Web使用挖掘技术的个性化学习模型,讨论了基于该模型的个性化网络协作学习系统在ASP.NET框架下的设计与实现。系统采用B/S结构,使用方便,试用效果良好。
本文主要讨论了利用全站仪和RTK两种技术进行工程放样,在正常情况下,即在满足RTK放样测量的区域,比较使用全站仪和RTK放样时的精度;在不利环境的干扰下,如高山峡谷深处、密集林区
空气是人类生存的必要条件,扩散容易,对人体的伤害最直接,影响面也最大。因此,在大气环境保护的过程中,优良的大气环境监测质量控制起着一个非常重要的作用,相反,不良的大气环境监测
2006年2月22日,在新华社播发《中共中央国务院关于推进社会主义新农村建设的若干意见》的第二天,吴定富主席来到广西壮族自治区恭城瑶族自治县,深入调研“三农”保险服务建
随着环境监测实验室日益增多,由此而暴露的环境监测实验室的管理问题也越来越多。本文针对环境监测实验室管理的几个重要环节,包括废液的管理、试验仪器设备管理和实验室的安全
面对硬件故障、软件失效、人为操作失误等事实,重点研究了如何通过快速恢复来降低系统MTTR从而提高分布式应用系统的可用性。微重启是一种新型的针对大型分布式应用软件系统的
会议
随着实时多媒体应用的推广,DiffServ已在国内外多家服务提供商的支持下得到了飞速发展。由于各个ISP之间往往采用各自的组织策略,因此在未来基于多域Diffserv的通信环境下,网络
会议
结构工程网格聚集地理上分布的、异构的结构工程实验与研究资源,实现相关领域研究、设计和工程技术人员之间的协同工作。门户提供用户使用网格资源的入口,通过该入口用户访问网
会议
伴随Internet规模的扩展和连接密度的增加,对于BGP协议性能的要求也越来越高。多核处理器的出现和并行程序设计的发展为解决这一问题提供了新的途径。在分析BGP协议实体多邻居
会议