分布式环境下重叠分块FM-index算法的设计

来源 :中国计算机用户协会网络应用分会2008年网络新技术与应用研讨会 | 被引量 : 0次 | 上传用户:camel1650
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络和数据库发展,数据急剧增长,对信息检索提出了挑战。压缩查询技术实现了在压缩状态下查询文件,其中压缩查询索引FM-index是该领域的一种先进的算法。但FM-index在建立索引时却要消耗很大的内存。而重叠分块FM-index方法在内存空间的占用上得到了改进,但是对于GB级以上的数据,性能上还需进一步改进。以重叠分块的FM-index和网格计算技术为基础,通过对参数及结果传递的各种方案比较,结合重叠分块FM-index和网格计算的特点,给出了设计并具体实现算法,同时分析了性能的改进。
其他文献
IPv6技术解决了IPv4地址短缺的问题,同时使得传统的扫描和探测技术不再适用。研究了IPv6与IPv4下扫描探测的技术区别,通过分析IPv6下扫描攻击Alive6的原理,提出检测Alive6的方法并在Snort入侵检测系统中实现和验证。
基于校园IPv6网络环境,对IPv6数据报进行抓取与解析,获得数据报头的关键字段,进而获得应用层信息。通过对获得的信息进行统计分析,得出校园网内现有IPv6应用的特点。研究的重点是对IPv6数据报从底层到高层进行协议分析的方法,特别是对应用层内容分析的方法。
TCP采取端到端的拥塞控制机制。起初,端点获得拥塞信息是靠传输路径上的路由器队列溢出而丢弃数据包,使得发送方TCP定时器超时而采取控制策略。后期出现了基于路由器的主动队列管理(AQM)和随机早期检测(RED)算法,实现了拥塞避免机制。但仍采用丢包方法提示TCP端点,这对延迟和丢包敏感的应用存在问题。为此,提出了对TCP/IP协议的进一步改进方案——在IP中增加显式拥塞指示(ECN)。ECN以AQM
针对IPv6网络的拓扑发现,在分析现有的基于Traceroute6的拓扑发现方法的基础上,结合防火墙穿透技术,提出了使用TCP ACK报文作为探测包进行拓扑发现的方法。实验表明,在IPv6网络环境下,TCP ACK探测包可以发现IPv6网络节点,应用在拓扑发现中效果较好,具有一定实用价值。
随着计算机技术和通信技术的发展,即时消息技术越来越受到人们的关注,在企业信息化、电子政务和个人通信等领域得到广泛的应用。为行业和企业用户开展无线办公提供了基础设施平台,为推动移动办公的应用和发展创造了有利条件。安全生产问题是煤矿生产中的重中之重,瓦斯事故是当前煤矿生产的主要灾害。通过对即时消息系统的模型、通信机制等问题的研究,设计和实现基于即时消息的煤矿监控系统中即时消息/语音报警功能。
近年来随着对Ad hoc路由协议研究的深入,提出了许多路由协议,混合型路由协议ZRP(Zone RoutingProtocol)就是其中之一。由于目前ZRP的研究主要是在所有的节点的移动性被假设为相似情况下进行的,针对此情况的局限性,提出了一种更有效的EZRP(Efficient ZoneRouting Protocol)来满足具有不同移动性的节点所组成的网络。EZRP的主要思想是区域半径的大小取
基于码分多址(CDMA)技术的第三代(3G)移动通信系统中,有效的无线资源管理是保证系统服务质量的重要课题,呼叫接纳控制是无线资源管理的重要功能实体。提出一种基于用户模型的多业务CAC方案,该方案在多小区环境下,通过时小区内外的干扰情况和ON-OFF信源特性的研究,以小区掉线概率作为准则,提出新的呼叫接纳控制算法。
为了将散斑-衍射积分方程表达为数学上可操作、物理意义明显的形式,利用高性能计算平台数值上求解该积分方程。由于积分方程需要产生大量随机数参与运算,与Monte Carlo方法相比,采用优化复化梯形算法更有利于提高教值模拟效率,并且利用该算法设计了3种并行程序求解积分方程。应用MPI实现并行网络计算时,分析了不同的输入参数对随机变量的数字特征和负载特征的影响,并且实验验证了动静结合方式最有利于求解此计
在对等网络中DHT资源定位算法会造成逻辑覆盖网络与底层物理网络常常出现较大的不一致。在对Chord协议进行认真研究的基础上,提出使用结构化节点ID的改进方案。实验表明改进方案可使物理网络中邻近的节点在逻辑覆盖网络中尽量接近。
提出了一种基于局域网的内存数据组织方法和内存管理机制,并设计实现了一个分布式内存管理系统。系统充分利用局域网内计算机的内存资源,采用数据包组织方式,利用同步协议机制保持主包和备包的同步,实现对数据包的保护。实验结果表明,这种应用于局域网的分布式内存管理系统是确实可行的。