论文部分内容阅读
随着IPTV、EC、网络服务(Web Service)、音乐和电影下载等大规模网络应用的不断发展,网格、P2P(Peer to Peer)和云计算等分布式计算技术不断推陈出新。这些技术往往基于现有基础软件平台、通过摒弃传统分布式系统中的某些约束并采用新技术或改进原有技术来解决分布式网络环境下的特定应用问题。为了寻求面向大规模网络应用的通用计算模式和整体解决方案,8010研究室把大规模分布式计算技术推进到基础软件层,经过多年多个阶段研发出包括OS和DBMS两个核心软件的“数字有机体系统”基础软件平台并取得了应用的成功。该平台除了必须具备基础软件全部功能外,还面临着与其它大规模分布式应用系统一样的高性能网络服务问题,而这一问题的解决在很大程度上依赖于系统内部共享资源的搜索定位机制。本文对基于数字有机体数据库系统的数字有机体系统搜索定位机制进行了全面研究,主要工作和贡献如下:1.在分析基于网格计算、对等计算和云计算等分布式计算技术的大规模应用系统的搜索定位技术、研究现状和发展趋势的基础上,介绍了数字有机体系统的由来及其研究的目标和意义,首次把数字有机体数据库系统的研发历程总结为分布式、分布式并行和数字有机体三个阶段并对各阶段成品系统在网络结构、软件体系结构和应用情况等方面进行了详细介绍。2.构建了数字有机体数据库系统基于区/站/节点三级分层和区间对等的混合覆盖网结构并基于该结构建立了站内分布式并行、区内回溯和区间对等的搜索定位模型,介绍了基于数字有机体数据库系统的数字有机体系统搜索定位的目标、类型、步骤和特点。3.提出并构造了包括描述热点资源缓存的缓存信息表、记录搜索定位历史的信息库、描述搜索定位相关知识信息的知识库、提供按资源名或关键字定位的共享资源索引信息表等多种辅助快速搜索定位的特殊数据结构并给出了相应的搜索定位算法。4.研究了基于分布式并行技术的数字有机体数据库系统站内搜索定位机制,介绍了执行站内搜索定位的分布式并行事务并对事务执行过程中的服务器节点角色进行了划分,描述和分析了保证站内搜索定位结果正确性和一致性的分布式并行两阶段提交协议,分析了基于分布式并行技术的搜索定位扩展到大规模系统的诸多局限性。5.提出了基于位置索引压缩的共享资源索引信息压缩方法,阐述了利用位串表示关键字位置分布信息的原理和方法,介绍和分析了基于位置索引压缩的索引信息发布、汇聚和区内搜索定位算法。实验表明,该压缩方法可达到较高的记录压缩比,对搜索定位效率的提高也起到了一定的作用。6.提出了基于多维度QoS约束的副本定位方法MQoSRL,定义并形式化描述了多维度QoS约束问题,给出了包括索引分级发布和区间路由等子算法在内的MQoSRL全局副本搜索定位相关算法。分析和应用表明,MQoSRL具有高效和负载均衡等特性,同时还可有效降低系统平均响应时间。