Dwarf结构的存储策略及查询处理的研究与实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:a873322604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Dwarf是一种语义压缩算法,它通过在数据立方计算过程中消除数据立方中的语义冗余来达到数据压缩的目的。相对于其它几种语义压缩方法,Dwarf具有更高的压缩比,但由于自身结构的缘故,Dwarf同时又具有查询性能不高、更新困难的弱点。本文在分析了Dwarf自身特点以及OLAP查询特点的基础上,提出了有利于Dwarf查询的聚簇算法——针对点查询的递归聚簇算法和针对范围查询的层次聚簇算法。实验证明,这两种聚簇方法能够比较好地加速所针对性的查询方式,但是不能加速对方所擅长的查询方式。 同时,本文在分析了WindowsNT的磁盘系统特点的基础上,设计了基于自定义缓冲区的Dwarf查询系统。这是由于Dwarf查询的完全随机特性使得WindowsNT操作系统的磁盘高速缓存和智能预读功能同时趋向于失效。与WindowsNT操作系统内存管理类似,本文提出的自定义缓冲区采用页式结构,所不同的是本文采用了基于页面访问频数的页面置换策略进行页面置换。本文通过实验证明,应用自定义缓冲区以及采用基于页面访问频数的页面置换策略能够综合本文提出的两种聚簇方法的优势,提高了聚簇算法的查询适应性以及查询性能。
其他文献
多色点集划分研究的是如何将含有不同颜色点的平面划分为各个区域,每个区域中只包含一种颜色的点。这是计算几何中的一种组合优化问题。但是现有的多边形划分方式所得到的结
为了保障人类的健康,药品在投放市场前必须进行药理毒理性试验,特别是用于测量药品毒性的血液生化分析实验。血液生化分析实验要对大量的血项指标数据进行统计分析,目前的统计分
在图像的成像、数字化、压缩和传输等过程中难免会有各种干扰,形成图像噪声。为了使图像的后续应用得到更好的结果,在处理图像前一般都要进行降噪预处理。现有的图像滤波方法
随着Internet技术的飞速发展,分布式存储技术取得了长足的进步。同时,日益增加的用户和数据,也给分布式存储技术带来了新的挑战。另一方面,随着P2P计算模式的兴起、网络带宽的大
降低软件系统开发成本,提高开发效率是企业软件开发不断追求的目标。从技术角度来说,提高软件的复用效率,采用更先进的开发工具是提高开发效率的有效手段。 目前,国内部分空调
关键词识别是语音识别研究中的一个重要领域,其目的是从连续语音中检测并确认给定的若干个特定关键词。跟关键词识别相比,目前连续语音识别有资源耗费大,速度慢,抗噪能力不强等缺
随着互联网技术的迅速发展,越来越多的Web应用出现在人们生活的各个领域。这些独立的Web应用分散在Internet上,实现特定的业务功能,通过浏览器就能方便地进行使用。当开发新的We
DNA微阵列产生巨量的表达谱数据,用以挖掘特定的生物信息,而对表达谱数据的分析离不开有效而可靠的聚类算法。现有的聚类方法都是把具有相似表达模式的基因或样本归为一类,而
CAMEL4(CustomizedApplicationforMobileNetworkEnhancedLogic4)作为CAMEL的最新版本,是3GPP(3rdGenerationPartnershipProject)组织为适应3G承载与信令分离的特点以及用户对
下一代互联网NGI(NextGenerationInternet)是建立在各种有线、无线网络上的一个全IP网络。NGI的接入网部分是一个层次蜂窝的结构。对于终端用户而言,在某时刻,有可能同时处在多