基于元组聚类的关系数据库压缩

来源 :兰州大学 | 被引量 : 0次 | 上传用户:sdn20907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库的压缩技术是数据压缩领域的一个重要研究分支。传统的数据库压缩方法基本都是按照流模式对数据库进行压缩处理,未考虑数据库数据的冗余分布,也没有考虑压缩后数据的存储规律问题,针对这一状况本文在分析了传统数据库压缩方法的基础上,并从元组角度出发,将聚类算法引入数据库压缩,提出了一种基于元组聚类的数据库压缩方法,并对该方法进行了较为深入的研究,所做的主要工作及取得的成果主要体现在以下几个方面:首先,构建了基于元组聚类的数据库压缩机制,设计了基于元组聚类的数据库压缩体系结构,将数据库的压缩过程分解为两个相对独立的阶段,先通过元组聚类将数据元组按照冗余度高低进行分组,在分组的基础上再进行元组压缩。其次,考虑到关系数据库的实际情况为了使K-means聚类算法能够运用于数据库元组的聚类,对K-means算法的初始条件进行了优化改进,提出并设计了聚类代价函数并给出了优化k值的优化算法,改进了K-means算法的初始中心元组的生成算法,使得到的初始中心元组更适合于数据库的元组压缩。再次,在元组聚类的基础上,提出了组中心的参照模式,依据参照关系将聚类组中的元组联系起来,在此基础上设计了一种数据库元组级别的差分压缩算法,对数据库中的元组数据进行压缩,并利用参照关系,对压缩后的数据采用参照树模式进行存储,定义了参照树存储的相关操作,同时保留了参照关系及数据库的相关信息以便于解压缩。
其他文献
随着Internet和Web信息的飞速发展,WWW己成为人们进行信息交流的不可缺少的巨大信息空间。面对如此巨大的海量信息,人们在寻找自己所需的信息时常常迷失方向。如何快速、准确地
P2P系统是一种应用层网络,它能够使联网的计算机以一种分布式形式共享资源。P2P系统的一个重要问题是如何有效地搜索到其他节点的资源。现有的P2P搜索技术大多基于洪泛查询思
本文目的是研究如何利用Web服务技术构建企业SOA。现在,SOA不再是抽象的软件工程术语,实现SOA已经具有现实的技术和平台,这就是在面向服务概念指导下,在SOA架构模型基础上,利用Web
企业信息系统是为一个企业提供信息基础服务设施的一个应用或企业系统。由于大部分的企业信息系统是在不同的时期或者是面向不同的需求进行开发的,因此它们所提供的接口相对来
随着经济全球化进程的加快,现代物流对经济发展的重要性逐步为国人所认识,我国的物流产业正处于一个高速发展的时期。现代物流的根本宗旨是提高物流效率、降低物流成本、满足客
随着企业信息化进程的推进,企业内信息系统的应用越来越广泛,在完成业务功能的同时,这些系统的相互独立性也给管理和使用设置了障碍,企业需要一种能为企业提供组织、搜索和获取真
随着互联网的高速发展,越来越多的网络主机相连,网络服务需求已超过了网络的服务容量,对具有QoS(Quality of Service)服务的应用产生了严重的影响,如视频点播、IP电话等。为了增
随着社会主义市场经济的发展,作为“第三利润源泉”的物流对经济活动的影响日益明显,越来越引起了人们的重视,成为当前“最重要的竞争领域”,未来的市场竞争,物流将起着举足
本文的研究工作主要围绕支持概念设计的、将概念设计过程与详细绘图过程紧密结合在一起的二维CAD技术开展。它旨在引入全新的基于手绘草图的人机交互方式,使二维CAD系统能够更
网格技术是以资源共享为主要特征的下一代互联网技术。由于网格中的资源具有动态性、多样性、自治性等特点,网格资源调度问题已经成为网格研究的一个热点和难点问题。网格资源