XCluster:基于聚类支持查询的XML多文档压缩方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:cxr1682000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML已成为各种网络应用中数据存储和数据交换的标准.XML数据管理面临的最大困难在于结构与数据混合存储导致大量数据冗余,这极大地增加了XML数据存储、交换和处理的代价.对XML文档进行压缩可以在一定程度上解决这个问题.但现有XML压缩方法大都仅压缩单文档中的冗余信息.利用XML文档间的相似性,提出一种支持查询的多XML文档压缩存储方法XCluster.XCluster先利用XML有根有序标签树上改进的pq-gram近似距离对XML文档集进行层次聚类;然后合并每个聚类结果子集中文档的结构得到结构代表并进行字
其他文献
现代学徒制是英国面向义务教育后不再接受全日制教育的青年人的一种培训制度。本文对其基本特点、存在问题及其改革走向进行了系统研究,力求为我国有效推进普及高中阶段教育提
  作为电阻、电容、电感之外的第4种基本电路元件,忆阻器自2008年被发现以来受到学术界和产业界的广泛关注。忆阻器的阻值记忆效应和纳米工艺制造方式使其被认为可用于构建
需求规约到软件体系结构(SA)模型的转换是软件工程领域的一个研究热点,UML-RT广泛用于实时系统软件体系结构建模,然而基于自然语言规约建立的UML-RT模型往往是不精确的,存在二
众所周知,通信工程项目、通信工程科学中的问题都必须借助基础理论来解决。然而若借助基础理论束解决,必须要做一些假设。这就势必影响通信工程问题解决的准确性。可见,要准确解
乡镇财政是我国财政体系中最基层的一级财政,是我国财政体系的基石,担负着为国家筹集、分配和监督管理乡镇财政收支的重要任务。本文对河北省经济发展现状、分税制度和监督管
丹麦哥本哈根大学尼尔斯·玻尔研究所的天体物理学家施特恩·汉森及其他研究人员,针对大范围不同类型的暗物质晕建立了一个计算机模型.暗物质晕环绕在星系外围,大多数的
《凤凰涅槃》一书,对抚矿集团由辱到荣,由兴至衰,后又突出重围,实现伟大复兴的百年沧桑历程,进行了系统的审视,高度凝炼了抚矿集团的成功之举,也探索出了企业获得持续发展的必由之路
安全协议模型是安全协议分析与验证的基础,现有的建模方法中存在着一些缺点,如:建模复杂、重用性差等.为此提出了一种类型化的π演算:π^t演算,并给出了相应类型推理规则和求值规则
本文从阐述越南教育体制入手,阐明越南职业教育体系中相关学校的设置、职业技术学校中教师分类以及教师的培训体系,由此论述了越南职业教育中存在的问题,探讨了越南职业教育发展
本文在对餐厅设施布局进行系统设计进行分析的基础上,利用FLBXSIM系统仿真软件建立了一个餐厅设施配置模型,对餐厅系统的设施数量及种类进行了仿真,并对仿真结果进行了分析。在