优化分布式环境中的多个XML查询

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户：dswwldsw

【摘要】

：

【作者】

：

和菊珍彭敦陆王晓玲周傲英

【机构】

：

复旦大学计算机科学与工程系,上海,200433 复旦大学计算机科学与工程系,上海,200433;上

【出处】

：

第二十二届中国数据库学术会议

【发表日期】

：

2005年7期

【关键词】

：

标准数据格式 XML查询数据源分布式环境文本压缩

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为信息交换和发布的标准数据格式,近年来XML已经得到了广泛应用.如RSS(RDFSiteSummary)技术,它是一种以XML为标准进行站点之间共享内容的简易方式,涉及的应用包括blog最新内容收集和新闻信息集成,将来还可能涉及到新闻搜索、求职信息注册等.对于一个持有大规模RSS文档的数据源,随着用户查询数量的不断增加,其信息检索和发布将成为一大负担.而RSS数据的结构简单,包含大量的文字描述,这样以文本(text)为主的XML数据,经压缩后会获得较高的压缩率.针对以上类似应用场景,本文通过利用用户机器中继(relay)数据来减轻数据源负担;对发布的信息进行压缩来节约网络带宽.

其他文献

基于Workflow的动态服务聚合QoS模型及评价体系

QoS在面向服务的应用中有着非常重要的作用,本文研究了可扩展的动态服务聚合QoS模型以及基于Petri网的服务聚合流程基本控制模式和服务聚合流程QoS计算方法,是实现基于QoS的动态服务聚合的基础.

会议

工作流QoS模型动态服务聚合服务聚合流程

基于Web服务的技术转移平台推荐系统研究

本文在第2部分首先介绍了目前技术转移平台研究现状,并指出传统推荐技术不能很好地适应技术转移平台特点.本文经过分析后提出Web服务可以有效的解决这一存在问题,在第3部分概述了Web服务技术,接着介绍了技术转移平台上基于Web服务的推荐系统的结构及推荐流程(第4部分).在文章的第5部分简要的介绍了该方法的实现情况.最后部分对全文进行了小结和展望.

会议

Web服务技术转移平台推荐结构推荐流程

可信度在次协调关系数据库中的应用

本文主要是在次协调关系数据库的基础上引入了可信度的概念,并对代数运算做了新的定义,从而扩展了次协调数据库的功能,这在实际应用中有着重大的意义.但由于次协调数据库的概念直到近年来才被提出,还需要将传统数据库中的关系演算、查询优化、范式、完整性约束等概念引入到次协调数据库中来,以完善其整个系统.

会议

关系数据库可信度次协调关系集合运算

一种基于单调递减阈值函数的高维数据集聚类算法

聚类分析是数据挖掘领域中的一项重要的研究课题,它既可以作为一个单独的工具以发现数据库中数据分布的一些深入的信息,也可以作为其他数据挖掘分析算法的一个预处理步骤.目前,高维数据集的高效聚类已成为聚类分析算法的巨大挑战.迄今为止,国内外的研究者已经提出了许多聚类算法,在本文中提出了一种基于最优分割区间和单调递减阈值函数的子空间聚类算法FIS.它在保证精度的同时能够有效改善聚类算法对于存在高维聚类的执行

会议

高维数据集聚类算法单调递减阈值函数数据挖掘最优分割区间FIS算法

一个基于粗糙集的XML多值依赖发现算法

1998年2月,W3C推出了可扩展标记语言XML.随着XML成为Web上进行半结构化数据表示和数据交换的标准,XML数据相关技术的研究成为热点.本文首先给出XML多值依赖的一个定义,定义中采用约束限制范围很好地解决了多值依赖的有效性与属性集范围有关的问题.在此基础上,转化为信息表,利用不可分辨关系对信息表细化,并给出多值依赖的判定定理.根据多值依赖的特点,提出发现多值依赖的两点规则,并给出一个新的

会议

可扩展标记语言XML半结构化数据数据交换存储模式查询优化

模糊聚类的最大树法在文本分类中的应用研究

随着因特网的快速发展,电子文档的数量增长极快,使得文本自动分类对于信息处理的意义变得更加重要,文本自动分类已成为一项重要的研究课题.目前,国内外学者已经提出了多种文本分类方法,如:Bayes、支持向量机、群体智能、神经网络、N-gram等,但仍然有很多问题亟待解决.本文针对文本分类提出了基于最大模糊支撑树的文本分类算法ATCMT,实验结果表明该算法是一种有效的方法.只要文本特征抽取准确、相似性度量

会议

模糊聚类最大模糊支撑树文本分类信息处理语法歧义

隐私数据访问控制中间件的研究和实现

随着数据库技术的广泛应用,关系型数据库中保存了海量的数据,其中包括大量的用户隐私数据,例如住址、年龄、身份证号码、邮件地址、常用的银行卡号等.用户对隐私数据要求越来越多的保护,特别是电子商务的广泛开展使得这方面的需求越来越突出.数据隐私指用户有自主的权力来决定在什么时候,以什么样的方式,提供哪些数据和其他人进行交流.研究者在Hipocratic数据库的研究中提出限制非授权访问是隐私保护中一条非常重

会议

关系型数据库隐私数据访问控制中间件应用程序层

基于数据挖掘的元胞自动机知识发现

本文在分析了CA数据样本的特性并进行多次实验之后,提出了适用于CA的数据挖掘方法.在运用了改进后的K-Mean和K-Mode方法的试验的最终结果表明,在由第IV类自动机生成的样本集中,虽然每个样本形态复杂,但是样本与样本之间存在一定相似性与规律性,这些发现会对利用CA来模拟预测现实世界的研究工作有所帮助.

会议

数据挖掘元胞自动机知识发现

一种扩展的RBAC模型及其实现机制

RBAC的概念在20世纪70年代就已经提出,但是在此后的二十年中没有引起人们足够的重视.直到1996年R.S.Sandhu等人正式提出了RBAC96参考模型,这个模型由RBAC0,RBAC1,RBAC2和RBAC3四个子模型构成,RBAC0是最基本的模型,包括角色的授权(permis-sion)分配和用户的角色分配.RBAC1在RBACO的基础上增加了角色的层次(RoleHierarchy)概念,

会议

RBAC模型角色授权角色分配模型扩展数据库

基于操作依赖规则发现的MLS-DBMS隐通道检测方法

本文提出了一种隐通道使用检测方法,通过挖掘数据库中审计信息检测隐通道的使用.作为一种特殊的信道,隐通道的发送者与接收者的行为之间存在依赖关系.通过分析与寻找审计表中记录的操作之间的依赖关系,可以检测出构成隐通道的操作.该方法并不依赖于对系统彻底的隐通道分析,并可以用于时序隐通道以及其他未知隐通道的识别.

会议

隐通道操作依赖规则检测方法MLS-DBMS

优化分布式环境中的多个XML查询

与本文相关的学术论文