【摘 要】
:
作为信息交换和发布的标准数据格式,近年来XML在商业和科学研究等领域得到了越来越多的应用.XML文档通常被建模成一棵有序树Td,而由XML查询语言(如:XQUERY)所表示的查询请求也可以被建模成一棵查询树Tq,所以XML文档的查询问题可定义为树的匹配问题.其中,XML树中兄弟结点前后排列顺序确定的查询称为有序查询,相反,兄弟结点前后排列顺序无关的查询为无序查询.当用户对XML文档的任何信息未知时
【机 构】
:
复旦大学计算机科学与工程系,上海,200433 上海宝信软件股份有限公司,上海,201203
【出 处】
:
第二十三届中国数据库学术会议(NDBC2006)
论文部分内容阅读
作为信息交换和发布的标准数据格式,近年来XML在商业和科学研究等领域得到了越来越多的应用.XML文档通常被建模成一棵有序树Td,而由XML查询语言(如:XQUERY)所表示的查询请求也可以被建模成一棵查询树Tq,所以XML文档的查询问题可定义为树的匹配问题.其中,XML树中兄弟结点前后排列顺序确定的查询称为有序查询,相反,兄弟结点前后排列顺序无关的查询为无序查询.当用户对XML文档的任何信息未知时,提出的查询请求一般是无序查询.
本文提出了基于序列化查询的带权启发式查询算法(WHSA算法和I-WHSA算法),该方法在保持序列化查询方法的查询性能的同时,解决了无序查询的问题.通过启发式的查询策略,该算法有效地减少了需要进行处理的查询同构体的数目,从而大大减少了序列化查询的时间耗费.特别地,本文利用最小子串分解的方法对查询算法做了进一步优化,使得在XML文档集上进行无序查询的问题得到了很好的解决.最后,实验证明了I-WHSA算法的有效性和高效性.
其他文献
Apriori算法是最为著名的关联规则挖掘算法,它采用基于频集理论的递推方法,挖掘出的分类规则,具有准确率高,可理解性强的优点.但是,由于Apriori算法使用支持度-置信度框架,无法挖掘出支持度小的稀有信息,而且也没有考虑到项之间的关系,因而会影响分类的准确性.Brin等人于1997年首次提出了项的相关性的概念,他们在生成规则时既考虑到了频繁的项也考虑到了非频繁项,挖掘出的相关规则能够识别项之间
景观生态学(Landscape Ecology,LE),作为景观地理学和宏观层次生态学相结合的边缘学科,不仅给生态学、地理学及环境科学研究带来了新思想、新概念、新理论,而且也在其研究方法和技术手段上提出了许多新的挑战.我国"三江并流"地区的地形多样性以及生物多样性都极为突出,此条件下,两者是否有密切联系?联系中又遵循那些规律?如何有效地组织和管理该地区的空间数据,使其以一种易于理解、易于使用的形式
中国的诗歌艺术渊源流长,诗歌作为一种最接近口语的大众化文学形式,在汉语文化的成长演变与传播中占有极其重要的地位,唐代的诗歌更是集古代诗歌的优势于一身,并且把诗歌艺术发扬光大,因此对唐诗的研究历来是汉学研究的热点之一.不过,诗歌的传统研究往往依靠研究者的自身良好的文化修养,凭感悟直接把握作品的内涵,这种研究方法对于诠释作品的美学及人文意义有很强的优势,但在对作品的语言全貌进行横向和纵向的分析时,就会
近年来,移动对象数据库得到了广泛的重视与研究,其技术在许多领域中展现了广阔的应用前景.然而,数据库中的移动对象的数目是非常巨大的,从性能方面考虑,在查询的时候应当避免检查每个对象,也就是说,需要对移动对象的位置信息进行索引.到目前为止,人们对移动对象的索引问题进行了大量的研究,其中代表性的成果主要有基于TPR树的移动对象时空轨迹索引方法.但其中大部分工作都是基于移动对象在二维空间的自由移动,在现实
随着软件开发技术的发展,构件化技术已成为开发软件的主流技术.构件化技术使得软件具有良好的平台兼容性、结构开放性、规模可变性、系统可配置性以及代码重用等能力.在基于构件的软件声明周期中,构件部署是非常重要的一环.构件的部署是指为了使软件最终能被用户使用,在软件开发完成后的所有行为,包括:构件的安装,配置,激活以及重配置,升级和卸载.本文在已有工作的基础上提出了一种支持上下文感知的构件部署框架,很好地
XML数据流上的XPath & XQuery查询处理是目前研究者关注的热点问题,但由于XPath & XQuery查询语言相对复杂,在不知道模式信息的前提下,用户很难通过已有的查询接口得到自己感兴趣的数据片断,因此如何在数据流模型上根据XML数据的特点为用户提供最友好的查询接口就成为一个亟待解决的问题.针对这个问题,创新地提出了在XML数据流上做关键字查询的问题,给出了最小相关连通子树(SRCT)
目前,大部分工作流实例迁移策略都存在同一时间内多个版本同时运行的情况.本文在自由选择工作流网模型的基础上提出了基于任务补偿的实例迁移策略,并给出了在多项式时间内验证自由选择工作流网的状态可达性算法.避免了动态变更错误及同一时间内多版本运行所造成的工作流管理混乱.论文仅对工作流的过程变更作了讨论.下一步工作将结合工作流变更中的资源分配状况变更、组织状况变更及数据流变更作进一步的深入研究。
一个工作流模型,其正确性、有效性以及性能效率等都是受人关注的.一个包含错误的工作流过程定义有可能会导致顾客的不满、处理出错等一系列问题;而定义的瑕疵则可能会引发服务效率低、存储容量超额等.所以,在工作流模型投入使用之前,对其定义进行分析是必须的.通常,把对工作流过程定义的分析划分成两种:一种是分析模型能否达到预设的性能要求;另外一种是验证模型是否满足需求,流程定义是否正确.前者一般通过系统仿真技术
人力资源作为工作流中任务的参与者和执行者,对工作流的运行起到举足轻重的作用,因此,"什么人做"这个问题一直以来都是非常值得关注的研究方向,而资源分配恰恰是为了解决这个问题而存在的.本文将从一个新的角度对传统的资源分配策略进行扩展,使其更趋于人性化和合理化。
面对快速变化的市场需求,基于Internet的企业经营活动必须以动态和灵活的策略作为立足之计,同时流程的应用模式也由面向企业用户逐渐转向面向普通用户.这就要求业务经营活动不仅要基于固定特有的业务流程,还要基于能够适应多样需求变化的、动态灵活的业务流程.传统流程管理的研究主要侧重流程的定义、动态生成与修改方面,如动态工作流技术,基于Web服务组合的研究,基于Agent的流程建模的研究等.对流程的研究