XML柔性查询技术的研究

来源 :东北大学 | 被引量 : 1次 | 上传用户:lang_yin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着World Wide Web的迅速发展,半结构数据得到了广泛的关注,进而XML成为Web上交换信息和整合数据资源的事实上的标准。XML作为一种数据格式与其他文档格式的区别在于除了有内容信息之外,XML还有结构信息。当检索XML文档的时候,由于大多数普通用户对XML文档的结构和内容信息不够了解,从而频繁地获得空查询结果,不得不多次修改查询表达式。为了避免这种空查询结果问题,提出了查询松弛方法。查询松弛的基本思想是减少原始查询的约束进而扩大查询的范围,为用户返回更多相关的查询结果。在松弛原始查询之后,用户将面对的另一个问题是系统通常为用户返回很多的查询结果。为了处理多查询结果问题,本文使用有效的排序方法对查询结果进行排序。此外,在查询XML文档的时候用户经常有模糊的或者不精确的查询要求。用户更加喜欢使用模糊词或者模糊关系表达其模糊查询意图,此时如何扩展查询系统并让查询系统能够满足用户的模糊查询要求是一个重要的问题。因此,对XML的查询语言进行柔性扩展,并给系统提供柔性查询能力,能够提高用户与系统之间的交互性。近年来,大量的研究工作致力于XML数据库柔性查询技术的研究,研究的重点主要包括XML查询松弛、查询结果排序和模糊查询等研究领域。然而,在大多数查询松弛的研究工作中没有考虑用户偏好的作用,而在实际应用中查询松弛的效果能够极大地受到用户偏好的影响。为此,为了处理在查询XML数据库过程中出现的个性化查询和模糊查询问题,本文提出了有效的柔性查询技术满足用户的查询需求和偏好。主要的研究内容包括以下几个方面:(1)针对用户的个性化查询问题,提出了一种松弛上下文偏好的方法,即偏好查询的结果依赖于查询提交时的上下文条件。上下文可以表示成多维属性的集合形式。首先,提出了一种XML上下文偏好模型;然后,讨论了松弛上下文操作的方法,它可以松弛一个或者多个上下文属性而产生更多的上下文状态;进一步地,上下文偏好存储在一种特定的数据结构——兴趣树中;最后,通过在兴趣树中使用关联规则挖掘方法自动地获取上下文偏好的偏好程度。(2)为了解决在查询XML数据库过程中出现的空查询结果问题和多查询结果问题,提出了一种基于XML结构偏好松弛和内容偏好打分的查询结果排序方法。首先,提出了结构偏好的定义,由结构偏好生成所有可能的松弛查询;然后,用户可以在XML的属性节点上表达他们的兴趣,进而用户给他们感兴趣的属性节点分配兴趣度得分,并快速计算偏好得分;在此基础上,提出了一种偏好查询的结果排序方法,主要包括基于上下文状态的相似性合并聚类的聚类融合算法、找到有代表性聚类排列的算法和Top-k排序算法来处理多查询结果问题。(3)用户在查询XML文档的时候经常有模糊的或者不精确的查询要求。为了解决用户的模糊查询问题,提出了一种基于XML结构和内容的模糊查询扩展方法。首先,以模糊集理论为基础,提出了利用模糊谓词实现XPath查询表达式的模糊扩展方法;然后,基于代数操作,提出了一种新颖的模糊代数查询方法表达用户的模糊查询意图。该方法的目的是定义一个模糊代数操作的集合,能够支持XML模糊查询,模糊查询的结果能够满足用户提出的模糊查询条件;进一步地,提出了一种排序方法考虑隶属度和用户自定义查询权重之间的相关性;最后,提出了一种有效地计算模糊查询结果的Top-k答案的方法。(4)针对XML文档进行模糊查询过程中出现的空查询结果问题,提出了一种模糊查询松弛方法,该方法能够获得更多的满足用户模糊查询要求的查询结果。首先,可以将原始的模糊查询条件转换为一个精确的查询区间,该查询区间内的值都能够满足用户的模糊查询要求;然后,提出了一种基于扩展的向量空间模型,用于度量XML属性节点和模糊关系谓词之间的相关度;最后,提出了一种基于改进的PIR方法排序模糊查询结果,它考虑被模糊查询指定的属性节点和未被模糊查询指定的属性节点之间的相关性。
其他文献
怎样标注齿轮工作参数抚顺挖掘机厂研究所张复兴为了更好地贯彻执行六项互换性基础标准,我厂对原使用的齿轮工作图参数表图章进行撤换,按照新标准重刻新图章,供设计人员使用。现
<正>春季卡他性结膜炎是一种慢性复发性眼病,临床较为常见。祖国医学称为“痒若虫行”、“粟疮”和“痒极难忍”等。西药以激素类治疗为主,停药而复发,且易发生副作用。自198
当前,图形处理器(GPU)广泛应用在图形图像处理、科学计算、多媒体应用、数据挖掘、金融计算等众多科学和工程领域。GPU采用单指令多数据(SIMD)架构,非常适合规则的应用程序。但是,未
通过运动捕获技术对具有鲜明民族风格和地方特色的民族舞蹈进行数字化存储、共享和重用将为推动中国特色的动漫产业进一步发展发挥重要作用。随着种类繁多、风格各异的民族舞
黄侃先生指出:"训诂者,用语言解释语言之谓。""真正之训诂学,即以语言解释语言。初无时地之限域,且论其法式,明其义例,以求语言文字之系统与根源是也。"训诂学,它主要的就是
液压挖掘机产品造型和涂装抚顺市起重机总厂王宗君,刘东随着工业建设的发展和科学技术进步,液压挖掘机(以下简称挖掘机)由于新技术、新材料、新工艺的采用,得到了迅速发展。挖掘机
基于两步有限元方法和有重叠型区域分解方法,设计并分析了并行两步算法来解决定常不可压Navier-Stokes方程。两步法包含两个步骤:一是用较低阶元解决一个原问题,例如P_1b-P_1
目前,物联网工程存在多种问题,如用户隐私泄露问题、维护成本高、设备管理难度高等,为有效解决以上问题,需要运用区块链技术。基于此,本文对区块链的涵义、特点进行了深入分
本文通过对液压挖掘机回转油路进行动态分析,提出了设计选择挖掘机回转液压系统主要参数的方法,以达到在角加速度和回转力矩不超过允许值的情况下,尽可能使回转时间短的目的
近年来,各种学术会议、座谈会、研讨会等学术活动在全球范围内开展地越来越广泛,这类学术活动蕴含着海量的学术资源,包括参会者的信息、学术论文以及学术报告等。通过这些学