基于LSPX模型的XML结构相似度计算与快速聚类

来源 :南开大学 | 被引量 : 0次 | 上传用户:airingyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今的信息时代,信息交互愈加频繁,XML已经成为信息表示和数据交换的标准。随着大量XML信息的出现,XML数据的处理也逐渐成为人们关注的焦点,由此衍生出XML数据处理的两大研究方向,XML数据挖掘与XML信息检索。在XML数据挖掘中,XML数据的结构聚类仍然是当前的主要研究任务,而在XML信息检索中,一个亟待解决的焦点问题是结构模糊查询与匹配。   虽然XML数据结构聚类与XML信息检索有着各自的研究内容和不同的实现目标,但是它们却都依赖于共同的研究基础,即良好的XML数据结构表示模型、基于模型的相似度计算,以及对XML数据结构的快速聚类等等。论文针对该基础问题进行研究与探讨,在总结和分析现有的XML数据表示模型和相似度计算方法的基础上,提出了一种新的XML数据结构表示模型——LSPX模型,并定义了其上的相似度计算方法,最后给出了一种快速的增量式聚类算法。   LSPX模型简洁、完整地表示了XML数据的结构信息。基于该模型的相似度计算,不仅很好地结合了语义信息,使计算结果更加准确;还将计算的粒度有效地扩展到聚类级别,省去了传统的“逐对”计算方式所导致的时间消耗,极大地缩短了整个聚类过程。基于LSPX模型的增量式聚类算法,在保证聚类结果质量的基础上,大大地提高了XML数据结构聚类的速度。实验结果表明,LSPX模型构造迅速,且基于该模型的聚类算法真正做到了XML数据结构聚类的快速、有效、实用。这些都为XML数据的后续处理和研究工作打下了良好而坚实的基础。
其他文献
学位
学位
无线传感器网络WSN(Wireless Sensor Networks)一般是由大量体积小,价格便宜,仅依靠电池供电的具有数据处理、传输以及存储和计算能力的专用传感器节点(Sensor Node)和功能相
智能算法是从自然界得到启发,模仿它的原理而得到的算法。智能算法自产生及发展以来,被广泛应用于解决大规模系统中出现的复杂问题,具有通用、简单、便于并行处理等优点,被认为是
复杂事件处理过程中,决策者需要大量知识作为支撑,如何有效获取知识是成功处理事件的关键,特别对于应急事件处理来说,由于其涉及跨领域的知识获取,如何有效组织、管理和利用
近些年来,国民经济的不断发展对电力系统提出了更高的要求。一方面,随着电网建设规模的不断扩大,系统安全运行面临的场景更加复杂;另一方面,用户需求的多样化和个性化也对电
机器人足球仿真比赛是一种通过计算机模拟的机器人足球比赛。由于其不受限于场地,设备以及资金的优点而成为了一个研究多种智能算法的理想平台并吸引了世界各地的专家学者的参
随着图像镶嵌技术的发展,人们对图像镶嵌算法有了广泛的研究。在研究过程中,我们面临的一个主要问题就是如何解决好镶嵌图像的拼接缝问题。因此为了获得色调一致的镶嵌图像,有必
随着Internet的快速发展,XML已经成为Web数据表示和交换的事实上标准,越来越多的信息处理系统采用XML文档作为信息存储,交换和发布的载体,XML类型的数据已成为当前主流的数据形式
人脸检测和目标跟踪是机器视觉领域一个非常活跃的课题,许多国内外专家学者对其进行了深入的研究,研究出了很多有价值的算法。本论文首先对人脸检测和目标跟踪的国内外研究进行