XML文档相似性的研究及其在软件构件聚类中的应用

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:gsice0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基于构件的软件开发技术的推广和深入发展,构件库已经在软件研究领域得到越来越多的关注。构件的查询是构件库的基本功能,利用聚类分析技术对构件进行聚类,可以实现构件的自动分类,有效地提高构件的查询效率。因为构件可以采用XML文档描述,而描述文档可以作为构件的标识,所以对构件的聚类可以转换为对其XML描述文档的聚类。因此对XML文档相似性和软件构件聚类进行研究具有非常重要的意义。XML文档是结构信息和语义信息的综合体,因此XML文档相似性的研究需要将结构信息和语义信息两者相结合。首先,XML文档中非叶子节点重复出现使得相似性计算复杂化,通过重复约简和嵌套约简消除非叶子节点的重复,使得XML文档结构简化;然后,分析XML文档特征,对前人提出的结构化递归模型作了扩展,利用元素间的有序嵌套来体现XML文档的结构信息,充分考虑标签、标签的权重以及叶子节点值及其权重,使用WordNet和自定义的相似字典SD来计算XML文档标签的语义信息,通过给出的公式计算叶子节点的相似性,依据其结构特点给出标签和叶子节点的权重;最后,给出XML相似性计算的层次递归算法。本文采用通用的刻面描述方案来描述构件,并以XML作为构件描述的标记语言。根据XML相似性的层次递归算法得到相似性矩阵,然后通过凝聚式层次聚类算法实现对构件描述文档的聚类。实验表明XML相似性的层次递归算法可以有效地计算XML文档之间的相似性,在此基础上的构件描述文档聚类能有效满足软件构件聚类的要求。
其他文献
近年来,随着因特网的发展和移动互联网的兴起,多模可移动终端不断普及,各种无线接入技术不断涌现,任何一种接入技术都不可完全取代其他接入技术完全满足用户的需求,因此下一
随着高性能计算集群技术的发展成熟,人们对集群系统整体性能的要求也越来越高。而存储系统性能成为提升集群系统性能的关键问题之一。而NFS作为-种成熟的、性价比较高的网络
智能授导系统ITS研究的重点在于增加远程网络教学系统的适应性和智能性。学生模型是ITS的基础和核心,是其他模块进行工作的前提。论文针对目前国内ITS中学生模型构建偏于简单
Internet是覆盖全球的信息基础设施之一,在当今世界发挥着巨大作用。随着互联网规模的快速增长,不可避免的出现了拥塞现象,造成业务质量指标下降和网络资源利用率低下等情况
为了提高列车故障检修效率,改变目前各铁路列检所落后的人工作业方式,本文开发了一种基于ZigBee技术的列车检修系统,设计了手持机的应用软件。列检系统由前端数据采集部分(手
信息网格的出现消除了信息系统面临的信息孤岛问题,实现了真正意义上的信息共享。然而,由于信息网格的异构性、动态性、用户和资源数量大等特点,它所要解决的安全问题也变得
随着江苏移动的企业邮箱业务的不断发展,基于WAP Push Mail业务的邮箱系统以其和手机的绑定功能在电子邮箱领域得到推广应用。与此同时,系统的用户数也在不断增长。因此,确保
绝缘子憎水性检测是判断绝缘子性能优劣的主要手段。目前憎水性现场测量主要是瑞典输电研究所的喷水分级法。它将绝缘子的憎水性分为HC1-HC7共7个等级。等级1(HC1)对应完全憎水
混沌神经网络具有混沌、分岔、吸引子等丰富的动力学特性,是可实现真实世界计算的智能信息处理系统之一,在人工智能、信息安全、智能搜索、最优化计算等领域具有重要的应用价值
动态地形多分辨率建模是虚拟环境建模技术中的重要研究内容之一,体现了实体与地形间的实时交互作用,在军事仿真、城市规划等领域有着广泛的应用需求。现有的动态地形实时绘制