基于XML文档结构语义的信息检索方法与应用研究

来源 :华北电力大学(河北) | 被引量 : 3次 | 上传用户:LALOVE
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电力信息化的发展,不同的供电企业都建立了各自的管理信息系统,在实际应用中积累了大量数据,研究从海量的不同电力企业信息中快速而灵活地查询数据信息有利于信息资源的充分利用和管理人员的决策。本文对XML索引技术、XML结构语义检索技术、变电设备信息CIM模型及其XML表示、基于XML的变电设备信息检索、家族变压器状态变化规律进行了深入的研究,主要的研究成果如下:1.提出了一种新的XML索引结构,包括倒排元素标签索引(ETI)、倒排元素值索引(ECI)及结点层次-路径索引(NLPI)。该索引结构既考虑了XML文档的文本内容信息,又考虑了其结构信息,此外还适合于XML结构语义检索算法的实现。2.进一步研究和扩展了XML结构语义概念,提出了多个结点语义相关判断时具有的规律,并加以证明,为XML结构语义检索算法的研究提供理论基础。在此基础上提出了一种新的基于“标签—关键词”查询的XML结构语义搜索算法。该算法在判断多个结点间的语义相关时避免了大量的结点对相连关系的判断,大大提高了检索速度。3.提出基于CIM标准的变电设备信息模型及变电设备信息XML数据规范,分析了基于XML的变电设备信息检索系统各组成部分及其关键技术。基于CIM标准可以使变电设备信息XML文档与电力行业其它符合CIM标准的信息模型兼容;有了变电设备信息的XML数据规范,可以使不同供电企业异构的变电设备信息数据遵循XML数据规范,有相同的语义,有利于提高XML搜索引擎的检索效率。4.首次提出应用聚类分析方法研究变压器家族状态变化的规律,以确定变压器状态评估中家族质量缺陷对变压器状态的影响。提出了基于值距离和曲线斜率距离的凝聚层次聚类算法,用于变压器家族状态变化规律的聚类分析。实例分析表明,本文的算法优于传统的凝聚层次聚类算法。提出根据家族状态变化规律确定家族质量缺陷的影响分值,给出了家族质量缺陷影响的评分方法。利用本文的聚类结果对同一家族另外一台变压器的状态变化进行了预测,结果与实际相符,说明家族状态变化规律的研究对变压器状态综合评估、故障预测具有重要意义。
其他文献
三年前,当一大批适应年轻人休闲聚会的泡沫红茶坊如雨后春笋般在沪上开出后,近来,又开始走向弱势。随着报上渐渐多起来的茶坊转让广告,人们也确实发现,许多茶坊往往茶翁之意不在茶
期刊
珠算乘除的定位方法很多,问题是有的不够简炼,记忆困难,特别是初学的人,总感到算盘好打,数位难定。往往因定位弄错的不少,确实是普遍存在的一个问题。公式定位法,虽可算前盘上定位,也
2014年5月8-12日,华南发生了连续暴雨天气过程,为了探究回流暖区暴雨和锋前暖区暴雨的成因,加深这两类不同类型暴雨的认识,利用NCEP/,NCAR的1°×1°再分析资料
随着计算机技术的发展和数据测量技术的进步,逆向工程已经成为产品设计制造的一种重要手段。从测量数据重建出物体表面的曲面表示,并最终建立CAD模型是逆向工程的根本任务。
随着新课改的深入发展,“核心素养”的理念成为了素质教育的具体延伸。同时,初中英语具有很强的基础性和适用性,教师要紧跟现代教育趋势,坚持“立德树人”的教育原则,实施初
人体检测逐渐成为近年来计算机视觉和模式识别领域中的一个研究热点。其之所以备受关注,主要出于以下两个原因:1)虽然人体检测属于一般对象识别的一个特例,但是由于其问题本
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>长期以来,一个号称“四大血”的苗药组方在黔北、渝南、川南山区苗医中被广泛应用着,这种现象,使我们不能不深思:“四大血”体现的治法是什么?此种治法在苗医内治法站何种
会议