基于XML的树型结构编码及结构相似性匹配方法

来源 :东北师范大学 | 被引量 : 5次 | 上传用户：kftgb1221

【摘要】

：

随着Internet的快速发展,网上的数据量不断增加,人们对网上信息的应用需求也不断提高。但是传统的Web信息查询大多数是基于HTML语言的,由于HTML在语义表示方面上存在一定的缺

【作者】

：

郑伟

【机构】

：

东北师范大学

【出处】

：

东北师范大学

【发表日期】

：

2006年01期

【关键词】

：

XML 结构相似性结点编码匹配度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的快速发展,网上的数据量不断增加,人们对网上信息的应用需求也不断提高。但是传统的Web信息查询大多数是基于HTML语言的,由于HTML在语义表示方面上存在一定的缺陷,导致了XML及相关技术的快速发展。如何对基于XML文档数据快速地、有效地、全面地进行信息搜索,并进一步挖掘结构及语义信息,成为人们急需解决的课题。本文针对这一问题,提出了一种对基于XML文档的树型结构进行编码的方法,采用编码形式对数据源进行信息查询,并对查询结果进行结构相似性匹配,按照用户需求检索出用户所需要的信息。为此,本文作者从以下几个方面进行研究和探讨:首先,本文介绍了XML检索技术的发展现状,对信息检索技术的各种方法进行了回顾,简述了对基于XML文档的树型结构进行匹配的基本原理与分类。其次,本文在分析了查询过程中的两类查询方法后,提出了一种查询方法,在保持了XML文档树型结构的基础上进行索引标记(也就是进行编码),然后进行结点查询,将满足匹配原则的结点析出,从而保持结点间的结构关系,通过文中给出的匹配度计算公式计算其匹配度,将满足用户需求的结果反馈给用户。然后,本文通过举例分析说明了本方法的特点:1.当数据源发生变化时,可减少重新扫描的数据量;2.查询过程中,可以使用户清楚地了解到每一步结点信息的查询情况;3.本文的查询方法是在查询有效结点的基础上进行结构相似性的匹配,也就是在保证查找出用户需求信息的基础上,对这些信息的结构进行匹配,所以本方法保证了一定的查准率和查全率。最后,本文还对树的拓扑、子树的查询与树的剪枝等问题进行了探讨,以实现智能化信息检索。

其他文献

大尺寸Ba<,1-x>Sr<,x>TiO<,3>基铁电陶瓷薄板的制备与性能研究

移相器是相控阵雷达天线的基本单元,铁电移相器以其众多相对于其它移相器的优势,成为研究的热点。许多国家投入了大量的人力和物力进行此项研究,而我国在此项目上起步较晚。本项目是在国家自然科学基金资助项目“高性能复合铁电体材料”的资助下,主要研究(Ba1-xSrx)TiO3(以下简称BST)+MgO铁电材料的性能及大尺寸陶瓷薄板的制备。本文的主要研究内容包括:选择合适的Ba1-xSrxTO3(0

学位

钛酸锶钡相控阵雷达铁电材料可调性介电常数

Enterobacter sp.Px6-4阿魏酸脱羧酶的基因克隆、表达、晶体结构解析和催化机制研究

本研究以具有转化阿魏酸生成香兰素能力的细菌Enterbacter sp.Px6-4为出发菌株,通过设计简并引物和染色体步移(Genome Walking)技术克隆获得了阿魏酸脱羧酶(FADase)的全长编

学位

阿魏酸4-乙烯基愈创木酚香兰素阿魏酸脱羧酶酶学性质基因克隆晶体结构解析定点突变

浅谈作文教学与创新能力的培养

创新的时代需要创新的人才，创新的人才需要创新的教育。我们今天的教育要立足于培养学生适应发展，驾驭未来的能力。因此，作为基础学科的语文教育，我们应该重视培养学生的创新能力

期刊

作文教学创新能力培养

节肢动物miRNA演化与低等六足动物的系统发生

学位

如何培养学生的自主学习能力

叶圣陶先生一贯主张：“在课堂里教语文，最终的目的在达到‘不需要教’，使学生养成这样一种能力，不待老师教，自己能阅读。”（叶圣陶《国文教学的两个基本点》）这里强调的是学生自学能

期刊

初中语文自主学习

模拟气候变化对哀牢山中山湿性常绿阔叶林土壤氮矿化的影响

高海拔森林生态系统由于其温度敏感性,全球变暖将深刻影响高海拔森林对高土壤氮库的保持能力。本研究通过将哀牢山中山湿性常绿阔叶林土壤移植到低海拔的方法初步探讨了未来

学位

森林土壤土壤氮矿化树脂芯法常绿阔叶林森林生态系统

在人类胚胎干细胞中建立基于CRISPR-Cas9系统的可诱导的基因筛选和基因调控平台

从早期胚胎分离出来的人类胚胎干细胞具有自我更新、快速增殖及分化成全部成体细胞类型的能力。对人类胚胎干细胞进行基因编辑和研究人类胚胎干细胞中转录调控网络对于了解胚

学位

CRISPR-Cas9系统人类胚胎干细胞基因筛选转录调控

视频标准H.264熵解码技术研究

二十世纪九十年代,伴随着第三次科技革命的浪潮的兴起,信息技术和计算机互联网技术得到了飞速的发展,人类迈入了数字信息的时代,多媒体技术成为人们关注的热点之一。多媒体技

学位

H.264/AVC视频编解码熵编码CAVLCCABAC

三工河流域土地开发利用中的无机碳汇强度模拟

陆地生态系统碳平衡在全球变化中起着至关重要的作用，土地利用变化是人类活动影响生态系统碳循环的直接因素之一。因此，在全球变化背景下，认识人为活动作用引起的碳源汇效应是增

学位

土地开发利用生态系统无机碳汇强度节水灌溉

PCC处谐波源分离技术的研究

近年来随着电力电子技术的发展,电网中的谐波污染越来越严重,为了保证供电系统的安全经济运行,必须控制电网谐波含量。尽管各国颁发的有关控制和限制电力系统谐波的标准早在十多年前已经开始实施,但是由于电力系统的谐波来源有多个方面,PCC处的谐波源分离问题至今还没有得到有效的解决,从而使得有关谐波的标准实际上尚未得到有效地实施。本文首先对各种谐波源分离方法的基本原理作了探讨和比较,对各种方法的特点进

学位

谐波源分离谐波检测非线性负载在线寻零迭代法

基于XML的树型结构编码及结构相似性匹配方法

与本文相关的学术论文