XML文档相似度计算方法研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:lkajdofaief
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准。随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点。XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术。XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度。本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评。
其他文献
信誉管理系统在促进顾客对电子零售商的信任过程中起着越来越重要的作用,它是电子零售商取得成功的重要因素和保证。顾客的文本评论是信誉管理系统的一个重要组成部分,其中蕴
[摘要] 目的 探讨胸腔镜肺叶切除术治疗老年非小细胞肺癌(NSCLC)的临床疗效以及影响患者术后生存率的相关因素。 方法 回顾性分析2007年1月~2011年1月接受肺叶切除术治疗的老年NSCLC患者72例,其中胸腔镜组39例,开胸手术组33例。比较两组患者术中清扫淋巴结数、引流管拔除天数、术后并发症发生率、术后住院天数以及术后3年生存率;Logistic分析影响胸腔镜组患者术后生存率的相关因素。
万国邮政联盟,简称万国邮联或邮联,成立于1874年10月9日,时称“邮政总联盟”,1878年改为现名。1948年成为联合国的一个专门机构。其宗旨是以邮联名义组成一个邮政领域以便互相交
智慧能源系统综合运用最新、最成熟的电力技术和标准,充分应用移动互联、人工智能等现代信息、通信技术,实现电力系统各环节万物互联、人机交互,实现绿色能源源网荷储协同运
古巴是国际标准化组织(ISO)的正式成员,2007年又成为国际电工委员会(IEC)的联系成员。目前,古巴是ISO/CASCO、COPOLCO、DEVCO、REMCO等委员会的成员,并积极参与138个技术委员会的活动
最近,美国宾厄姆顿大学、纽约州立大学科研人员设计成功一种微型生物太阳能电池,其能量密度和寿命均超当前所有同类电池.
期刊
情感倾向性分析旨在识别评论中隐含的情感信息,在产品声誉分析、舆情监控、个性推荐等方面具有广阔的应用前景。在评测消费者对新发布产品的态度时,本产品领域中可供参考的已分
目的:探讨ICU重型颅脑外伤患者的监测方法与护理措施。方法:回顾性分析我院收治的75例GSC≤8分的重型颅脑外伤患者的临床资料,总结监测和护理经验。结果:通过护士严密观察,细致