基于多策略概念相似度计算的本体匹配研究

来源 :南华大学 | 被引量 : 1次 | 上传用户:y123321y886
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,互联网上的数据呈爆发性地增长。为了更好的运用和共享这些知识,本体在存储和描述知识的优秀性能而被引入语义网。但另一方面本体在开发过程中具有主观性,加上互联网具有分布式的特点,即便是在构建同一个领域本体,不同组织和个人建立的本体也不尽相同,所以出现了在同一领域的本体也不尽相同,这就是所谓的本体异构现象。它们之间通常不能相互操作,不同用户之间也不能够相互理解。为了更加充分的利用这些本体来完成互联网上知识的集成和交流的任务,有必要找出这些本体之间的匹配关系,即使用本体匹配技术消除本体异构现象。本体匹配是解决不同本体之间交互式操作和寻找不同实体之间的匹配关系的重要技术,对实现不同本体的之间的交互非常重要。在大数据的今天,随着本体数量的增长,因此迫切需要一些方法能够自动或半自动地进行本体匹配任务,进一步改进本体匹配系统的匹配效果。单一的本体匹配方法考虑的仅是本体特定的元素,匹配效果不尽如意。本文采用从多个角度对本体进行本体匹配,利用复合匹配方式实现了本体匹配方法。本文主要包含以下内容:(1)对本体的名称进行概念相似度计算。对于给定的两个本体进行基于字符串公式和WordNet词典方法,并考虑到本体的注释信息也能确定本体是否相似,将其引入基于名称的概念相似度计算,综合加权求得最终的基于名称的概念相似度计算。(2)分别对基于属性、实例和结构进行概念相似度计算。利用和积算法对基于实例的概念相似度计算。通过对属性的筛选,简化计算基于属性的概念相似度。并采用基于结构的noisy-or模型进行相似度计算,并将三种算法的值综合加权,获得初始匹配。通过反复迭代得到最终匹配。(3)以所研究的算法为核心,对本文提出的方法进行实验。该实验采用OAEI提供的国际标准评测数据集和评价方法,实验表明该算法的良好性能,能够有效地提高查准率和查全率,并在匹配效率上取得了明显效果。
其他文献
随着定位技术、无线通信技术以及个人移动设备的发展,基于位置的服务(Location-based Service,LBS)已经广泛应用在生活的方方面面。位置服务提供商(Location Services Provid
随着互联网技术的发展,信息的指数级爆炸导致人们难以高效获得信息资源,自动文本摘要技术也因此得到了广泛的关注。与常见的单文档摘要问题不同,会议文本存在单人发言和多人
新加坡政府于2017年将提升学前教育质量问题列为三个攸关长远未来的问题之一。要解决这一问题,其中的关键是提升学前幼儿教师队伍的质量。建设一支师德高尚、精通业务的幼儿
野猪(Sus scrofa)属偶蹄目(Artiodactyla)猪科(Suidae)猪属,起源于东南亚,是有蹄类动物中分布范围最广的种类,对于生物多样性维持具有重要意义。历史气候事件,尤其是末次盛冰
随着国家战略的重视,医疗文本大量电子化,带来了丰富的原始数据。而面向医疗文本的实体抽取及概念标准化技术,作为知识抽取和利用的关键步骤,具有重要的研究意义。医疗实体的
本研究以东莞华晨外国语学校初中一个班38位学生为研究对象,探讨了两个不同投入量的输出任务——句子填空和句子翻译——对学生词汇习得的影响。本研究探讨的两个研究问题是:
内生真菌和腐生真菌通常在植物组织和凋亡植物材料中发挥着重要的生态功能。许多研究调查了内生菌和腐生菌之间的关系,提出了内生真菌在宿主组织衰老之后会成为腐生菌。本课
在20世纪后期,对教师“专业化”研究的探索在全世界许多国家达到了前所未有的高度。在英美等国家,对幼儿教师的课程决策方面的研究也越来越受到关注,教师被赋予了新的角色,在
电压门控钙离子通道(VGCCs)是位于细胞膜上的跨膜异源多聚体蛋白,至少由α1,β,αα2,δ亚基四个亚单位所组成,其中α1是介导钙离子跨膜内流、决定通道门控特性、药物和各种
内皮细胞是调节和维持机体体液平衡、炎症反应、血脑屏障的重要细胞屏障,主要通过改变细胞的通透性来控制血管和组织之间的物质交换和细胞浸润。内皮细胞通透性的调节对于心