基于多粒度的关联数据语义相似度计算方法研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:spflying2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义网力求解决数据信息的语义化描述问题,构建一个充满结构化、语义化、智能化数据信息的网络资源环境,以期能被计算机理解与自动化处理,实现人与计算机的交流。关联数据被认作是语义网的最佳实践,语义网实现的核心技术。它通过对实体的语义化描述,在数据之间构建语义关联链接,实现数据之间相互联系、相互关联,推动着关联数据网络的建设。关联数据的特性使其在知识发现领域体现出了无可比拟的优势和潜力。关联数据为知识发现提供了新技术和新的资源环境,知识发现为关联数据的发展提供了新的发展目标和研究方向,因此基于关联数据的知识发现成为了语义网领域的热点研究方向。随着关联数据技术的发展和广泛应用,关联数据呈现出爆发性增长的趋势,为避免出现信息过载的问题,提高从海量的关联数据资源中发现新颖有效的知识的效率,基于关联数据的知识发现研究中的语义相似度计算成为了一个重要的科研方向。本文针对此问题,进行了基于多粒度的关联数据语义相似度计算方法研究。本文首先分析了关联数据语义相似度计算的研究现状,对国内外提出的语义相似度计算方法进行归纳总结,分析了这些方法的计算思想、函数模型、适用性和优缺点。通过对关联数据的内容结构描述特征分析,提出了多粒度的关联数据信息描述模型,阐述了粗、中、细三种粒度的关联数据信息描述内容。在多粒度的关联数据信息描述模型的基础上,详细分析了关联数据语义相似度计算的影响因素,分别为:实体属性关系、属性取值类型、属性重要程度、实体间关联距离和实体间链接路径。然后提出了基于多粒度的关联数据语义相似度计算方法。在该方法中将关联数据语义相似度计算过程分为三个计算模块,分别为粗粒度描述模块、中粒度描述模块和细粒度描述模块,并针对每个模块的特点及内容提出了与之相应的语义相似度计算方法,根据语义相似度计算的不同目的,提出了面向关联数据实例对和面向相似关联数据集的语义相似度计算流程。最后,使用Linked Movie DataBase关联数据集对本文提出的方法进行实验验证,并对实验结果进行了分析,实验分析结果表明本文方法具有较好的适用性、准确性和稳定性。
其他文献
1949—1950年的屯溪当代徽商,就是践行中国人民政治协商会议共同纲领,努力发展新民主主义经济,并为此作出重要贡献的徽商。1949年5月屯溪市人民政府成立,屯溪转型为新民主主
目的探讨口服产气剂对治疗植物性胃石的临床疗效。方法口服青岛东风化工厂生产的医用硫酸钡配套产气剂同时口服小苏打,多体位活动。结果18例植物性胃石患者口服产气剂及小苏打
网络自我互动是网络思想政治教育主体间性的新话题。从网络思想政治教育主体间性的视角探究网络自我互动的内涵、本质、特征等相关内容,这无疑为研究网络思想政治教育主体间性
根据很多数据都是记录型数据,设计实现了一个记录集类,并实现记录集中记录及其的读写和增删满足了记录集的基本操作需求。
计算机公共课作为非计算机专业本科学生的公共基础课程核心之一,在教学组织、教学内容、教学方法、实践环节等方面还存在很多亟待解决的问题。针对目前存在的问题,结合相关的
据国外媒体报道,尼古拉斯·尼葛洛庞帝曾在三年前将“每个儿童一台笔记本电脑”(以下简称“OLPC”)概念首次带上TED(科技、创新与设计)大会的舞台,他当时曾表示,所有人都认为这
用VFP编写完整的应用程序时,查询系统往往是程序设计时不可缺少的重要部分。在VFP中经常使用其内置Select—SQL查询,不仅因为Select-SQL查询的运行效率非常之快,而且它与SQL Ser
全球工业水平的发展,化工产品——尤其是工业烯烃的生产能力已经成为判断一个国家工业水平的重要指标。近十年中国的化工行业取得了巨大的发展,这和中国经济在全球经济不断向
结合木马入侵的特征、实现途径等,有针对性地提出应对措施,以确保网络安全、稳定运行。
社区文化对社区发展有积极的促进作用,成熟的社区管理必然包含社区文化的'软作用'。社区文化在新型社区管理中的现实功能包括整合社区成员观念和协调个体行为,提升社