RDF图的语义相似性度量方法研究

来源 :大连海事大学 | 被引量 : 2次 | 上传用户:gpi678c
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上数据的急剧增长,关键字检索的不足逐渐显现出来。关键字检索只能提供有限的结构化查询能力,丢失语义信息;此外,关键字检索不具备查询优化的能力,造成返回的检索结果数据量巨大。用户从互联网上获取所需信息的难度越来越大。对象级别信息检索可以有效地解决关键字检索的问题,它已经引起越来越多的关注和研究。对象级别信息检索以对象的观点来建模关系数据,直观的描述了信息的语义,检索结果不是仅包含关键字的文本信息而是包含完整实体信息的对象,容易被用户理解。为了实现对象级别信息检索,选择一种描述对象的工具是至关重要的,本文选用RDF来描述对象。RDF是W3C组织推荐的描述万维网上元数据的标准,因此越来越多的信息通过RDF图来描述。本文对主流的RDF图表示对象的语义相似性度量方法进行了研究,分析其优缺点,提出了SaS(Structure and Semantics)方法。SaS方法改进了Radow Oldakowski(RO方法)的RDF图语义相似度算法,反映了RDF图的结构信息;并结合改进的基于网络距离模型的语义距离公式和基于信息量模型的链接边权重度量方法来计算概念节点语义相似度,综合考虑了概念节点的深度、密度因素,有效区分了上述两种模型无法区分的概念节点,使语义相似性度量更加精确。为了验证SaS的有效性和可行性,本文设计并实现了应用于计算机程序员招聘领域的语义相似性度量原型系统。实验结果表明,SaS方法的查准率优于RO方法。
其他文献
随着我国经济的高速发展,人们的生活水平得到明显提高,汽车尤其是私家车的数量越来越多。汽车防盗随之成了人们热切关注的问题,汽车防盗报警设备的需求日益上升。但是经过分析发
随着计算机技术的发展和普及,人们的生产和生活都趋于信息化、自动化。各个公司都会采用适合自己业务的信息系统,这些信息系统潜在的指导着它们的日常业务,并详细的记录下这
随着人类基因组计划的完成,生物数据增长的速度非常快。传统的生物实验的方法在庞大的数据前显得十分乏力。如何快速而又准确的利用生物信息学方法准确,高效的从生物数据中挖
表面缺陷检测在工业生产中对产品质量可以起到有效的监督控制作用,磁性材料在加工过程中产生的表面刀纹缺陷严重影响着其质量,人工去检测这些缺陷效率会比较低,并且容易受到
互联网已成为现代社会最重要的信息基础设施和人们工作、生活的重要组成部分。目前互联网采用的是一种“尽力而为”的传统模式,但是这种模式无法满足多媒体应用和各种用户对网
由硅基材料制造的电子计算机的计算能力持续增长。然而当硅基微电子器件线宽低于10纳米后,计算能力增长遇到技术问题:电路板路线安排问题、晶体管集成技术等。为了克服硅基器
OLAP(On-LineAnalyticalProcessing,联机分析处理)是随着数据仓库技术出现的一种数据分析处理技术,它允许用户快速地从不同的角度和层次分析大量多维数据,主要用于决策支持。随着
基于模拟鸟群及鱼群觅食行为的粒子群优化算法自被提出之后便得到诸多领域内学者的研究。因其具有自组织、自学习、模型简单、容易实现等特点,粒子群优化算法已被广泛应用于工
无线传感器网络(Wireless Sensor Network; WSN)是由大量传感器节点以自组织和多跳的方式组成的网络,这些节点随机分布在被监测区域中,感知、采集和处理被监测区域内感知对象
移动互联网的发展和智能移动终端的普及带来了移动服务的大规模兴起,并改变了服务平台交互模式,为用户数据信息增添了新的维度,推动了社交化、本地化、移动化的三合一混合概