基于领域本体的概念相关度研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ontheroad2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
步入信息化时代,中文信息处理成了重要研究领域。中文信息存在错综复杂的关系,相关是对多种关系的总称,范指任意两个对象之间存在的关联关系,相关度是对相关的定量表示。词语相关度计算应用广泛,在信息检索、语义扩展、文本分类、机器翻译等很多领域都有应用,是自然语言处理领域的重要技术。基于本体的相关度计算具有十分重要的意义。目前,针对词语相关度计算的研究很多,计算方法和算法也比较丰富,或是基于词语共同出现几率计算相关度,或是根据语义词典的相似度来得到相关度,或是基于维基百科层次结构计算相关度。这其中不乏比较经典和优秀的算法,但也存在着一些问题,例如,这些方法或是不能全面考虑词语语义,或是未语义概念间的关联关系的特性分析相关度。针对以上存在的问题,本文主要从以下几方面展开工作。(1)简要介绍了词语语义相关度计算的研究背景以及经典的研究方法,并根据经典计算方法挖掘影响相关度计算的因素。(2)深入研究领域本体的构建过程,构建面向儒学领域的本体实验片段,并将本体映射存储到关系数据库中的数据表。(3)挖掘本体概念的相关度包含相似度和关联度两部分,相似度基于领域本体中概念间的基本关系,提出并实现一个考虑语义距离、层次深度、公共祖先集以及本体之间基本关系的相似度计算公式。(4)阐述了本体间概念的关联关系,并给出关联度计算公式,并结合相似度计算公式得出相关度计算公式。(5)研究了本体概念间相关度计算在语义扩展中的应用,针对现存数据库检索系统中查询的问题,将基于相关度计算的语义扩展应用于图书馆古典文学检索系统。概念相关度计算广泛应用于自然语言处理中多项技术中,相关度能够在很大程度上反应概念词语间的关联程度,概念的关联程度适合于信息检索领域中进行语义扩展,通过扩展关键词的语义从而丰富检索语义,使搜素引擎明确查询目标,从而提高检索的查全率和查准率。
其他文献
近年来,中国铁路在客运提速方面取得了重大成就,铁路客流量每年在逐步增加,进行团体票预订的单位/个人也越来越多,另外随着互联网信息化技术的发展,使得原有的团体票办理监督
随着科技进步和安全方面的迫切需求,单样本人脸识别越来越得到学者们的高度重视,并成为人脸识别领域的一个非常重要的研究分支。针对单样本人脸识别问题,主流的方法可分为四
人类已经进入大数据时代,各类知识和信息纷繁复杂。如何存储和利用这些资源已成为研究的焦点。与此同时各个系统越来越复杂,矛盾问题也越来越多。而计算机和网络也发展迅猛,
文本分割是信息检索和多文档摘要技术中的一个重要的处理步骤。通常一篇文本是由多个主题构成的,文本分割的主要任务是通过对文档结构的分析,识别出文本中不同主题之间的边界
伴随经济全球化和贸易一体化的发展,我国与国外贸易交流日益频繁,各大银行陆续开展了外汇业务,对人民币、美元以及港币等纸币进行严格、有序、高效的流通管理非常必要。因此
无线传感器网络集传感器技术、嵌入式技术、无线通信网络技术于一体,在军用和民用领域中发挥着巨大的作用,受到越来越多的重视和研究。传感器网络中的节点一般采用电池供电,能量
作为被当前推荐系统最普遍采用并取得较大成功的推荐技术,协同过滤推荐技术根据目标用户(或项目)的访问数据或评价信息找到与其相似度较高的用户(或项目)作为最近邻居,然后根
无线胶囊内窥镜(Wireless Capsule Endoscopy, WCE)作为一种新型的胃肠道疾病检测技术,克服了传统的机械式内窥镜检查存在的缺陷,避免给患者带来身体上的痛苦,已经广泛应用在
无线传感器网络(WSN)是由大量传感器节点以自组织方式组成的一个监控系统,可以对目标区域的信息进行实时地监控和处理,应用十分广泛。对于大多数WSN来说,未知节点所感知的信
随着计算机仿真技术和硬件设备性能的不断提高,红外图像仿真技术能够很好的生成各种不同气象条件、不同时刻和季节下目标和背景的红外图像,近年来得到迅速发展,并获得了广泛