引入领域知识的词语语义相似度研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:jnyinli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义相似度是人工智能、信息检索、文本分类、机器翻译、词义排岐、自动问答和句法分析等领域的基本问题,有着广泛的应用,具有理论的研究价值和应用前景。词语相似度计算是句子、篇章等相似度计算的基础,在语义相似度计算中起着至关重要的作用。因此,本文介绍了目前国内外词语相似度计算的研究现状及具有代表性的计算方法。并针对目前词语相似度计算方法的不足之处,提出了引入领域知识的词语相似度计算方法,使具有“一词多义”的词语能根据所处的领域环境而具有不同的相似度,提高了词语相似度的精确性。本文的主要创新之处如下:1、提出一种基于领域知识的词语相似度计算方法。本文给出了敏感词集的概念并利用敏感词集,对待比较词进行词义排歧,解决了传统的词语相似度计算方法中没有考虑词语间相似度与领域知识相关的事实的缺点,使得“一词多义”词语在不同的领域知识下得到不同的相似度。实验结果证明了不同领域中相同词语的相似度是有差异的。因此,在选择了合适的敏感词集的情况下,能够得到与领域知识更相符的语义相似度。2、基于《知网》的词语相似度计算,优化了概念相似度计算方法。在概念相似度计算时,本文考虑《知网》中某些词语由于描述方式的差别而带来的计算误差,不区分第一基本义原和其他基本义原。同时,当关系义原或关系符号义原均为空时,将该部分相似度设为基本义原的相似度,这样可以减小计算过程中的误差。3、基于《知网》的词语相似度计算,提出一个引入义原位置结构的义原相似度计算方法。目前,义原相似度计算方法大都考虑了义原的语义距离、义原深度等对义原相似度的影响,但是从未考虑过义原的位置结构在相似度计算中的作用。本文从义原的组织结构上,将两义原的位置关系分为三类,并据此给出三种相应的计算方法。通过实验发现:两义原的位置结构越平衡,两义原的相似度就越大。本文的义原相似度计算方法提高了“具有相同语义距离但是结构不同”义原相似度的分辨率。
其他文献
全局光照对提升虚拟世界中场景的真实性至关重要。全局光照的离线渲染技术已经发展的非常成熟了,实时渲染技术在近几年也得到了快速的发展,尤其是在游戏领域发展。全局光照实时
目标跟踪作为计算机视觉领域的一个不断发展的研究方向,涉及了模式识别、人工智能、图像处理以及机器视觉等诸多领域相关技术。由于目标跟踪领域的不断研究,它在诸多领域得到
本论文研究的是航班着陆调度问题,即在满足安全着陆的约束条件下,对到达终端区,等待着陆的航班以一定优化目标进行合理调度,最终达到航班安全、高效降落的目的。该问题的解决不仅
近年来,因特网应用程序的性质、用户需求和使用模式的变化使得互联网显著地表现出自身的缺陷。NDN(Named Data Networking,NDN)是以内容为中心网络研究的杰出代表,其在安全性
随着云计算的迅速发展,越来越多的用户开始使用云计算平台的服务随着用户数据的逐渐增多,如何保证云计算平台资源能够安全高效的被用户所应用,也已经成为云计算平台安全研究方面
并行计算指在并行计算机上,将一个任务分解成多个子任务,然后将这些子任务分配给不同的处理器,每个处理器之间相互协同并行的执行子任务,从而达到加快任务求解速度,或者提高求解应
大数据应用系统发展如火如荼,从互联网、物联网获取数据,提炼成信息或知识服务于各类用户。网页、感知数据集、数据集、各类结构化数据、语义数据的查询搜索是所有应用系统的一
随着计算机图形图像处理技术的发展与成熟,开始出现了许多计算机辅助2D卡通动画制作的相关技术,这些技术大体可以分为两类:一类是在传统2D卡通动画的制作流程中,用计算机辅助某些
伴随计算机技术的发展,许多新思路、新技术不断介入传统信息管理领域,导致这些领域从数据的积聚到信息管理的形式等诸多方面发生了剧变。本文结合作者多年的具体的档案工作经验
由于生理信号在情感识别中的优势,基于生理信号的情感识别的研究成果已经在人机交互、教育、医疗护理等方面得到应用。用户依赖的情感识别系统已能达到令人满意的结果。然而,实