基于知网的汉语词相似度计算

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sisu16113
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文主要利用知网知识库中丰富的语义信息,并将其转换成易于使用的语义关系网络形式,然后利用概念距离和统计信息的方法对汉语词的语义相似度进行计算.具体来说,该文主要对下面三方面进行了研究:1.知网(英文名称HowNet)是一个以汉语和英语的词所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库.该文研究了知网知识库系统的基本结构,并针对知网关系的网状表示结构进行了关系型数据库的转化.2.人们在信息处理的过程当中经常需要比较两上概念,这就需要对知识库中的概念的相似度进行量化.该文研究了语义层次网络的量化问题.通过构建知网的义原概念层次图,从而使知网的量化问题变得方便,并通过概念距离计算公式和统计信息方法的知网义原之间的语义相似度进行了计算.3.研究了汉语词的语义相似度计算的方法并将其应用到问答系统当中.通过利用知网的语义概念关系网络所提供的丰富的语义信息,并利用节点集合概念距离计算方法,计算了基于知网的汉语词语义相似度并对其进行了分析评价.
其他文献
该文围绕解决网络信息安全问题的PKI技术展开,对PKI领域内的技术进行了分析和研究,并实际开发了一个基于公钥密码技术的能够提供较为完整信息安全服务的认证管理服务软件系统
应用服务器(ApplicationServer)是分布式网络环境下,为应用提供企业资源集成、事务处理、业务组件管理和部署等基础服务的支撑平台,其技术发展十分迅速,国际上已制定了一批相
概率主题模型如latent Dirichlet allocation(LDA)已经成为数据挖掘和机器学习领域一类标准的建模工具。这些模型已经被广泛应用于不同领域、数据集、情境以及任务中,并且取得
Recently, the phenomenon of "software aging", one in which the performance of a software system gradually degrades with time and even finally leads to the whole
Internet技术的广泛应用和飞速发展,极大地改变了分布式系统的应用范围和规模,Publish/Subscribe通讯模型能够很好地适应部署在Internet上的大规模应用系统松散通讯和管理的需要
该文在分析比较国内外高校各种数字校园建设方案的基础上,围绕GIS在数字校园环境下的应用需求,设计了一种新的适合于数字校园的WebGIS模型并加以实现.该WebGIS模型的主要特点
该文在研究国内外已有的企业建模方法的基础上,针对这些方法的不足,提出了一套面向过程的多视图集成的企业建模方法.该文中详细介绍了集成化企业建模中过程、功能、组织、资
移动代理在通信网管理、智能网技术、Internet上的智能信息检索以及分布计算等领域有着很好的应用前景. 移动代理的安全问题可分为下列三个子问题: (1 )传输过程中移动代理受
近年来,片上多核结构正成为处理器设计主流。与同构多核处理器相比,异构多核处理器在特定应用中可以获得更高的性能提升和更好的能效性,然而异构多核处理器的指令系统互不兼容给
该文首先介绍了并行程序监测的发展现状,并行程序在实际应用中的重要性;分析了目前进行并行程序调试过程中所存在问题和困难,以及解决这些困难对并行程序开发具有的重要意义.