基于WordNet的概念语义相似度计算及其应用研究

来源 :曲阜师范大学 | 被引量 : 0次 | 上传用户:vitor330
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术、人工智能的不断发展,人们越来越依赖于从网络途径获取所需信息,网络中的信息也越来越繁杂。相似度计算作为自然语言处理领域的关键技术,能够对信息进行过滤和筛选,从而得到用户想要的信息。要想提高信息检索质量,就要提高相似度计算的精确度。相似度计算包含概念语义相似度计算和句子相似度计算等。两种相似度算法精确度的提高对其应用领域的发展有着至关重要的影响。本文主要对概念语义相似度算法和句子相似度算法进行了详细研究,提出了基于WordNet的概念语义相似度MICS模型,并将其应用到句子相似度计算之中。通过测试验证了MICS模型具有较好的性能,提高了相似度计算的精确度。具体工作如下:1.阐述了相似度算法的研究背景及意义,探讨了本研究的基础性和必要性,并概括总结了概念语义相似度算法和句子相似度算法的研究进展。2.介绍了WordNet语义词典的相关内容。重点介绍了WordNet的发展状况、内容结构以及其中包含的语义关系。简要说明了本文采用的WordNet版本和结构。3.重点剖析了常用的概念语义相似度算法,根据各个算法的优势和不足提出了MICS模型。该模型以IC(信息内容)模型为基础,利用相邻概念之间的条件概率对边进行加权,用互信息表征概念之间的语义相似度。算法同时将概念在层次树中的密度、深度以及路径因素考虑在内,并结合了传统的基于信息内容IC的算法和基于路径因素的算法。然后对MICS模型进行了测试与分析,验证了该模型具有更好的性能。4.对句子相似度计算步骤以及常见的句子相似度算法进行了详细地分析,在此基础上,将MICS模型应用到句子相似度的计算中。经过测试对比验证了MICS模型具有良好性能。5.认真分析了本文不足之处以及需要解决的问题,对今后的研究工作进行了展望。
其他文献
针对传统方法缺少融合滤波处理过程,导致监控预警图像几何特征提取不及时的问题,提出夜视红外激光社区视频异动监控预警模型优化.硬件模块包括传感器模块、时钟终端控制模块
利用激光位移传感器对搭建木材上料实验台进行三轴定位精度检测,通过分析结果计算出误差差值.然后利用最小二乘法进行拟合误差曲线,借助MATLAB软件来数值分析.将误差补偿曲线
焊接裂缝定位工作量大,且定位精度不高,为此设计基于激光视觉的焊接裂缝自动定位系统。激光视觉传感模块中,焊接对象表面接收激光器发射的特定频率激光条纹后,与表面特征调制形成独有的激光条纹,同时,激光图像采集卡将CCD摄像机采集的激光图像信号转换为计算机可识别信号。在此基础上基于Steger算法提取激光条纹中心、采用Hough变换法提取激光条纹中心直线。根据激光条纹位置采用焊缝自动跟踪控制单元计算焊接裂
自杀是文学中一个常见的主题,然而在19世纪到20世纪的女性文学中,自杀作为一种叙事策略实现了功能上的转变.本文以自白派女诗人西尔维娅·普拉斯唯一一部小说,被称为“女版”
20世纪90年代以陈染为代表,女性文学进入了个人化写作阶段.陈染小说表达的是在父权制之下被忽略的女性生存经历和心理体验.而她笔下父亲母亲形象的颠覆性突破为文学史掀开一
叶广芩的中篇小说看似平朴,却内涵醇厚,所以经得起品味.小说讲述了一个叫莫姜的破了相的中年女子在叶家帮厨20年里的零星故事.说故事的人语气平淡无奇,看故事的却在这表述里
因果报应思想在中国古代文化中根深蒂固地存在着,其中“淫人妻女者,妻女必被人淫”就是对人们性道德的教化与劝诫.这种思想在古今文学作品中多有呈现,明代作家冯梦龙讲述了这
在当代文学史上的合法性地位并不取决于文本自身的文学性,而取决于文学生产过程中权力话语的干预和在一定历史语境中大众媒体的推波助澜,以及读者的接受心理和期待,从而导致
期刊
当前激光数据采集处理系统信噪比较低、系统响应延迟长,提出并设计基于DSP的海量激光超声数据采集与处理系统.首先指出激光超声数据采集处理结构框架,主要由检测和激光探测模