基于HNC的汉语句子相似度算法的研究

来源 :江苏大学 | 被引量 : 20次 | 上传用户:yisheng8585
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文在词语相似度计算的基础上重点研究了中文信息处理中的句子相似度。首先,比较了词语相似度计算的不同方法,实现了目前效果较好的基于HNC的词语相似度计算方法;其次,提出了基于HNC判断同义词和反义词的方法,简化了词语相似度计算,并用计算机实现;然后,在词语相似度计算的基础上,针对目前句子相似度计算方法中存在的没有考虑句子结构,词语在句子中出现的重要程度,词语在句子中所起的作用等方面的不足,提出了基于HNC语义块的句子相似度计算方法。最后,结合主观题自动批阅,给出了句子相似度计算方法的应用实例,应用实践表明本文所提出方法在逻辑错误判断,语义理解方面比目前现有的句子相似度的方法更接近人为判断结果,更易实现,操作更简单。具体来讲:本文在句子相似度计算的研究过程中,所做的主要工作及取得的主要成果如下:(1)比较分析了词语相似度计算的各种方法,实现了基于HNC的词语相似度计算方法,为下一步句子相似度的计算打下基础。(2)提出了一种基于HNC同义词和反义词判别方法。通过词对出现的规则来判断是否是同义词反义词,由于引入了语义,简化了词语相似度的计算。(3)在词语相似度的基础上,提出了基于HNC语义块的句子相似度计算方法。该方法充分考虑了语句中各个词语在语句中所处的位置以及所起的作用。(4)把基于HNC语义块的句子相似度的计算方法用于成语解释的自动批阅中,通过老师人工批阅和计算机批阅的学生得分情况对比表明本文所提出的句子相似度计算方法的实用性和有效性。
其他文献
盾构技术是集液压、制造、控制、测量技术等多学科交叉为一体的现代掘进技术,因其速度快、自动化程度高、对地面建筑影响小,有利于保护环境,已成为交通运输、地下工程、矿山
现场总线技术广泛应用于当前工业生产的各个领域,随着工业控制系统的开放化和网络化的发展趋势,工业以太网技术凭借着其向下能与现有的总线技术通讯,向上能与商用因特网交互的特
近年来,随着计算机科学技术的飞速发展,分数阶微积分的计算和实现成为可行,并被逐步应用到各个工程领域。同时,随着分数阶微积分理论在实际控制系统中越来越广泛的应用,分数
军事信息系统是作战指挥的主要工具和平台,是现代战争军队战斗力的倍增器。“烟囱式”C4ISR系统缺少将综合战场信息转化为相互识别信息的能力,不能有效实现多个子系统之间的互
异步电动机是一个高阶的、多变量、强耦合、且参数不确定的非线性系统。随着电力电子技术和控制技术的飞速发展,从最初的矢量控制技术,到直接转矩控制、反馈线性化,再到反步法、智能控制、无源性控制等,异步电动机传动系统已经可以获得和直流电动机相似的高静动态性能,异步电动机已经可以和直流电机相媲美。最近,基于能量成形的端口受控哈密顿系统(PCH)控制已经引起了广大电机控制专家的重视。本文把异步电动机看成两个端
本文以提高控制系统模型参数估计(辨识)的精度和速度为目标,研究了受干扰线性系统的高性能参数估计方法,提出了一种基于矩阵降秩近似技术的改进型递推经验频域最优参数估计算
随着人们涉猎的领域信息集成度和复杂度的逐渐增多,对描述问题和解决问题的需求也逐渐增加。切换混杂系统是一类用来描述复杂系统的非常有效的数学模型,它是由一系列子系统以
植物生理参数如植物茎秆直径,叶片面积,叶片倾角,叶片尖端位置的连续监测对于研究植物的生理生态学具有重要的意义。现有的生理生态测量仪器大多还基于机械和物理传感器。许
随着我国城市化进程的加快,城市人口的不断增加,作为市民出行主要交通工.具的公共交通系统的压力不断增大。因此,基于计算机视觉的智能交通系统的重要性日益显著。利用图像处
电力系统的结构中发电机组运行与电网功率频率调控是两个相对独立的控制目标,各有一套针对自身的优化指标。发电机组以汽轮机和锅炉的调节特性为基础,以机组自身安全稳定运行