基于框架核心语义依存图的句子相似度计算研究

来源 :山西大学 | 被引量 : 13次 | 上传用户:weiwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句子相似度计算在自然语言处理领域中占有基础而重要的地位。提高句子相似度计算的准确率对于提高自动问答,信息检索,机器翻译等系统的效率起到重要作用。本文在分析了国内外研究现状的基础上,以汉语框架网为基础,提出用框架语义依存图模型来表示一个句子的框架语义信息,并以框架语义依存图的相似度为依据来计算两个句子的语义相似度。同时,通过对框架元素进行多词块标注来提取框架元素的语义核心词,从而把框架语义依存图转化为框架核心语义依存图。具体来说,本文的工作主要包括:依据英语核心依存图给出了汉语框架语义依存图模型。它是基于汉语框架网对汉语句子核心语义结构的一种形式化表示。提取一个句子的框架语义依存图就意味着抽取了这个句子的基于框架网的语义骨架。在建立了汉语框架网络和依存图的数学模型的基础上,给出了汉语框架网上的语义度量方法。为了计算句子语义相似度,分别计算了依存图相似度和外围成分相似度,最后以它们的凸组合作为两个句子的相似度。同时,提出了度量一个相似度计算算法好坏的区分度的概念;为了计算一个框架元素在一个框架中的重要程度,本文给出了框架元素对框架的支持度的概念。实验表明基于框架依存图的句子相似度计算理论比基于HowNet的正确率有15%的提高。提出了基于多词块标注的框架元素语义核心词识别和提取方法,通过对比分析,给出了多词块和框架元素的融合策略,并建立了在多词块标注基础上提取框架元素语义核心词的规则集。基于6771个框架元素上的实验结果显示,采用本文的方法和规则集提取框架元素核心词的平均准确率和覆盖率分别为95.58%和82.91%;在框架核心语义依存图上计算句子的相似度比在框架语义依存图上计算的准确率和召回率分别提高了1.33%和2.2%。
其他文献
强作业型七功能水下机械手是水下机器人不可或缺的通用水下作业工具。随着对海洋的探索加快,对其需求量将越来越大。我国在强作业型七功能水下机械手的研究上与世界先进水平存
化工模型是实现化工过程的精细化控制与参数优化的基础。研究人员在处理实际化工过程时,通过过程对象分析和数据采样,获取对象的机理信息和样本信息,建立化工过程的模型,用于过程
随着计算机网络技术和传感器技术的飞速发展,控制技术也从传统方式发展到了网络控制方式。因网络控制具有系统布线少、易于扩展、实现成本低和能够实现远程控制等优点,受到了
随着如今经济全球化深入发展,信息化不断融入经济社会各领域,制造业也在向全球化、精益化、协同化、绿色化和智能化方向发展,这些改变正在深刻地影响着人们的生产、生活方式、经
异步电机是完成机电能量转换的主要装置,在现代电力系统中占据着十分重要地位。从电机使用过程中发现,随着电机运行时间延长,其轻微故障很可能导致整个电力系统出现不良现象。因此,诊断电机早期故障对保证电力系统安全正常运行具有重要意义。由于定子电流具有易于采集、受污染小、及可实现在线监测等优势,目前,普遍都是基于此信号进行电机故障检测技术研究。考虑电机转子本身设计缺陷及拖动负荷运行,使其出现故障的几率占电机
随着经济的高速发展、城市化进程加快和汽车数量急剧增长,导致交通拥挤、事故频发、环境恶化和能源紧张等日益加剧的问题,从而产生了运用信息技术手段来解决上述问题的智能交通
自从1984年美国建成世界上第一座智能建筑,世界各国纷纷效仿,智能建筑迅速在世界各地展开。随着工业控制技术、通信技术、网络技术的发展以及社会信息化的需要,资源共享在智能建
双离合器自动变速器是当前的车辆变速器领域所关注的焦点,自丰开发具有知识产权的双离合器自动变速器,研究双离合器自动变速器的核心技术,掌握其关键技术对促进我国汽车产业发展
家居智能控制已成为自动化领域发展的一个热点,通过以太网对家居设备进行远程控制,这对现实生活有着十分重要的意义。  本设计的硬件部分采用S3C2410(ARM9内核)微处理器为核心
移动机器人在室内的运动和导航问题是当前一个研究热点,它与移动机器人的视觉伺服技术是紧密相关的。经典视觉伺服技术主要以工业机器人为研究对象,由于车轮的纯滚动无滑动的运