基于深层神经网络模型的浅层语义解析统计研究

来源 :暨南大学 | 被引量 : 2次 | 上传用户：liongliong533

【摘要】

：

语义分析是从非结构化的文本数据中识别出语义的形式化表示,并将其转化为结构化数据的过程。浅层语义解析是由语义分析分解出的、具有通用性的子任务构成。本文围绕如何有效

【作者】

：

张国校

【出处】

：

暨南大学

【发表日期】

：

2017年01期

【关键词】

：

浅层语义解析序列标注深层神经网络模型词向量模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语义分析是从非结构化的文本数据中识别出语义的形式化表示,并将其转化为结构化数据的过程。浅层语义解析是由语义分析分解出的、具有通用性的子任务构成。本文围绕如何有效地将非结构化的文本数据转化为结构化数据,依据子任务之间的内在关联性,将浅层语义解析作为一个整体,利用深层神经网络模型进行统计研究。第一,构建了一个理论分析框架。该框架包括三部分。首先,从四个层面对浅层语义解析的内涵进行研究,分三种情形将浅层语义解析统一形式化为序列标注问题,为依据内在关联性进行建模奠定必要条件。其次,以词的分布式假定和多维尺度分析为理论和方法依据,论证了三类词向量模型之间的内在统一性,为有效地利用词向量对浅层语义解析进行建模奠定理论基础。最后,从线性时不变系统理论出发,论证了卷积神经网络模型应用于浅层语义解析的适用性条件,分析研究了长短期记忆人工神经网络模型、注意力机制模型和全局优化机制的理论优势,在此基础上,提出一类适用于浅层语义解析的深层神经网络模型,结合多级标注语料库,对浅层语义解析的模型构建、模型选择以及模型识别等进行了系统性设计。针对模型的参数估计问题,推导出基本模型的梯度计算公式,证明了改进算法的收敛性。第二,从三个方面对分析框架进行了实证和应用研究。首先,利用大规模中文百科语料,对一类词向量模型的效果进行了评估,实证结果表明,在基于可类比性准则构建的测试总体上,模型的识别效果高达89.24%。其次,利用一个多级标注语料库,在对模型组件识别效果进行比较研究的基础上,以谓词-论元结构分析为例,对内在关联性在模型构建过程中的有效性进行了研究,并进一步和其他同类模型进行了比较研究。针对中文语料,和传统模型相比,当不依据内在关联性进行建模时,本文所提的深层神经网络模型在中文测试集上识别效果提升了11.18%;当依据内在关联性进行建模时,仅仅利用到词性分析和命名实体识别两个子任务,在不改变原模型结构的基础上,模型识别效果进一步提升了1.12%。针对英文语料,依据内在关联性构建的模型识别效果也显著优于其他同类模型。这些实证结果说明了利用深层神经网络模型对浅层语义解析进行系统性设计效果的显著性。最后,给出分析框架的两种适用情形,并利用东莞市政府服务热线工单验证了基于深层神经网络模型的浅层语义解析的实用性和有效性。

其他文献

直接甲醇燃料电池阳极铂基电催化剂的研究

直接甲醇燃料电池（DMFC）因具有能量密度高、环境友好、携带方便等优点成为当前非常有吸引力的移动能源转化装置之一,但其阳极催化剂的成本高、活性低、易被毒化、稳定性差等不

学位

直接甲醇燃料电池甲醇电氧化Pt基催化剂催化活性稳定性

太赫兹SAR成像运动补偿及成像算法研究

合成孔径雷达(Synthetic Aperture Radar,SAR)自上个世纪五十年代被提出以来,以其具有作用距离远、全天候全天时、可以获得二维高分辨图像等优势得到了快速发展,目前已经广泛

学位

太赫兹合成孔径雷达平台高频振动运动补偿

浅析百度竞价排名机制

从淘宝网的抵制、莆田系医院与百度的"分手"到血友病贴吧事件、魏则西事件,都与一个名词密不可分,这就是"百度竞价排名",而国家网信办、国家卫计委等联合调查组入驻百度更是

期刊

百度竞价排名广告法市场地位

竞价排名广告规制模式的转型——从政府规制到受监督的自我规制

现行部门规章将推销商品或服务的竞价排名视为商业广告,纳入《广告法》的规制范畴,但新问题又接踵而至。作为一种商业模式,竞价排名是由多种信息组成的复杂构架,究竟哪部分内

期刊

竞价排名付费搜索自我规制后设规制

肌腱及成牙本质相关分子在牙髓中表达情况的研究

目的检测牙髓组织中肌腱及成牙本质相关分子的表达。方法采用组织学染色对牙髓组织进行形态学观察,同时运用逆转录PCR (RT-PCR)、免疫荧光等方法检测牙髓组织中肌腱及成牙本

期刊

牙髓组织免疫荧光肌腱成牙本质

过错主义归责原则在校园伤害事故案件中的运用

随着中小学校园伤害事故频发，学生家长要求学校赔偿的诉讼逐年增多，学校应否承担责任和承担多大的责任成为社会关注的焦点。从校园伤害事故的概念、类型人手，论述该类案件属传统

期刊

校园伤害事故过错主义原则无过错主义原则公平责任原则

发挥政治整合优势防范化解治理风险

<正>当今世界正经历百年未有之大变局。我国正处于实现中华民族伟大复兴的关键时期,面临着各种风险与挑战。面对这种新形势,应该围绕如何有效防范化解重大治理风险、坚持和完

期刊

政治整合治理风险风险防控防范化解

贵州省绿色产业基金的发展状况分析

随着环境污染问题逐渐加剧,我国的经济发展方式面临转型升级的关键时刻,中国经济正努力朝着环保型方向转变。在此背景下,绿色产业面临着巨大的融资需求。而绿色基金正是这种

期刊

贵州省绿色金融绿色基金SWOT分析法

基于位置预测方法的时栅数控转台控制系统设计

数控系统是数控机床的关键功能部件,是保证机床加工精度重要组成部分,数控系统中位移传感器的精度决定了数控系统的加工水平,现有的数控系统多以光栅为位置反馈单元。时栅位移传感器为课题组研制的一种新型传感器,以时空转换思想为理论基础,通过对时间的精准划分实现对空间的精确测量,具有抗干扰能力强、测量精度高等特点,在可靠性以及成本上都有较为明显的优势。把时栅作为角度测量元件应用于全闭环数控系统中不仅可以降低成

学位

时栅数控系统位置反馈预测测量传感器接口

锯齿线结合平滑蛋白线皮下埋置提升紧致的疗效观察

目的:观察锯齿线结合平滑蛋白线皮下埋置对皮肤提升紧致的临床疗效。方法:应用带锯齿线的穿刺针在SMAS筋膜层进行穿刺,将松弛下垂的皮下组织及筋膜组织向上提拉,改善面部皮下

期刊

锯齿线平滑蛋白线皮下埋置面部松弛微创面部年轻化

基于深层神经网络模型的浅层语义解析统计研究

与本文相关的学术论文