基于神经网络的中文谓语中心词识别研究

来源 :贵州大学 | 被引量 : 0次 | 上传用户:jonathanwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谓语中心词是句子的焦点,通过谓语中心词识别可以解析句子各个部分语法要素,从而构建以谓语中心词为核心的事件知识图谱,对研究事件的动态变化与追踪具有重要意义。谓语中心词的识别需要判断其为句子的中心,传统的识别模型主要使用浅层的序列标注方法对句子中的每个字进行分类。由于谓语中心词的识别针对的是单个句子,因此获取句子中的语义信息非常重要。本文的主要工作分为以下两个方面。针对谓语中心词识别中上下文语义信息的获取问题,本文提出了一种基于Highway-Bi LSTM网络的深度学习模型。首先,使用多层堆叠的Bi LSTM网络获取每个句子内部不同粒度的抽象语义依赖信息。其次,本文通过引入Highway网络连接模型中的每个层,使语义信息在层与层之间高速流动。一个句子中可以有多个动词,却只有一个谓语中心词,即谓语中心词的唯一性问题。针对这个问题,通过约束层对谓语中心词的输出路径进行规划,从而保证输出的每个句子中只包含一个谓语中心词。实验结果表明,该方法在中文谓语中心词数据集上F1值达到了80.42%,有效提升了实验性能。随着句子长度的增加,长距离语义依赖成为限制模型性能的一大因素。针对获取句子全局语义信息依赖的问题,本文提出了一种基于边框回归的深度学习模型。该方法首先将每个句子转换成具有全局语义依赖特征的抽象表示,称为特征映射图。然后,从特征映射图中生成文本边界框。边界框表示可能的谓语中心词抽象表示形式。在训练过程中,使用多目标学习框架学习分类置信度和边界框相对于真实谓语中心词的位置偏移量。该方法结合神经网络算法和边框回归算法充分利用句子的全局语义信息,实验结果表明,该方法在中文谓语中心词数据集取得良好的性能,F1值达到了80.78%。
其他文献
油井动液面深度计算是油田行业关注的重要课题,展开其研究不仅对实时获取井下油量储存信息、生产制度的制定具有重要作用,而且对及时了解油井作业状况,加大安全生产管理力度均具有重要的现实意义。为此,针对油井动液面深度检测与预测问题,围绕动液面位置确定、动液面深度计算、多层感知器与线性回归预测模型的比较性研究,以及基于遗传算法的梯度提升决策树模型优化等展开算法研究,并借助声波法的测井数据,开展算法的实验性比
随着人工智能技术的发展,对话系统的应用越来越广泛。任务型对话系统作为对话系统的一个重要分支,可以完成许多基本任务,为企业节省人力成本。自然语言理解(NLU)是任务型对话系统必不可少的核心模块,包括意图识别和槽位填充两个关键子任务,通常基于神经网络模型实现。鉴于任务型对话系统广泛的应用价值以及自然语言理解在任务型对话系统中的不可或缺性,提出了一个自然语言理解模型训练系统,以提高自然语言理解模型的开发
如今,大多数企业已开始使用云平台托管其软件应用。云平台是共享资源,可提供各种服务,例如基础设施作为服务(Iaa S)。这些云服务能以虚拟机(VM)的形式提供给用户,用来处理用户自己的业务。而在云平台中,一个物理机通常可以分为几个VM,对VM的管理十分方便,还可以轻松启动调整大小。因此借助虚拟化技术,可以在云环境中动态部署Web应用,而部署于云平台的Web应用经常面临负载变化,面临负载急剧上升时需要
随着能源短缺和环境污染问题的日益严峻,对于可再生能源的研究和利用的重要性与日俱增,越来越多的新能源通过微电网系统参与到电力系统中。但与此同时,由于新能源的间隙性和可变性,对微电网的经济平稳运行带来了新的挑战。为解决这一情况,本文针对一个由对风电、电解水、氢氧燃料电池及微电网负荷组成的微电网,围绕基于需求侧响应的微电网关键技术展开研究。具体工作如下所示:首先,分析微电网中各系统单元运行特性,并在此基
咽部是人体的重要器官之一,病毒进入口腔时会导致咽部感染,也会因外界因素引起外伤,严重时会威胁到患者的生命,所以咽部医学检查非常重要。因患者咽部不适造成的检查不配合,或医务人员疲惫误判,致使耽误治疗或误诊。为了有效解决这一问题,本文开发咽部图像采集仪及其图像辅助诊断系统,该设备通过手持操作对患者咽部进行摄像或拍照,数据通过无线网络传输,可即时由专业口腔医生进行远程会诊,也可将数据传到云端服务器,通过
贵州省地属西南,为西南高原山地,境内山脉众多,沟谷纵横,地形陡峻,存在各种不良地质现象,这使得无论是在地质灾害防治还是公路建设过程中,都存在着严峻的挑战。在特大桥建设中,对岸坡的稳定性进行评估,是复杂地质条件下在峡谷地带修建特大桥的关键性技术。开州湖特大桥是江口至都格高速公路的组成部分,跨越U型峡谷。两岸岸坡均为一级,两岸基岩为上硬下软的结构,开阳岸桥位处不良地质发育,主要有堆积体和危岩体,对主墩
抗菌药对人类医疗及动物生产有着重要的作用,不仅提高了人类疾病的治愈率,也大大增加了养殖业的经济效益。随着工业生产、人类及养殖业对抗菌药的滥用,大量抗菌药排放入环境中,由此产生的耐药菌及抗性基因的广泛传播,给人类和生态环境造成严重威胁。磺胺和四环素类抗菌药物因价廉、抗菌活性高广泛被养殖业用于疾病预防、治疗,造成大量的药物以原型和代谢产物的形式通过粪尿排入环境中,给生态系统带来危害。本文研究以紫花苜蓿
随着计算机科学技术的发展,计算机图形图像学和计算机视觉技术已渗透到人脸识别、无人驾驶等研究领域。基于计算机的三维建模技术是利用计算机构建物体的三维模型,表面重建是三维建模的核心技术,一直是研究的热点和难点,该技术已广泛应用于自动驾驶、机器人领域、工业制造和检测、考古及三维城市建模等领域。目前,对于表面重建所涉及的算法中,存在非封闭曲面重建效果差,效率低和光顺性差等问题。针对上述问题,论文选择有依据
随着区块链技术在电商交易中的快速发展和应用,用户隐私信息泄露等安全问题逐渐凸显,如何在交易者不匿名的情况下保护交易敏感数据一直是区块链电商交易隐私保护的研究热点。然而,电商交易中隐私程度的加强导致监管机构难以建立,交易隐私保护与安全监管之间无法平衡。为此,本文通过分析区块链电商交易场景,利用椭圆曲线同态加密特性、PVC数字承诺、安全双方乘法计算以及属性加密技术对区块链电商交易的隐私数据保护和监管进
知识图谱作为人工智能的一个分支,在智能问答、专家系统和推荐系统等多个应用场景中提供数据支撑。典型的通用知识图谱有谷歌的Google knowledge graph、DBpedia、百度知心等,在领域知识图谱构建方面,有生命科学领域的Bio2RDF以及医学领域的中医药知识图谱等。在植物领域,北京林业大学构建了植物知识图谱,但是在数据源和构建规模方面尚不够丰富,不能很好地服务于知识图谱应用。本文针对植