【摘 要】
:
属性抽取旨在从评论文本中抽取评价属性(简称为属性),是细粒度情感分析的一项重要子任务。目前基于深度学习的属性抽取任务在表示学习以及远程监督等方面已取得一定的进展,然而在该任务中仍存在较多亟待解决的问题,包括方法学中注意力机制建模噪声较大且缺乏进一步的交互能力、语料数据中缺乏有效线索信息辅助属性抽取以及属性抽取结果中存在较多边界错误的属性。本文基于上述问题展开相应的研究,主要创新点包括以下三个方面:
论文部分内容阅读
属性抽取旨在从评论文本中抽取评价属性(简称为属性),是细粒度情感分析的一项重要子任务。目前基于深度学习的属性抽取任务在表示学习以及远程监督等方面已取得一定的进展,然而在该任务中仍存在较多亟待解决的问题,包括方法学中注意力机制建模噪声较大且缺乏进一步的交互能力、语料数据中缺乏有效线索信息辅助属性抽取以及属性抽取结果中存在较多边界错误的属性。本文基于上述问题展开相应的研究,主要创新点包括以下三个方面:(1)由于面向属性抽取任务的注意力机制多为全局式注意力机制,其注意力建模会带入较多的噪声,并且缺乏进一步的交互能力。因此,本文提出一种双层注意力机制,其中第一层在滑动窗口内进行注意力建模,从而达到降噪的目的,第二层在第一层降噪的基础上用于交互,以提升注意力机制的交互能力。在国际语义评测任务提供的笔记本电脑以及餐馆领域数据集上进行实验验证。相比于全局式注意力机制,本文提出的双层注意力机制在两个数据集上的性能均获得提升。(2)仅依靠神经网络对单文本进行表示学习,性能提升空间有限。利用有效线索信息辅助属性抽取,是提升抽取性能的可行方法之一,然而现有实验语料中缺乏有效线索。针对该问题,本文提出融合复述信息的属性抽取方法。相比于源句(原始语料文本),复述句与其语义相同但表达结构不同,从而能够为源句建模提供丰富的外部线索。此外,本文还提出一种将同序列融合与异序列融合相结合的复述融合方法。相比于基线模型,融合复述信息的抽取模型的性能获得进一步提升。(3)属性边界错误的问题常见于抽取结果中,对于精确匹配的评价标准而言,其制约了属性抽取性能的进一步提升。为此,本文提出基于指针神经网络的属性边界重定位方法。此外,为获取边界重定位模型的训练数据,本文在不进行人工标注的情况下,提出使用回收机制,从而自动进行构建训练数据。通过实验验证,证明边界重定位方法能够有效减少边界错误。本文从注意力建模优化、融合辅助线索及边界后处理优化这三个角度出发,一定程度上解决了属性任务现有的难点问题,在国际语义评测任务提供的笔记本电脑和餐馆评论数据集上验证了所提方法的有效性。
其他文献
在日常口语对话中,人们常会使用代词来替代先前说过、但表述较为复杂的句子或短语,以使得语言表达简洁连贯,从而提高沟通的效率。然而,代词给日常交流带来便利的同时,也会引起语言理解的歧义,特别是一句话中存在多个指代关系时,对代词理解的细微偏差便会使句子的意思完全不同。基于神经网络的对话生成模型也受上述问题影响,口语中的代词给模型的语言理解造成了困扰,影响了模型回复生成的质量,这是对话技术性能提升的一大瓶
信息时代的到来使得我们几乎拥有了永久性的记忆,人们在网络上留下的任何信息都难以被遗忘。虽然信息时代带给我们以便利的生活,但我们也常常被互联网中所留存的有关自身过时或不必要的信息所困扰。为了解决这一困境,更加有效地保护公民的个人信息,被遗忘权由此应运而生。作为一项新兴权利,被遗忘权的权利内涵来源于法国的“忘却权”,核心目的便是使人摆脱过去行为的束缚,从而拥有改过自新,重新开始的机会。2012年,被遗
法谚云:“迟来的正义非正义”,强调的是正义实现的及时性和有效性。司法审判的效率提升是一个司法理论和实务界均高度关注的热点问题,应运而生的民事诉讼程序繁简分流也是司法制度改革的重点之一,但民事诉讼法及其司法解释并未针对繁简分流的具体运作流程作出明确的规定,最高人民法院也是近年开始在部分法院开展繁简分流的试点工作,以期取得可复制的经验后全面推开。本文将以最高人民法院第一批试点法院A法院繁简分流的具体运
近几年,全球经济发展减缓,世界各国传统贸易增速缓慢。尤其是欧盟、美国等发达国家,其在国际传统贸易领域的市场份额逐渐被新兴经济体所取代。越来越多的国家开始寻找促进本国经济发展的新发动机。拥有巨额资金的政府采购市场进入发达国家的视野。国际社会渴望国际政府采购市场开放、提高国际政府采购市场自由化程度的呼声愈发高涨。随着区域经济一体化程度的加深,欧美等发达国家将开放政府采购市场的意愿引入区域贸易协定的谈判
本文建立永磁同步电动机的数学模型,采用一种粒子群优化PID控制算法对永磁电动机的功率和载荷进行控制,并结合Simulink平台对控制器的效果进行了仿真。
为了助力碳达峰且为企业降本增效,以一台150kW永磁电机为改进对象,提出一种新的转子结构及电磁设计方案,将其改造成铁氧体辅助同步磁阻电机(Pma-SynR)。改造后的电机与原电机具有相同的定子结构,在一定程度上节约了制造成本。结果表明,改造后的Pma-SynR可以对PMSM进行替代,为企业达到降本增效的目的。
自动文摘作为自然语言处理领域的一个重要研究方向,其能够从海量数据中快速筛选出有效信息而得到了广泛的应用。传统的自动文摘研究方法主要集中于探究如何构建模型来优化文本的语义表示,而忽略了篇章信息对于文摘任务的影响。文本不是简单堆叠而成的文字序列,而是相互关联的语义单元衔接而成。为了充分利用文本的篇章结构特征,本文开展了结合篇章信息的生成式摘要研究,主要内容可分为如下三个方面:首先,针对浅层篇章结构对摘
以某船永磁推进电机为研究对象,阐述其基座改装工作中的重难点。通过设计制作推进电机基座定位工装,提高基座安装精度,并采用科学合理的施工流程及焊接变形控制措施,进一步提高该永磁推进电机基座的装配精度,最大程度地减少基座平面的人工研磨量。
海上舰艇防空反导作战基于目标攻击意图识别是现代舰艇防空技术的研究热点;来袭目标攻击意图识别是战场态势分析的一个重要部分,以往是通过先验知识和先验概率进行量化分析与明确攻击意图识别特征值的影响权重;深度神经网络可通过自适应学习目标攻击意图的特征值,可以在缺乏先验知识的条件下,通过小样本集的目标攻击意图的特征值训练,学习特征数据和攻击意图识别之间的对应关系与映射;通过引入GeLUs激活函数和AdaMo
受转子磁体谐波、变频器死区效应、导通压降等因素的影响,船用永磁同步电机运行过程中气隙磁场会产生畸变,导致定子电流含有大量特征谐波分量。本文通过引用改进型二阶广义积分器(SOGI),可实现低频谐波分量的提取,进而通过PI反馈调制,实现了输出电流主导谐波成分的抑制。仿真分析验证了该文理论分析和计算的正确性。