基于深度学习的比较句识别以及比较要素抽取研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:qiyanru
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
比较句是产品评论中的一种特殊句式,它蕴含着人们对商品或者服务的比较观点信息。通过对比较句的解析,可以更容易的辨别出评论中的情感倾向。海量的评论信息中存储了用户产生的大量高价值信息,其中隐藏着用户的情感态度和政治倾向,这类问题的解决对产品评论挖掘等提供信息支撑具有重要作用。本文通过对比较句研究现状的综述,针对现有的该领域的相关研究方法的局限性,引入基于深度学习的比较句识别以及比较关系抽取方法,旨在通过学习表示训练能够分析跨领域的比较句抽取模型。本文主要展开了以下工作:(1)提出了改进混合网络模型的中文比较句识别方法。针对中文比较句识别的方法过于依赖人工专家的经验以及深层特征难度提取较难的问题。本文引入了深度学习中混合网络模型的概念,通过使用BERT预训练模型,融入比较关键词,融入注意力机制对混合网络模型(卷积神经网络和双向长短时记忆网络)进行改进,极大的提高了比较句识别的效率和性能。(2)提出了融入比较关键词的BiLSTM-CRF模型的中文比较关系抽取方法。该模型克服了双向长短期记忆网络没有从全局考虑标签序列以及条件随机场严重依赖人工提取特征的缺点,使用预训练的词向量作为模型的输入进行比较关系的抽取,在此基础上添加比较关键词特征进行比较关系抽取。实验证明:第四届中文倾向性评测语料上,基于该模型的比较关系抽取获得了较好的实验结果。(3)提出了融入依存句法信息的BiLSTM-CRF模型的中文比较关系抽取方法。比较关系的抽取的主要任务是从比较句中提取关系要素,而且这些要素在依存句法上存在支配和被支配的关系,因此在融入比较关键词的BiLSTM-CRF模型的基础上,通过融入依存句法信息来拉近依存关系词语之间的距离以提升双向LSTM层学习长远上下文依赖关系的能力。实验结果表明,该方法能提升比较属性抽取的效果。
其他文献
随着我国风电行业的迅猛发展,大功率风电机组是今后发展的趋势,风电机组的结构也变得更加复杂,不可避免地面临着负载增加等新问题。因此有必要根据风电机组系统的结构和运行特点,运用仿真技术,对可能发生的工况进行载荷分析,优化控制策略,以确保风电机组的运行可靠性和安全性,降低运行维护成本。本文的主要研究内容包括:(1)建立了3.4 MW的风电机组联合仿真模型。分析齿轮箱的结构,基于多体动力学建模技术建立三种
钢作为现代工业中最重要的合金材料,其表面发生的磨损和腐蚀严重阻碍了社会经济的发展。氧化石墨烯作为二维材料石墨烯的衍生物,具有分散性好、化学稳定性好以及无毒性等特点,可以作为钢材表面上的一种高效有机涂层。本文应用第一性原理计算方法,从纳米尺度出发研究了氧化石墨烯在钢表面上的吸附机制,重点探究了氧化功能基团对界面吸附强度的影响。主要研究内容如下:以两种铁基材料代替钢并制备了模拟模型:Fe(110)及F
纳米金属氧化物表面的氧空位(OVs)缺陷构建由于其对于能带结构的可调控作用、对气体分子(氧气分子、气体污染物分子)之间强的相互作用,近年来逐渐成为污染物气体治理、液体有机污染物降解、光催化分解水、二氧化碳还原等光催化领域中改善光催化剂性能的有效手段之一。构建OVs的方法也不尽相同,典型的构建OVs的方法有:ⅰ)无氧环境下的煅烧法(N2气氛,真空条件等);ⅱ)还原性气氛下煅烧法(CO、H2气氛);ⅲ
球形微米银粉是导电银浆的重要组成部分,其形貌、粒度及振实密度直接影响着银浆的使用性能。目前,球形银粉的制备方法以液相化学还原法为主,在该方法中分散剂种类及加入量、反应体系pH、反应温度、反应物浓度、反应溶液混合方式等条件对银粉颗粒的形貌、粒度以及粉末的振实密度等都有一定的影响。本文选用液相化学还原法,以硝酸银为银源,抗坏血酸为还原剂进行了球形微米银粉的制备研究。采用扫描电子显微镜对银粉的形貌和分散
接地网是电气设备的泄流通道,保护着电力网络的正常运行。接地网腐蚀严重威胁电力系统安全,接地网腐蚀检测与状态评价尤为重要。瞬变电磁法因其非开挖、不停运的特点已经应用于接地网检测中,但多运用于接地网断点识别。本文基于瞬变电磁法,开展接地网的拓扑结构检测和腐蚀程度量化评价研究。论文主要工作和得出的结论如下:阐述了瞬变电磁法的基本原理、感应过程与装置模式;选用中心回线装置,推导视电阻率的计算方法,并将其作
在多电平变换器结构中,三电平变换器因其成本低、输出电流畸变小等优点,广泛地应用在中高压大功率场合。中点箝位型(NPC)三电平逆变器更是因其拓扑结构、控制策略简单,成为一个热门研究方向。但是,NPC三电平逆变器由于其自身拓扑结构特点,存在直流侧电容分压不均的问题。对此,本文以NPC三电平逆变器为研究对象,提出相应的控制策略解决该问题,具体研究如下:本文首先介绍了NPC三电平逆变器的拓扑及其工作方式,
全球目前大约有4亿多人患有糖尿病,血糖水平的实时监测对糖尿病患者的治疗具有重要意义。传统的血糖监测方法主要为有创监测法,这种监测方法会给患者带来痛苦而不能及时进行血糖检测,并且可能导致传染性疾病的交叉感染,因此对新型无创血糖监测的研究与应用被寄予了越来越高的期望。本文研究了以光声效应为理论的无创血糖检测技术,并提出了多频段融合建立葡萄糖浓度预测模型的方法。首先,在深入研究光声效应基本原理的基础上,
胃肠道动力障碍性疾病广义上是指所有胃肠动力紊乱引起的以各种消化道症状为临床表现的疾病,而狭义上主要指由胃肠运动节律、频率和腔内压力等改变所致的无器质性病因存在的一类疾病。该疾病在临床上比较常见,但目前没有较好的诊断和治疗方法。相关研究表明,该疾病患者的生理病理情况可通过胃肠道的一些生理信息间接反映,因此实现对胃肠道生理信息的可靠检测对研究胃肠道动力功能及其相关疾病具有重要意义。目前,临床上对胃肠道
农民专业合作社是农业生产经营的新型主体,是建设现代农业的重要力量,在乡村振兴中发挥着越来越重要的作用。迄今为止,中国农民专业合作社已有很大数量,但是有生命力的、规范的合作社不多,合作社发展面临巨大的困境,针对这一事实,唯有厘清合作社发展面临困境的深层次原因和完整逻辑,才能建立一套完整的科学的治理体系。本文以赣南地区农民专业合作社为研究对象,选取赣南地区不同地域、不同类型、不同发展程度的农民专业合作
随着大数据和云计算技术的不断演化和升级,数据安全风险日益凸显,信息安全保护刻不容缓。随机数在信息安全中起着至关重要的角色,可用于生成密码原语与协议的初始化向量、加密算法的密钥、伪随机数发生器的种子、挑战/应答方式的挑战值、Nonce值和安全协议中的系统参数等。真随机数发生器是一种能够产生具有独立性和无偏性二进制序列(即真随机数)的物理设备。随着可重构计算领域的研究日益增加,这使得具有极高灵活性的现