基于小样本学习的篇章级文本情感计算系统设计与实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sam008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理领域中,基于深度学习的文本情感分类有着不俗的表现。但传统深度学习方法的性能依赖于大规模人工标注数据集,而获取这些数据是费时费力的。另一方面,传统深度学习方法主要针对句子级的文本情感分析,在篇章级文本情感分析中依然存在长程依赖问题和单一主体假定问题。因此本文针对以上两个问题,以企业文本为基础,以小样本学习和篇章级文本情感分析为研究对象分别进行了研究,并且以此为基础开发了一个具有实用意义的篇章级情感计算系统。首先针对小样本学习的问题,本文对基于提示的小样本学习进行研究,通过引入seq2seq-attention结构构建自适应的提示模板,提出混合提示模型。该模型既能有效的提高构建提示模板的质量,也能充分利用现有的标注数据学习模板构建,并且迁移到其他领域。最后在公开数据集上达到88.7%的准确率超过了其他模型,表明了模型的先进性。其次针对篇章级情感分类,本文对机器学习和深度学习的特征提取方法进行研究,提出了包括主体特征,情感特征,权重特征,句间关系特征等四大特征选取方法并且介绍了其选取原因,然后在此基础上结合LSTM结构提出了一种基于句子特征的篇章级情感分析模型与一种基于句子特征的主体独立篇章级情感分析模型。最后系统基于Python平台和深度学习开源开发框架pytorch,设计了一款B/S架构的系统,并对系统进行了实现与测试,最终完成了包含数据获取、数据清洗、情感分类、分析结果可视化的篇章级情感计算系统。
其他文献
口译是特殊的语言处理活动。其即时性的特点在同声传译方面表现得尤为突出。口译员在紧迫的时间压力下,必须理解源语信息,短暂存储这些信息,同时生成相应的目的语。除了必要的语言技能,口译员必须有良好的信息存储能力。而工作记忆正是负责信息的存储和加工,所以工作记忆对口译的顺利进行起着至关重要的作用。虽然已有大量研究探索了工作记忆能力和口译质量的相互关系,但研究结论存在差异,而且大部分研究仅停留在理论分析层面
学位
本研究运用文献资料法、问卷调查法、访谈法等研究方法,对上海市普陀区校园足球“一条龙”人才培养体系的学校布局、校园足球文化积淀、学业与竞训、人才输送衔接、硬件与师资情况一系列相关因素进行调研,梳理出现阶段上海市普陀区校园足球“一条龙”人才培养体系在发展建设过程中存在的一系列问题,并总结问题症结所在,并进一步对未来如何完善普陀区校园足球“一条龙”人才培养体系,从而为该区更好地推广普及校园足球,培养精英
学位
亲社会行为是一切对他人有益并有助于社会和谐的行为,体育教学中比赛情境能为其构建支持性环境,但在实际教学中由于缺乏持续的阶段性评价,无法提供形成积极社交行为的条件。形成性评价作为引导学生有效调控、提供持续反馈的评价,能够在触发亲社会行为动机方面发挥重要作用。目的:探索比赛情境教学中形成性评价对女大学生亲社会行为的影响,为亲社会行为在体育教学中的培育以及形成性评价在体育课程中的应用提供一定的参考。方法
学位
随着科学技术的不断发展,现代工业制造技术的精进,产品设计和生产自动化程度的不断提高,复杂曲面被越来越多地应用到诸如航空工业、汽车工业、建筑设计和精密零件等的生产制造中。尽管目前复杂曲面的造型和加工制造软件已经非常强大,但它们多数被掌握在西方国家手中,而且能否构造符合工业需求的复杂曲面并将其完美制造出来仍是值得挑战的难题。因此本文对复杂曲面生产中的造型与侧铣加工两个流程进行研究,旨在构造形状优良的曲
学位
随着工业控制网络与公共网络高度互联,工控协议在设计、实现之初对安全问题考虑不充分的缺陷,已严重威胁到工业控制网络的正常运作。模糊测试作为一种高效的漏洞挖掘方法,成为了近年来在工控协议安全领域的新兴研究方向,然而现有相关研究主要聚焦于模糊测试中的某个阶段,对工控协议的漏洞挖掘效率提升有限。因此,本文从整体角度出发,针对私有工控协议漏洞挖掘难度大、缺乏工控协议的统一描述、测试用例响应率低等问题,提出相
学位
在信息技术的带动下,软件在社会发展中占有越来越重要的作用。软件的质量问题,特别是可靠性属性等得到足够的重视。软件可靠性模型从数学角度对故障出现过程建模,有效地评估了软件可靠性。软件可靠性模型通常由两个影响因素构成:描述全部故障的故障总数和描述测试环境变化的故障检测率。目前研究主要集中于提出不同形式的影响因素,而从影响因素角度分析其对软件可靠性模型的影响的研究较为匮乏。针对以上问题,本文在统一的软件
学位
超声成像因其无辐射、低成本、快捷便利等特点,被广泛应用于临床诊断,但同时超声图像也存在高噪声、低分辨率、依赖医生操作经验等缺点。利用机器学习和深度学习技术改善超声图像质量、定量客观的评价图像、提取有利于诊断的计算特征,帮助医生提高诊断准确率,是目前智慧医疗的热点研究问题。本文针对超声图像中的病变检测问题和图像标注问题,以甲状腺超声影像为研究对象,开展了研究,并利用研究成果开发了一个具有实用意义的超
学位
太极拳在全世界范围内的传播方式,除了由不同流派的老师教授太极拳拳法与招式之外,还包括与太极拳技击相关的,以文字为载体的,以太极拳文化内涵为主要内容的,以中华思想文化为核心的太极拳经典。太极拳经典不但汇聚各种拳法的教学,还聚合了中国传统文化,如道、儒、佛、理学、中医于一体,是中国传统文化的杰出代表。这些经典十分具有历史意义,对于扩大独具中国特色元素的太极拳来说具有巨大的优势,并且对中国文化的传承以及
学位
五年级下冊《分数的意义》,这是一节概念课,学习本节课之前,学生已经初步认识了分数,本节课的教学是将分数的认识上升到理性认识,进一步完善对分数的认识,进而总结概括分数的意义。以下是在给出例题四幅图,让学生自主探究完成看图写分数之后,笔者的感想。
期刊
本课题依托的场景为一个整合微服务组件管理、Io T设备云上管理以及第三方云服务接入的一体化云平台。由于此平台需要对第三方服务、自建微服务组件与云服务化的Io T设备进行管理,需要面对应用特性难以捕捉、应用异构与第三方服务引入的数据缺失等问题,如何在这样一个应用服务质量与服务的开放度参差不齐的云平台中构建一个同质化的云服务环境并对服务组件的能力进行有效管理和弹性扩充便是一个亟需解决的问题。本文的主要
学位