融合外部知识的用户生成文本情绪识别研究与应用

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:bbaiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,用户经常在社交媒体上表达自己的观点,包括但不限于对产品,服务,组织及事件的态度。因此,对用户生成文本的情绪识别研究可以广泛应用于意见收集、舆论挖掘等各个领域。目前,虽然现有的文本情绪识别研究取得了一定的成果,但用户生成文本具有情绪表达方式多样、情绪信息稀疏的特点,使得现有方法无法准确识别用户生成文本的情绪。本文主要工作如下:(1)针对用户生成文本中的情绪表达存在中英文混合、颜文字、缩写、替换以及难以理解的网络新词等情况,提出了一种融合多元数据的文本情绪表达规范化框架。此框架可以使用构建的颜文字库、网络新词库将用户生成文本中的颜文字、网络新词替换为库中的语义解释;使用百度翻译开放平台工具对文本中的英文进行翻译;使用同义词词林处理文本中的其他未登录词。(2)针对用户生成文本中的情绪信息稀疏的问题,提出了一种融合情绪标签信息的文本情绪识别模型。模型通过利用标签注意力机制,获取标签与词表示的相关性矩阵,引入了情绪标签信息增强用户生成文本的情绪信息,显式的建模了情绪标签和文本之间的关系,并结合文本的上下文信息与局部语义进行文本情绪识别。(3)设计并实现了一个基于情绪识别的对话系统,该系统结合序列到序列对话生成模型,并结合论文中的研究工作,能够识别用户输入话语的情绪并生成对话。在NLPCC2014task4数据集上进行了实验,与最优的基线模型相比,经过文本情绪表达规范化后,情绪识别模型Text RNN_A在标签排名平均精度、准确率、微平均F1指数、宏平均F1指数提高了0.63%、0.6%、0.5%、1.53%,在汉明损失上降低0.15%;融合情绪标签信息的文本情绪识别模型在标签排名平均精度、准确率、微平均F1指数、宏平均F1指数提高了1.58%、1.94%、1.93%、3.3%,在汉明损失上降低0.51%。实验结果表明了本文方法的有效性。
其他文献
人脸表情识别是社会交往中最具挑战性的任务之一。一般来说,面部表情是人类表达情感和意图的一种自然而直接的方式。人脸表情识别领域中,卷积神经网络发挥了巨大的作用,同时也取得了丰富的成果。随着使用的卷积神经网络层数不断加深,对应的规模也越来越大,导致模型复杂、参数量大、结构不够轻巧。此外,传统的卷积神经网络难以识别面部表情的细微变化,无法准确提取面部表情特征,识别的精准性还有待提升。针对以上问题,具体研
学位
分布式系统凭借优秀的计算能力得到广泛的应用,任务调度是分布式系统尽可能合理的将任务分配到各个处理器上的过程,进而充分利用分布式系统的计算能力提高程序的处理效率。目前分布式环境下任务调度的研究取得了一定的进展,但仍然有许多问题有待进一步研究和解决。本文以独立任务和依赖任务为研究对象,建立了响应式调度模型,改进了任务调度算法,最后将其应用到分布式定时任务系统,达成了减少任务调度完成时间的研究目标。本文
学位
报纸
安全稳定的校园环境是保证师生学习、工作与生活的基础条件。校园安全管理研究已经得到广泛关注,但现行高校校园安全管理模式仍存在管理效率低下和部门协调联动性不足等问题。鉴于此,将网格化管理模式引入到高校校园安全管理中。文章通过梳理高校日常管理机构的设置以及职责划分,结合高校管理模式和运行机制,构建了三级网格化高校校园安全管理队伍、四阶段网格化高校校园安全管理流程、大数据网格化高校校园安全管理信息平台。基
期刊
随着人工智能的发展和网络带宽的增加,大数据的深度学习为信息技术的外延应用提供了更多的契机,可以通过高性能计算获得新的运用,然而海量的数据整理分类和制作报表也成为一项庞大而复杂的工作。通过对现有的报表工具的分析,发现其存在使用繁琐、加载速度慢等一系列问题。本文使用了组件方式进行系统开发,就前端组件间接数据获取方式和渲染卡顿问题进行了综合分析,设计并实现了直接获取数据的组件模型,同时结合前端缓存技术,
学位
随着物联网、信息处理技术及移动通信技术的快速发展,物联网设备工作所需的数据量不断增加,在海量数据中设备无法有效获取对自身有用的信息。当设备正常工作消息请求过多时会出现网络拥塞,消息的主动推送能够有效解决这一问题。物联网设备在朝着智能移动终端方向发展时,其业务特征通常具有计算密集型和时延敏感型的特点。移动边缘计算(Mobile Edge Computing,MEC)技术,弥补了智能终端设备在计算、存
学位
在物联网高速发展的时代,电子投票已经成为用户表达意见的重要工具,并且早已应用于社会生活的各个方面。传统的电子投票主要集中于可信服务器或第三方机构,存在中心化程度高的风险。继而易造成重放攻击、选票篡改或者隐私泄露等威胁,公平性缺陷和隐私泄露严重影响了投票安全性和结果准确性。由于不同的投票机制会涉及不同的偏好数据类型,并且所需的安全属性不同,因此如何基于投票机制的数据特性设计合适的投票方案是值得探索的
学位
数学建模是连接现实世界和数学世界的关键桥梁,是把数学工具引入到实际问题的重要步骤。培养学生的数学建模能力是社会发展的实际需要,并且高中数学知识自身带有建模的属性,由此可见,高中数学建模教学十分必要。高中数学建模教学的教学策略包括:充分应用往年的数学建模竞赛试题;教会学生熟悉数学建模的流程;培养学生数学建模能力。
期刊
随着物联网技术的高速发展和广泛应用,暴露在网络中的物联网设备数量日益增加。物联网网络设备中存在着大量的隐私信息,这些信息一旦被恶意利用,将会对用户安全乃至网络安全造成严重的威胁。保障设备信息安全是保障物联网安全的重中之重,而对设备的准确识别是保障设备信息安全的前提条件。本文依托于国家重点研发计划“物联网终端评测平台关键技术研究及标准化”,以项目中的终端设备自动测试系统为基础,重点研究了接入网络的物
学位
数据不平衡问题是机器学习领域的一个重要研究课题,指的是数据集类别样本数量不近似相等。数据不平衡处理技术广泛应用于医疗诊断、信用评估、生物信息等领域。数据不平衡问题会造成机器学习模型对不同类别的训练失衡,为降低数据不平衡问题对机器学习分类模型训练的影响,近年很多学者对其进行了深入研究。但是,随着现实场景中更复杂的不平衡数据集出现,数据不平衡研究领域仍然存在着很多的困难与挑战。本研究重点论证了当前数据
学位