【摘 要】
:
文本情感分析是自然语言处理领域中一项重要任务。随着互联网的不断发展,网络上出现了大量的文本数据,这些数据携带着人们的观点、情感等主观信息,对其进行情感分析可以为企业和政府的决策提供支持。本学位论文以互联网上的评论等文本数据作为研究对象,发现评论文本使用了反讽修辞,这会影响到情感分析的准确性,在分析了现有反讽文本识别方法及情感分析方法的不足后,对模型进行改进创新,主要研究工作如下:1.在反讽文本识别
论文部分内容阅读
文本情感分析是自然语言处理领域中一项重要任务。随着互联网的不断发展,网络上出现了大量的文本数据,这些数据携带着人们的观点、情感等主观信息,对其进行情感分析可以为企业和政府的决策提供支持。本学位论文以互联网上的评论等文本数据作为研究对象,发现评论文本使用了反讽修辞,这会影响到情感分析的准确性,在分析了现有反讽文本识别方法及情感分析方法的不足后,对模型进行改进创新,主要研究工作如下:1.在反讽文本识别方面,针对现有反讽文本识别方法缺乏对文本主题的关注,忽略了反讽句子中存在情感极性相反词对这一重要特征的问题,提出一种基于主题模型和词汇间注意力分数的反讽文本识别方法。首先,使用预训练的word2vec对文本进行词向量嵌入,以获得文本特征词汇的向量表示。其次,融合主题模型、词汇间注意力分数部分以及双向长短期记忆网络构建了多通道的向量处理模块,弥补了反讽文本识别方法对文本主题忽视的缺陷,并且关注了当前词汇与其他词汇情感极性相反的现象。然后,引入注意力机制,突出向量处理模块中反讽识别相关特征。最后,在两个中文数据集、Riloff和Ptacek两个英文反讽文本数据集上进行实验,结果表明,本论文所提方法性能优于现有反讽文本识别方法。2.在文本情感分析方面,针对情感分析方法Caps Net中,特征提取不足、忽略了文本位置特征、没有充分利用文本多元语法特征的问题,提出一种融合位置特征的改进Caps Net情感分析方法。它主要由词嵌入层、多尺度特征融合层、改进的k-means胶囊层以及情感分类层四个部分组成。其中词嵌入层将文本特征与文本位置特征相融合,以丰富词嵌入层输入;多尺度特征融合层使用不同尺度的卷积核获取文本的多元语法特征,弥补短文本特征词汇不足的缺陷;改进的kmeans胶囊层使用统计学公式寻找数据集最密集一点对初始值进行赋值,以减少数据集中孤立点的影响;情感分类层用来判别情感倾向。此外,运用第三章的反讽文本识别方法作为情感分析的判别条件。在Restaurant和Laptop数据集上进行实验分析,结果表明本文模型在情感分析任务上优于其它现有模型。
其他文献
智能家居随着技术进步逐渐深入到人们生活中,其设备量与使用率的增长带动了设备间安全认证的需求,然而现阶段依然缺少可靠性高的智能家居安全认证方案来确保智能家居使用者的信息不被泄露。大部分智能家居设备均采用中心化管理方案进行控制,然而中心化管理决策中对设备身份认证的控制不够严格,造成设备数据泄露风险。联盟链属于区块链的一种链类,其具备数据可追溯和弱中心机构管理的特点,而Hyperledger Fabri
在线学习被广泛认为是一场新的教育革命,已经成为教育学、心理学、数据科学等学科交叉研究的热门课题。在学术界和产业界的共同努力下,尤其在新冠病毒疾病突然爆发的刺激下,在线学习在教育中的作用越发凸显。在此背景下大规模开放在线课程(Massive Open Online Courses,MOOC)发展迅速,截止2020年底,仅我国上线MOOC课程数量已达3.4万门,学习人数超过5.4亿人次。然而MOOC自
新时代的学校教育要构建能实现立德树人根本任务的家校社协同育人机制。学生成长导师制是导向教师全面育人的有效机制,是学校育人方式变革的必然选择,也是社会追求高质量教育的现实需要。基于学生成长导师制的家校社协同育人可采用以建立学生成长档案袋为育人起点、通过分工合作明确导师指导职责、通过搭建平台畅通家校沟通渠道、通过整合资源拓宽育人视野、通过系统培训夯实全员育人的能力基础、通过制度建设保障育人实效的实施路
目的 探讨目标导向式重复性功能训练结合高低频转换听觉-运动训练在高血压脑出血术后患者中的应用效果。方法 按入院顺序将2019年1月至2021年5月我院收治的90例高血压脑出血术后患者分为对照组和观察组,每组45例。对照组采取常规护理,观察组在常规护理基础上采取目标导向式重复性功能训练结合高低频转换听觉-运动训练。比较两组的干预效果。结果 干预后,观察组的匹兹堡睡眠质量指数(PSQI)评分低于对照组
近年来,随着通信技术的快速崛起,移动通信网络中出现了大量新型网络服务,传统“一刀切”的网络不再适用。在此背景下,网络切片技术应运而生。然而,网络切片技术在增加网络灵活性的同时,也增加了网络管理的复杂度,从而引入了更多的不可靠因素。因此,本文重点研究了网络切片场景下服务功能链的可靠部署与异常检测算法,主要研究内容与创新的总结如下:1.为保证用户服务请求的可靠运行,对服务请求中的服务功能链(Servi
随着我国社会老龄化程度不断加剧,有效解决各类养老问题是社会发展需求。长期居住在空气质量差的环境中会让老人感到头晕胸闷、容易疲倦暴躁等;家中的可燃气体泄露与室外粉尘浓度超标都会影响老人身心健康;跌倒行为更是会导致老人在生理和心理上产生不同程度的损伤,甚至会导致死亡。针对这两个问题,本文设计一套老人居家环境和跌倒监测系统。通过采集环境数据对数据判别并提醒老人或者监护人环境异常,通过改进跌倒检测方法提高
硫是一种储量丰富、价格低廉的化工原料,其作为电池正极材料的理论比容量高达1675 mAh·g-1。因此,锂硫电池被认为是未来储能领域中最具应用前景的一类设备。第54届国际化学奥林匹克试题第4题以锂硫电池应用研究中的前沿问题为主线,引导学生了解了锂硫电池的基本化学原理、迷人的应用前景和实际应用的一些科学挑战,考查内容涵盖锂与含硫物质间的化学反应、返滴定法、化学平衡、电化学、物料及电荷守恒等相关知识点
房产评估即房地产价值评估,是指在一段特定时间内对房价做出准确的估计与推断。作为关联银行金融风险和房地产市场行为的重要枢纽,房产评估是维持房地产业及社会经济稳定发展的关键因素。传统房产评估方法主要依靠市场比较的方式,其精度受限于专家经验。虽然机器学习已逐渐应用于房产评估,但精度仍有待提升。此外,公众情绪也会对房价造成一定影响,而现有房产评估方法未将其与房产物理属性相结合作为评估指标。有鉴于此,本文将
随着智慧城市的建设,大到繁华都市小到街头巷尾都安装了大量的高清监控摄像头。工作者利用这些几乎免费的监控视频进行行人数据的分析,不仅可以对人员进行定位跟踪,还可以对一些公共场合进行智能化管理。但是面对海量的、质量参差不齐的监控信息资源,如何低成本、高效率地实现各种各样的服务变得尤为重要。行人重识别是智能监控系统中关键的一环,旨在跨镜头下检索特定的目标行人。近年来,行人重识别运用深度学习理论在该领域取
指向深度学习的小学数学教学评一体化改革以数学核心素养为焦点,将教师的教、学生的学、教与学的评价有机融合.实施指向深度学习的小学数学教学评一体化改革引导教师关注学生学习过程,确保课堂教学的高效性;凸显小学生主体性,有利于促进公平优质教育的实现;深化课程改革,促进数学学科育人目标有效落地;促使评价范式转型,推动数学评价理论与实践向纵深发展.基于此,文章课题团队通过文献研究、行动研究、调查研究、范例研究