基于深度学习的文本讽刺检测算法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:JK0803luowei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网世界中充斥着人们情绪和观点的表达,表达情感的方式多种多样,除了直抒喜怒哀乐,运用修辞手法来加强情感也是一种常用的表达方式。讽刺就是其中一种修辞手法,通常用于表达作者与文本表达相反的情感。例如,在句子“今天把脚歪了,真是开心的一天”中,本来把脚歪了是一件坏事,是让人不开心的,而作者使用“开心”这一正向的词语来评价,通过戏谑的方式,进一步表达出自己的不开心。像这样的表达,让我们人类来理解是很容易的,但是在大规模的网络舆情分析、文本情感分析中,单靠人来理解分析是远远不够的,需要用到信息技术来完成这项任务。所以如何让计算机理解讽刺修辞手法,挖掘出讽刺表达背后的特征,在自然语言处理领域是一项重要的研究内容。本文以互联网平台上的文本数据为研究对象,在分析了现有研究中存在的不足后,针对现有讽刺检测方法中缺少对句子中情感矛盾挖掘和缺乏对长文本讽刺检测研究的问题,具体研究了以下4点内容:1.本文采用注意力机制来挖掘文本中的深层信息。注意力机制可以聚焦于那些更具有深层语义的词汇,针对不同的任务和场景,注意力机制能找出在当前场景最有用的词汇,能够深入分析潜在的情感。2.本文针对现有讽刺分析方法中缺少对句子中情感矛盾信息挖掘的问题,提出具有矛盾特征挖掘能力的深度神经网络模型SCRN,对文本进行编码后,通过模型找出文本中存在的情感矛盾,并基于此对文本讽刺检测。根据实验结果,SCRN模型相较于其他模型,在讽刺检测上具有较好的效果。3.本文针对现有讽刺分析方法中缺少对长文本分析方法研究的问题,提出一种基于层级情感矛盾检测的深度学习网络HCRN,通过对长文本进行层级划分来检测不同层级间的矛盾,并基于此对长文本的讽刺情感进行分析。实验结果表明,考虑长文本的层次结构并在不同层次进行矛盾检测,对长文本的讽刺检测效果有明显的提升。4.为了验证本论文所提出的模型算法具有一定的实际应用价值,本论文设计并实现了一个讽刺检测原型系统。
其他文献
<正>髓内钉内固定是股骨近端及股骨干骨折的一种成熟治疗方法,其在骨折复位和固定方面都有很好的效果。在生物力学和减少对周围重要组织损伤方面,髓内钉内固定优势明显,具有良好的抗旋转能力并且防折弯的能力更为突出。目前有一种适用于从股骨大粗隆周围置入的偏角型顺行髓内钉已经成为治疗股骨近端骨折的主流趋势[1-2],
期刊
在线社交网络的出现,让信息的传播速度得到了质的飞越。社交网络的出现给人们带来了诸多好处,但是谣言的出现却给社会造成了巨大的隐患。谣言指的是没有官方来源,并且没有被相关工作人员审核就进行了发表的不实言论或信息。谣言本质上是虚假的,任何敏感的谣言话题都可能造成社会的动荡,而网络谣言传播的主要途径是社交网络,用户无需审核就可以进行各种信息的发布。如今,谣言已经成为了舆论爆发的导火线,谣言的传播极大地影响
学位
软件老化效应的存在会极大影响软件运行效率,甚至造成系统崩溃进而可能导致灾难性的后果。为了减少老化效应的影响,软件再生作为一种预防式的维护技术应运而生。但由于软件再生行为本身存在系统开销,因此不能频繁地执行再生计划。在尽量避免系统失效的前提下,适时触发软件再生以最小化系统维护成本是一个重要的优化问题。传统基于检测的再生策略研究中,检测周期往往是固定的,即采用相等间隔时间对系统退化状态进行检测,进而评
学位
为了更好地促进故障预测与健康管理(PHM)技术在地面预警监视雷达中的发展与应用,提升部队自主保障能力和效率,以及降低部队保障压力,文中首先从系统架构、数据采集、数据处理、状态监测、故障预测、健康评估、维修决策等方面阐述了与地面预警监视雷达相关的PHM技术的研究现状;然后指出了地面预警监视雷达PHM技术在走向有效的工程化应用方面所面临的状态参数和特征信号难以获取,故障预测技术还不成熟,雷达PHM研制
期刊
心脏听诊和心电图是早期诊断心脏疾病最常用的非入侵和成本效益高的方法。然而,在一些服务缺乏的社区,能够进行心脏诊断的训练有素的医生和医疗工作者的严重短缺加剧了这种威胁,因为心血管疾病的早期诊断变得不太可能。这就需要开发基于机器学习的心脏筛查辅助技术。由于受到环境、不同的数字听诊器间差异以及数据采集协议的影响,心音信号的模式非常复杂,固定模式的特征提取或直接从信号中学习特征不足以实现最终的准确分类。针
学位
<正>智力和智商有什么区别?为什么智力高的人吵架容易输?相同的智商,不同的人生兰根是全美国目前智商最高的人,其智商测定结果在195~210。他自学了高等数学、哲学、拉丁语和希腊语。但是,他在生活和学术上几乎是个失败者:他从小就被同龄人欺负,被继父殴打;大学期间,他认为自己比教授懂得更多,便辍学了,而一生大部分时间都在做体力工作,收入卑微的工作和他的天才头衔形成鲜明对比。奇怪的是,被誉为“原子弹之父
期刊
随着遥感技术的进步,高时空分辨率NDVI时间序列数据在植被监测、城区变化检测等众多领域中均得到了大范围的应用。然而,受到气候条件以及技术和资金等因素限制,在一种卫星传感器上很难获取到同时满足高时间与高空间分辨率的NDVI时间序列数据。本文旨在利用遥感数据时空融合方法来解决上述问题,并获取到了高时空分辨率NDVI时间序列数据。首先,本文选用中国山东省德州市的西北部地区作为研究区域,并通过谷歌地球引擎
学位
目的 探讨老年综合评估(Comprehensive Geriatric Assessment, CGA)在老年慢性疾病患者健康管理中的应用效果。方法 选取2019年1—12月于深圳市龙华区中心医院出院的200例老年慢性病患者为研究对象,利用随机数字表法分为对照组与观察组各100例。对照组采取常规健康管理,观察组采取基于CGA指导的健康管理,两组均随访18个月,对比两组自我管理能力评分、生存质量评分
期刊
随着移动智能终端的普及和网络服务平台的快速兴起,如今,我们每个人都会在各种各样的服务平台拥有着自己的账户。然而由于平台的互斥性,我们很难知道,某两个或多个用户是否是同一个人,如何对跨平台的用户进行识别匹配,即异构网络用户对齐,如今成为了一个有趣且很有挑战的问题。本论文从异构电商平台网络用户对齐的技术和应用层面出发,深入研究电商平台用户关系结构特征和用户兴趣偏好,实现跨电商平台用户对齐以及深入挖掘用
学位
医疗物联网不仅使病人能够更方便地获得医疗服务,也让医生能更加实时、准确地获取病人的身体状况从而制定更高效的治疗方案,但人们在享受医疗物联网带来的便利的同时,如何保障医疗物联网设备的安全通信、如何保障病人的隐私不被泄露都是非常重要的问题。匿名认证与密钥交换协议允许客户端在完成匿名身份认证的基础上与服务器建立起会话密钥,作为一种非常便捷的具有隐私保护的安全技术备受关注。如何设计医疗物联网环境中高效、安
学位