面向社交媒体的反讽识别

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Gwmgdemj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体(Social Media)的高速发展,如Twitter,Reddit,微博等已经在人们的日常生活中扮演的角色已愈来愈重要,网民喜欢并擅长在社交媒体中使用反讽修辞方法来宣泄情感。这种修辞方法的丰富运用给自然语言处理任务带来了明显的困难,会严重影响社交媒体中文本情感分析与观点挖掘等任务的检测准确性,因此面向社交媒体中的自动化反讽识别技术具有重要探索和研究意义。反讽修辞的具体形式多种多样,依据反讽成因可将反讽分为三类,即前后情感矛盾式反讽、场景反讽与其他反讽,其中第一类反讽约占70%。针对社交媒体中的自动反讽识别,本文从基于内容和基于上下文两个方面对社交媒体中的反讽识别技术进行了深入的研究。基于内容的反讽识别又可以称作上下文无关的反讽识别,即不考虑识别目标句的上下文信息,仅从目标句本身出发来判定是否为反讽表达。根据前后情感矛盾式反讽占多数的事实,本文提出了两种上下文无关的识别模型,“词对矛盾”模型与“半句对矛盾”模型。前者针对句中的矛盾词对使用词对注意力机制,该方法计算句中任意两个词的注意力分数从而得到注意力分数矩阵,进一步可得到句子表示,该表示包含了任意两个词的矛盾程度信息,在监督信号的作用下迫使模型特别留意句子中的矛盾词。而后者则针对句子前半句与后半句的矛盾性,利用孪生神经网络模型对“半句对”建模,模型可以发现两半句的不一致性,从而可以推断目标句是否使用了反讽修辞。还可以在孪生神经网络的基础上加入注意力机制,从而使模型突出两个半句中的关键词。可以看出,某种程度上“半句对矛盾”模型是对“词对矛盾”模型的一种改进,即由单一词级别扩展到了多个句(半句)级别,实验证明“半句对矛盾”模型在反讽识别任务中取得了更好的效果。基于上下文的反讽识别算法建立在一种经验理论基础上,即反讽修辞本身是一种上下文有关的表达。广义的上下文包括叙述人的语调、表情、肢体动作,当时的心理状态,文本在长文中的环境,文本的转发、回复、评论情况等。原则上,使用上下文信息可以极大提升自动化反讽识别的准确率上限。本文提出的上下文反讽识别算法以SARC语料库为研究对象,采用了文本内容驱动和上下文驱动的混合建模方法来识别反讽,使用的上下文信息有用户信息和主题信息,前者又可分为用户贝叶斯先验信息和用户写作风格信息。实验证明,加入上下文后的判定算法可以某些评论正确地判定为反讽,虽然它们字面上毫无反讽倾向,因此相较于纯粹内容驱动的算法在识别准确性上有很大提高。
其他文献
以某地铁下穿高铁隧道工程为背景,利用有限元方法,分析地铁与高铁隧道垂直距离和地铁施工顺序对既有高铁隧道受力和变形的影响。研究结果表明:地铁隧道施工期间既有高铁隧道
《微山湖船歌》是牟善平先生和肖江先生合作创作的,取材于微山湖一带流传的“端鼓”腔音乐.全曲共分为四个部分,本文针对四个部分不同的演奏技巧与艺术特色,进行了具体的分析
<正> 一、"偏爱"现象及其危害中小学教师大都由衷热爱自己的学生,他们深知热爱学生是收到最佳教育效果的前提,这一点是应当肯定的.然而学生的水平和素质总是参差不齐的,总有
本文综述了应急救援排障车的发展现状及其重要性,概述了多体系统动力学的主要发展历程、内容及研究方法,总结了拓扑优化的主要解析方法和数值方法。本文对应急救援排障车作业装置关键部件的铰点位置、结构形式及结构尺寸三个特征进行了依次优化。首先,针对作业装置主动力不能有效发挥的问题,以挖掘作业装置挖掘力的充分发挥为目标,以装载作业装置油缸最省力为目标,利用Autodesign工具对两个作业装置的关键铰点的坐标
宽带薪酬作为一种新型的薪酬设计方法.近年来受到我国企业界和理论界的关注。本文在相关文献研究基础上,分析了实施宽带薪酬的条件,论述了宽带薪酬对于我国企业薪酬设计的适
王实甫的《西厢记》、汤显祖的《牡丹亭》、洪昇的《长生殿》以及孔尚任的《桃花扇》,这几部作品在中国古代戏剧史中占有重要地位,对中国戏剧的发展产生了深远影响。但是还有
期刊
当今社会,网络的普及程度越来越高,新媒体也在迅速发展,使得网络舆情呈现出高发多发态势。网络空间不仅是民情民意表达的场所,更是方便政府与公众沟通的一种方式。为应对网络
本文使用明瑟教育收益率方程,根据CGSS(2006)数据,分性别分城乡对教育收益率进行回归分析,比较各收益率差异。估计结果表明,在农村,男性的教育收益率为6.3%,女性的教育收益率
拓扑优化是一种富有创造全新的设计思想能力的基础性的系统方法。无论是工业生产,还是科学研究中,都不断涌现出各式各样富有挑战性的结构设计问题,对结构优化设计方法提出了更高效,更精确,更富有市场竞争力的急切需求。然而,基于像素点的传统拓扑优化方法具有几何边界不清晰,制造困难,设计变量数目大,计算资源耗费巨大等缺点。因此,利用先进的计算机科学技术,发展高效和精确的拓扑优化方法成为未来结构优化领域发展的趋势
<正> 脚手板(又名跳板),在建筑施工中约占木材用量的10%左右。近几年来,国內不少基建单位加强了这方面的试验研究工作,寻求替代木材的途径,并已取得了一定的成绩,钢脚手板便