融合多类型辅助信息的网络欺凌检测

来源 :重庆大学 | 被引量 : 0次 | 上传用户:dabei008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,在线社交平台逐渐成为人们日常生活中不可分割的重要组成部分。然而,在社交平台带给人们便利的同时,平台中的欺凌言论也严重影响着人们的心理健康。如何准确高效的从社交平台言论中检测出欺凌言论具有重要研究意义。目前相关的研究主要分为两类,基于文本信息的欺凌检测和融合辅助信息的欺凌检测。前者仅依靠文本特征对言论进行检测,然而网络言论“噪声多,缺乏上下文”的特点给文本特征提取带来困难,导致该类算法无法取得较好的检测效果。为解决这个问题,后者将文本情感信息、用户属性信息、多模态信息和社交平台元信息等作为辅助信息,以补充上下文、提高检测准确率。通过对相关研究工作进行分析,发现目前的检测方法仍存在以下几个问题。问题一:文本特征提取方法难以准确地表示欺凌文本中的“不良文本变体词”。问题二:多数辅助信息具有局限性,导致融合辅助信息的欺凌检测方法适用场景受限。问题三:辅助信息的辅助效果与其特征提取手段紧密相关,需要有效地对辅助信息进行表示学习。本文从以上三个问题出发对欺凌检测算法进行分析研究,主要贡献如下:首先,本文阐述了网络欺凌检测的研究背景,并对研究现状和相关技术进行了详细分析。其次,基于对真实数据集的分析,针对以上问题提出两个欺凌文本检测算法:(1)基于原文情感特征的欺凌文本检测算法:该算法在文本特征的基础上,将原文情感特征作为辅助信息,对评论文本进行检测分析。特别的,针对问题一,提出一个基于局部敏感哈希的文本表示学习方法用于文本特征提取。该文本表示学习方法能够准确表示欺凌文本中的“不良文本变体词”且具有较高算法效率。(2)基于多类型辅助信息的欺凌文本检测算法:该算法在基于原文情感特征的欺凌文本检测算法的基础上,针对问题二,加入元信息作为第二类辅助信息,扩大检测算法适用场景。此外,针对问题三,提出一个基于属性异构信息网络的特征融合技术,高效地对多类型元信息进行融合及表示。最后,在真实数据集上进行了大量的实验,并验证了本文所提算法的有效性。
其他文献
阔叶林广泛分布于我国长江流域南部,由于阔叶林具有森林群落稳定、植被组成丰富以及有较强的涵养水源能力等特点,在我国森林资源中占有独特地位,因此,对阔叶林的空间结构进行合理优化以达到森林效益的最大化,对提高森林群落的生态服务功能和生态环境保护均有着重要意义。本研究通过对都江堰灵岩山阔叶林的乔木树种组成,林木空间分布格局和种间关联性进行分析,发现群落在演替过程中不同林层、主要树种空间分布状态和种群之间空
全球不断变暖,极端降水的频率和强度呈增加趋势,其中区域性极端降水事件的发生与中尺度的天气系统有关,其持续时间长、强度大,易导致区域性洪涝。目前关于区域性极端降水的研究已引起专家学者的关注。本文基于江南地区299个气象站点1961~2018年逐日降水数据,首先运用百分位阈值法确定区域性极端降水,并通过对其天气图的判读确认降水类型,然后利用线性趋势分析和Mann-Kendall突变检验等方法分析各类型
在电力电子设备的研发与设计过程中,利用实时仿真技术进行仿真验证可以缩短设备开发周期,减少研发成本投入。变流器作为一种用于电能变换的电力电子装置在众多领域中发挥着不可替代的作用,而变流器中的三相逆变器应用最为广泛。目前,可用于三相逆变器实时仿真的商业化实时仿真平台被国外公司垄断,系统价格较高,且存在“卡脖子”风险。为此,本文构建了基于FPGA(Field Programmable Gate Arra
糖尿病肾病(diabetic nephropathy,DN)作为糖尿病的主要并发症之一,已成为危害人类生命健康的重大疾病,是导致终末期肾脏病的首要原因。糖尿病肾病会引起肾脏纤维化、水肿、高血压甚至会造成肾衰竭,严重者将会导致死亡。在糖尿病肾病的发病过程中会出现肾小管上皮细胞损伤并发生纤维化的现象,是糖尿病肾病纤维化的重要发病机制。上皮间充质转化(epithelial-mesenchyma1 tra
蜘蛛是蛛形纲蜘蛛目的一类动物,是陆生动物中除昆虫以外最大的类群,而蜘蛛目则是蛛形纲种类最多的目之一。就生物多样性而言,蜘蛛目的种类位于昆虫纲的5个大目(双翅目、鞘翅目、鳞翅目、半翅目、膜翅目)之后,居第7位。妩蛛是森林生态系统重要的组成部分,是农林害虫的重要天敌。妩蛛因为体色较单一,昼伏夜出等原因,标本不易采集,分类学研究不多,已有文献中部分分类单元的描述不详、鉴别特征图不清,部分物种还未配对。因
由于荧光分析法具有高灵敏度、强选择性以及操作简单、成本较低等优点,很好地满足了分析检测新技术的要求。近几年,在化学与生物传感、生物成像和医疗诊断等领域得到了非常广泛的应用。同时,量子点因其具备良好的生物相容性、优异的光学性能成为生物医学领域备受期待的新一代荧光标记物,并成为荧光分析方法的研究热点。第1章:绪论首先,对荧光现象的产生、荧光分析方法的分类以及应用进行了简单介绍;其次,简要论述了量子点的
随着机器学习和深度学习技术快速发展,智能图像处理技术已经广泛使用于医疗领域。现代许多有关肺部疾病的研究中,CT(计算机断层扫描)的肺部实质性分割是进行深入研究的核心步骤。目前,在肺部分割各种方法中,监督学习方法达到了最优秀的准确性。但是,这些监督学习方法的训练很大程度上依赖带有标签的大型数据集。另一方面,给CT扫描做标记是一项非常耗时的任务,并且从不同类型的设备获取的不同数据集可能具有各种数据特征
作为七大基础学科之一,化学是自然科学迅猛发展的基础,也是一门社会迫切需要的实用学科。中学化学教育不仅教会学生基础化学知识,更让学生认识到化学与社会、生活、环境、科技及人类健康的联系。但新高考改革后,实际调查发现学生对学习化学的兴趣较低,选修化学的比例不太理想,这种情况在一些教育资源比较匮乏的偏远农村中学中表现得尤为突出。实验是化学的学科特色,运用实验可以提升学生学习动力、拓展学生科学思维,促进学生
[目的]昆虫的翅型分化常见的有长翅型、短翅型和无翅型,翅型特征是研究昆虫进化的重要特征。目前对昆虫翅型的研究报道主要集中在蚜虫、飞虱和竹节虫等类群,而关于蝗虫的研究相对较少。蝗总科昆虫中存在着从能够飞行的长翅型到前后翅完全消失的无翅型等多种长度不同的翅型,这种翅型的多样性是对生存环境适应性产生的权衡对策,无翅或短翅的物种可以将原本用于构建飞行肌的能量更多用于生殖,因此可以更早地产生更多的卵,在一些
中华蜜蜂是一种社会性与经济性兼备的全变态类昆虫,在维持动物及植物生态平衡的同时给养蜂人带来显著的经济效益。其消化道主要承担摄取、消化食物、吸收营养及排泄等功能,但在生长发育过程中消化道易受侵害而使蜂群患病,为蜂农带来极大的经济损失。另外,全变态类昆虫的消化道在变态过程中发生重塑,目前蜜蜂消化道在变态发育过程中的形态特征和超微结构尚无系统性的阐述。因此,开展对不同发育历期的中华蜜蜂消化道形态特征与超