基于注意力机制的诈骗新闻头条检测

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:alangao12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在线社交媒体平台和即时通讯服务是新闻传播的理想场所,但正面临着诈骗新闻头条肆意散布的严重安全问题。为检测诈骗新闻头条,以往检测方式主要是非常损耗劳力的人工审核,而在新闻头条数据总量到达百万级别的极端情况下,人工审核新闻头条真实性已经不具有现实意义的可行性。并且常规机器学习模型在大规模文本数据处理方面的表现难言理想。然而,目前对新闻头条文本数据而言,长短时记忆(Long Short-Term Memory,LSTM)神经网络以及深度学习领域中的注意力机制(Attention Mechanism)具有较为强大的处理能力。本文提出全新的深度学习文本分类模型,基于LSTM网络及其注意力机制和谷歌Transformer模型特殊的多头注意力机制,可以高效拟合新闻头条上下文信息,从而更加快速准确地检测诈骗新闻头条。本文主要的研究内容与贡献如下:(1)诈骗新闻头条及其文本数据预处理:介绍诈骗新闻头条,分析其安全威胁,比较其典型示例。对原始新闻头条数据进行文本数据预处理,将原始文本数据转化为适配深度学习分类模型的数据形式。(2)检测诈骗新闻头条的LSTM模型及其注意力机制:引进词嵌入层,利用LSTM神经网络及其注意力机制,构建全新的深度学习分类模型,相比于常规机器学习分类模型,大幅优化新闻头条分类表现,能更加快速准确地检测诈骗新闻头条(准确率:85.6551%)。(3)检测诈骗新闻头条的Mini-Transformer模型:引进词嵌入层,在谷歌公司推出的Transformer机器翻译模型的基础上,简化其神经网络结构,保留其编码器部分,删除其解码器部分,避免任何循环运算单元或卷积运算,完全利用多头注意力机制和全连接层,构建全新的Mini-Transformer文本分类模型,进一步提升诈骗新闻头条检测表现(准确率:86.5692%)。
其他文献
钒是一种拥有优异物理性质和化学性质的金属,常用于化工、冶金和材料等领域。钒也存在于动植物当中,是生命必须微量元素。进行钒的形态分析能够准确了解工业和生物中的钒含量及分布,这对工业发展、环境保护、地球化学等都具有重要意义。目前,国内外钒的定量分析主要在全钒量上,关于同时分离、测定不同价态钒的研究较少。因此,有必要建立一种高效灵敏,适用性广泛的钒价态分析方法。高效液相色谱法是一种常用的形态分析方法,具
从2019年9月新学期开始,全国的各省、市逐步开展新课程、使用新教材。本文对人民教育出版社2019年出版的新教材《普通高中数学教科书A版》进行研究(以下简称人教版),主要研究必修册中提问(问题提出)情况。本研究一定程度上弥补了对于高中数学教科书中提问研究的不足,并为一线教师在课堂教学中更好的理解和使用教科书提供了帮助,更为教科书的编者提供了编写思路。本文研究问题为教科书中的提问的数量、功能与质量。
随着汽车、家电、装备制造、通讯基础设备等产业持续快速发展,我国压铸产品数量逐年攀升,压铸行业进入了稳定增长的新常态。同时,人们对节能环保日趋重视,部分压铸行业呈现以铝代钢、代铁的趋势。铝合金压铸作为压铸行业中越来越重要的一类,竞争环境日益激烈,市场对铝合金铸件的生产要求逐渐向高效率、高质量、低能耗发展。在这样的背景之下,许多铝合金压铸车间为提高生产效率、减少能源浪费,推行了精益生产,但是大部分车间
随着云计算的发展,信息业务系统和应用上云已经成为了主流。目前,有很多大型系统都运行在公有云与私有云或者本地基础设施相结合的复杂混合云环境中。在这样复杂的混合云环境中,对系统进行实时监控和运维数据采集,并通过采集到的数据进行异常检测和故障定位是一件困难的事。在这样的背景下,本文结合混合云系统的特点,设计了一个通用的实时监控和数据采集框架。通过在混合云系统“功夫编程”中部署上述框架,证明该框架的通用性
随着人类社会的不断发展,电化学生物传感器和超级电容器对于生命科学检测和清洁能源的开发具有重大的研究意义。在电化学传感与储能领域,高效的电极材料起着至关重要的作用。本文主要讨论了具有特殊结构的KCu7S4纳米材料的衍生及其复合结构在葡萄糖传感器与超级电容器中的应用,深度分析了活性电极材料的组成和结构对最终电化学性能的影响。本文的研究内容如下:(1)一维KCu7S4纳米线为自模板,简单的水热法加以辅助
随着物流运输业信息技术水平的不断提高,物流运输需求越来越趋于信息化、多样化发展。目前,物流运输对装箱利用率的关注度越来越高,并且对常规物品的装箱已有较好的研究基础,对圆柱体等非常规物品仍依靠经验装箱,提高圆柱体等非常规物品的装箱利用率存在迫切的需求。因此,本文从该角度出发,研究了圆柱体等特殊物品的混合装箱方案,同时为保证运输过程的安全性,提出在整合重心偏移量条件下更加合理的装箱方案。为确定圆柱体物
本文主要介绍了以地球丰度高、价格低廉、低毒和独特催化性能的铁为催化剂,开发了一种对芳基C-N、C-O键的惰性键断裂反应合成芳基硼化产物的方法。用富电子的配体、强碱的催化体系,实现了对稠环体系,萘环体系以及单苯环体系的惰性C-O键的硼化反应。第一部分:铁催化下芳基C-N键的硼化研究通过对芳基C-N键的活化进行探索,合成一系列在镍催化C-N键转化反应中有较好研究的芳基C-N衍生物,在醋酸亚铁为催化剂,
自闭症谱系障碍(Autism Spectrum Disorder,ASD),其核心症状为社会交往障碍、狭隘兴趣和重复刻板的行为方式,是一组起源于儿童早期的神经发育性障碍的统称。社会情绪能力是社会性互动的基础,也是其社交能力缺陷的核心。对自闭症儿童开展社会情绪能力干预训练,能够改善其行为。科学的评估能够指导干预,确保干预的有效性。目前国内社会情绪能力评估工具较少,且对评估要求高,评估过程繁琐等问题。
360 VR视频能够全方位记录周围的环境,使用户在捕获的场景中以交互的方式环顾四周,为用户提供360度逼真的沉浸式体验。与计算机建模生成的3D场景相比,拍摄360 VR视频可以非常快速地捕获到沉浸式的内容。因为这一特性,360 VR视频在很多领域有着潜在的应用,例如VR教育/训练、VR游戏、VR电影、VR博物馆/导游、VR体育直播等。360 VR视频面临着诸多挑战。首先,相比于平面视频,传输高质量
言语产生缺陷不仅是构音问题,也包括言语韵律、呼吸、发声和共鸣障碍的缺陷。言语流利性(Speech Fluency)指个体运用口语表达传递信息的流利与熟练程度,主要表现为语速、停顿、拖延、重复等言语行为,是衡量个体言语韵律功能的重要标准,良好的言语流利功能可直接提升说者的言语清晰度与听者的言语可懂度。个体言语流利性障碍通常表现为语速偏慢、停顿不当、拖延、异常重复、插入语等异常形式,严重影响正常的社交