基于深度学习的在线社交网络上的科学谣言检测和谣言追踪研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:successfully_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网基础设施和移动互联网技术的发展,在线社交媒体方兴未艾。社交媒体上的海量信息中包含了大量的未经确认或已确认但不为所有用户所知的谣言信息,这些谣言可能会蒙蔽公众的认知,误导人们的生活。本文把在线社交网络上的谣言分为科学谣言和社会谣言两大类。科学谣言是指澄清时需要相应的专业知识的谣言,除此之外的谣言归结为社会谣言。针对使用技术手段进行科学谣言检测、科学谣言数据量的匮乏限制了检测模型的能力、谣言追踪等本文进行了深入的探索。本文的主要工作如下:1)本文提出了科学谣言相对影响力指标用于量化在线社交网络上科学谣言的影响力,这可以证明使用技术手段对科学谣言进行检测的必要性。量化科学谣言的影响力并探索使用技术手段检测科学谣言尚属于空白的领域。2)本文构建了一个用于进行科学谣言检测的数据集,其中包含三类数据:科学谣言、社会谣言和非谣言文本。据作者所知,这是第一个用于科学谣言检测的数据集。3)本文基于长短期记忆网络(Long Short-term Memory,LSTM)提出了一个模型用于科学谣言检测。本文的工作可以为在线社交网络上科学谣言的检测提供一个基准,本文提出的模型与多个基线模型相比体现了极大的竞争力。4)针对科学谣言数据缺乏的问题,本文提出从生成科学谣言的角度来检测科学谣言。本文基于Transformer和LSTM模型提出了一个科学谣言生成模型,并借用生成的数据来提高检测模型的能力。本文提出的模型可以在词汇表空间中采样并生成语义连贯的科学谣言,生成的数据对于所有的检测模型都有显著的促进作用。此外,本文的模型摆脱了基于编辑的模型必须指定编辑次数的局限性。5)本文基于对比学习和BERT模型提出了Sim CLRT模型用于谣言追踪,Sim CLRT包含Sim CLRT-CNN,Sim CLRT-RNN,Sim CLRT-Linear三种变体。Sim CLRT不仅可以对含有推文数量较多的事件进行追踪,并且可以对含有推文数量较少的事件倾注足够多的关注。Sim CLRT在本文所用的两个通用谣言追踪数据集上取得了最先进的结果。
其他文献
近年来,随着国内外众多数字化技术发展的突飞猛进,企业基于这些新技术制定其自身转型发展战略的需求也尤为突显。工业4.0、中国制造2025、工业互联网这些国家级发展战略的提出,也为企业基于数字化转型发展提供了良好的外部环境和巨大的机遇。然而企业对其数字化转型发展战略制定的急迫性和必要性,目标以及转型发展路径尚不清楚,特别是数字化转型发展的内容体系和保障措施。本文以V公司为例进行研究。首先,对大量战略管
学位
审美趣味的标准问题历来存在争议,从休谟到康德,再到布尔迪厄,大致形成了三种经典的趣味标准:第一,以休谟为代表,以普遍性和差异性为原则的“经验”趣味标准;第二,以康德为代表,以个人性和群体性为原则的“共通感”趣味标准;第三,以布尔迪厄为代表,以必然性与一致性为原则的“阶层性”趣味标准。从社会学的角度出发,布尔迪厄探讨了三种不同的审美趣味:即统治阶级、中产阶级和被统治阶级的趣味,这三种阶级阶层的趣味由
期刊
对于基因序列的分析是生物信息学研究中基础且重要的部分,随着生物序列数据迅速增长,基因序列相似性分析的速度成为批量数据分析的瓶颈。为了提高基因序列分析及分类的速度,本文引入变值体系作为理论基础,探索序列相似性分析方法。论文将变值体系理论与非对齐序列相似性分析方法结合,由变值测量方法统计选定序列的变值测度,得到序列测度特征,以序列测度特征为基础,对序列进行差异对比及分析。分析模型的结果展现方式主要有三
学位
2021年伊始,全球化工产业链出现供应短缺、基础原材料价格大幅上涨的局面。由于极端寒潮天气而停产的墨西哥湾石油炼化基地成为导火索,全球多个关键化工原料供应短缺导致大量化工厂关停。叠加新冠疫情持续传播导致物流、人工等成本持续增加,使得化工原材料价格大幅上涨,最终导致制造业成本大幅增加,行业上下游格局不断变化。供应不足、断货、价格暴涨成为行业的常态,企业面临巨大的挑战,迫切需要优化营销策略以适应市场变
学位
随着中国经济社会的持续高速发展,党和政府逐渐明确了积极发展普惠金融的政策,并将大力发展普惠金融列入政府的重点工作。近年来,我国普惠金融发展取得了明显进步,国内的金融机构也都积极响应国家号召,降杠杆、稳发展,脱虚向实、赋能实体,解决融资困难,改善生活质量、激发市场活力,众多小微企业都获得了普惠金融的服务,普惠金融所带来更广阔的市场,同时也变成了金融业争夺的焦点。在如此背景下,商业银行作为传统银行业的
学位
人体口服生物利用度是人体口服药物研发中最重要的药代动力学特性之一。准确预测候选药物的人体口服生物利用度能够减少口服新药研发中的资源消耗。目前,常使用基于特定计算方法或基于专家定义的分子描述符结合机器学习算法构建预测模型。这种方式不仅需要手工抽取分子描述符,增加了工作量,而且不会为口服药物研发带来新见解和新思想。近年来,图神经网络因其能够天然建模分子结构信息而被广泛应用在分子性质预测中,但先前提出的
学位
现今,人工智能技术在计算机视觉、自然语言处理等领域所取得的研究成果,在不知不觉中融入了人们的日常生活。随着深度神经网络精度的不断提高,深度神经网络的安全性也引起了人们的重视,不少研究者都证明了深度神经网络的易损性,发现在样本中添加微小扰动生成的对抗样本会使模型分类发生错误,甚至能使样本被分类为攻击者指定的特定目标,给深度神经网络带来了极大的安全隐患。同时对抗样本的出现对于深度学习来说也是一种机遇,
学位
目的 了解1990—2019年江苏省白血病疾病负担变化趋势,为江苏省白血病防制工作提供依据。方法 通过2019年全球疾病负担研究(GBD 2019)数据库收集1990—2019年江苏省白血病患病率、发病率、死亡率和伤残调整寿命年(DALY)率等资料,并采用2000年中国人口年龄结构标化。计算平均年度变化百分比(AAPC)分析白血病疾病负担变化趋势。结果 1990—2019年江苏省白血病年均标化患病
期刊
企业的融资方式可以分为直接融资与间接融资两种,而由于间接融资存在着诸如融资成本高、融资手续复杂等问题,我国长期以来以间接融资为主的融资结构已无法很好地满足我国企业对于营运资金的需求。为进一步丰富企业融资渠道,提高直接融资所占的比例以降低社会整体融资成本,2010年我国银行间市场交易商协会在原有的短期融资券基础之上,为高信用评级的企业主体创设了期限更短、发行更加便利的超短期融资券。经过十余年的发展,
学位
药品质量管理是研发与生产全过程中的重点工作,只有满足质量要求才能通过申请注册。本文将对药品研发与生产全过程中的质量管理方法进行研究,首先分析了研发阶段药品质量管理的流程和内容,然后对药品生产阶段的质量管理原则和方法进行探讨,以期促进药品质量水平的提升。
期刊