基于深度学习的微博内容可信度评估研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:Euphemia123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博的快速发展使得信息的传播更加快速和便捷,但是虚假信息的传播可能会对广大网民产生负面影响,造成平台管理困难,社会动荡,严重情况下甚至会对国家的发展造成冲击,因此对微博中的内容进行可信度评估具有重要意义。在充满数据的时代,深度学习技术中的循环神经网络、卷积神经网络等模型具有出色的数据挖掘能力,通过对已有数据进行特征挖掘,预测新数据的可信情况,但是微博中蕴含大量不同类型的数据,在特征挖掘时还存在一系列问题。本文提出的模型按照微博的内容数据、用户数据和传播数据展开,依据各种数据类型存在的问题进行研究,提出了三种基于深度学习的微博内容可信度评估模型,解决对应问题的同时提高了模型在准确率、F1值等评价指标上的评估能力,本文的主要贡献如下:1.提出基于协同关键点的微博内容可信度评估模型,解决基于内容数据的可信度评估模型在特征选取时存在的不确定性问题。该模型从词语级到句子级分级获取微博文本的关键点,根据关键点的语义进行可信度评估。此外,在词语级编码时协同构建的谣言词库加强相关词语的语义,模型解决了特征挖掘时的特征选取问题,在此基础上提高了内容可信度评估的性能。2.提出基于情感极性影响力的微博内容可信度评估模型,解决了当在基于内容数据的方法中引入用户数据时容易忽略语义特征和用户特征的空间差异问题。情感极性影响力可以通过微博内容中的语义特征和评论内容中的情感特征解析评论中的情感极性与微博内容的相关程度,获取源文本的可信情况。模型利用双向-局部信息处理方法,提取微博内容语义特征;利用双向长短期记忆网络挖掘评论情感特征;利用注意力机制捕获评论中不同情感极性对于微博内容的影响程度,将得到情感极性影响力用于微博内容可信度评估。将用户特征和语义特征使用合适的方法调整至同一维度,并提高了评估性能。3.提出基于加强路径的微博内容可信度评估模型,解决了当在基于内容数据和用户数据的方法中引入传播数据时容易忽略语义特征、用户特征和传播结构三者之间的内在联系的问题。该模型将微博文本进行句法和语义分析处理,模型中的输入是一个以微博源文本为根节点的传播树,每个子节点都对应一条评论文本,通过传播树双向结构的递归特征学习过程获取微博文本的内容语义、用户立场和传播结构之间的响应关系,进行更细化的内容可信度评估。
其他文献
随着在线社交网络上的用户越来越多,从而导致恶意用户和可信用户混杂在一起,使得人们获取信息成本和分辨用户的成本急剧增加。在这种情况下,在线社交网络用户可信度的研究对提高用户信息获取和用户分类具有十分重要的意义。目前,在线社交网络用户可信度研究已经得到了广泛的研究,但现有的研究工作中还存在以下问题:在用户可信度信息量化的研究中,海量的用户节点、用户信息数据特征的多样性和单维度用户信息的稀疏性,使得在用
学位
当前,随着数据分析技术、机器学习等信息技术的快速发展和应用,信息技术为人们解决一个又一个模糊、复杂的问题。为了对这些难以判定的问题做出清晰的评价、研究产生问题的因素对于决策目标的影响程度。因此,绩效评价方法开始受到研究者们的广泛关注。同时,通过对绩效评价结果的优劣来衡量在完成决策目标的执行过程中存在的不足,并根据评价结果对过程环节进行分析,以期拟补不足,达到提高绩效评价结果的目的,从而推动预定绩效
学位
粒子群算法PSO(Particle swarm optimization)是从自然界生物活动和群体觅食过程中获取灵感,而演变成的一种随机搜索算法。凭借其结构简单、寻优速度快等优点,现在已广泛应用于科学和工程领域。大量的研究表明,粒子群算法在处理连续空间和离散空间问题时表现出不错的全局搜索能力,但在实际的应用过程中,粒子群算法也存在着随机搜索算法比较普遍的缺点。本文主要对粒子群算法的缺点进行改进研究
学位
随着多媒体、网络技术的发展,图像的应用日益广泛,其成为了互联网中信息的主要载体。但是,由于对图像的质量要求越来越高,导致维数灾难。高维图像数据不仅要占用大量内存空间,而且信息的冗余程度很高,将会影响后续图像识别的性能。特征提取是图像识别中的关键步骤。如何从图像的原高维空间中找出潜在的本质低维结构信息对图像识别等是非常有意义的。低秩表示作为高维数据信息表征的有效工具,在图像识别领域取得了不错的效果。
学位
近年来,随着计算机图像处理技术的不断进步,带动了传统中医新一轮诊疗方式的客观化研究。舌诊是中医望诊领域的主要内容,其诊断方法独具特色,在判断病人病情方面具有极为重要的作用。传统中医辨别舌色、苔色、裂纹等舌象特征,主要通过中医师的视觉观察和经验分析,所以在判断标准上,会受到诊治医生主观因素和周围环境等因素的影响。这些因素制约了舌诊的应用与发展,所以使舌诊信息客观化,诊断标准化是当前舌诊自动化研究的重
学位
随着现代制造业的不断发展,我国工业生产领域逐渐地趋于自动化,电网是工业生产领域发展依靠的基础,而变压器的稳定运行是维护电网安全的关键。因此,加强变压器运行状态的检测,及时发现其潜伏性故障,并制定具有前瞻性、预见性的故障诊断策略,对于提升电网的安全可靠运行具有重要的意义。通过对变压器故障诊断方法的深入研究,为解决传统比值法易出现比值边界模糊、编码缺失等问题,弥补智能算法在小样本上易过拟合的不足,论文
学位
纹理是不同的计算机视觉任务和应用程序的重要特征,是人类感知世界的重要视觉线索,和我们的生活息息相关。因为纹理分类在理解纹理识别过程中发挥着重要作用,所以纹理分析的主要问题之一就是纹理分类。在纹理分类任务中,局部二值模式(Local Binary Pattern,LBP)是应用最广泛的一种分类方法。局部二值模式是一种用于提取局部纹理信息的简便且鲁棒的纹理描述符,而且局部二值模式具有光照不变性和旋转不
学位
随着智能电网的快速发展,电网在运行过程中积累了各种类型的巨量数据,运用数据分析技术对这些巨量数据进行分析可以获得很多平时所注意不到的信息,将这些信息用于指导电网运行中的日常工作可以极大的提高电网运行的质量。而电网负荷预测作为电网运行过程中重要的管理手段,预测的精准度直接影响了电网运行的成本、电网运行方式以及电网设备的检修维护计划等。但因为不同地区的电网负荷变化规律是受多种外在因素共同影响的,比如当
学位
语义分割作为图像处理的一个重要基础任务。其基本思想是以像素为单位,将图像中所包含的各类物体逐一进行分类,并把同属一类别的像素标记为相同的颜色。图像语义分割的出现,可以帮助计算机更好的理解图像中所表达的内容。近几年,相继提出了许多基于卷积神经网络改进的语义分割方法,语义分割精度也不断提高。但是大多数的语义分割模型都存在计算复杂、参数过多等缺点。基于以上研究现状,本文以实现分割精度和推断速度的平衡为目
学位
红外目标跟踪作为计算机视觉的一项基本任务,在智能监控、辅助驾驶和红外制导等领域发挥着重要的作用。在实际应用中,红外目标易受到形变、背景干扰以及遮挡等因素的影响,使得红外目标的稳定跟踪成为一项极具挑战的任务。为了增强红外目标跟踪的鲁棒性,本文以孪生网络为基本跟踪框架,从模型训练、特征融合以及遮挡预测三个方面进行研究,具体内容如下:(1)在有限的训练资源下,使用CIOU(Complete Inters
学位