微网络环境中谣言识别机制研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:wenshicai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博、微信等社交平台的广泛应用缩短了信息传播周期、扩大了信息传播范围,使得谣言造成的影响与危害变得更大,如何识别、进而阻断谣言成为信息传播领域的热点问题。本文基于最大熵模型、改进的最大熵模型和谣言的爆炸性,构建了微网络环境中谣言信息的识别机制。本文主要进行了以下四项工作:第一,将最大熵模型用于谣言识别,并根据谣言的特点确定特征函数,设计实验的训练集,并在不同特征数量下进行了实验,找到了最适合谣言识别的特征数量。通过与支持向量机模型、BP-神经网络模型、贝叶斯模型和K-means算法的谣言识别结果的比较证明,基于最大熵模型的谣言识别准确率与贝叶斯模型和K-means算法相当,仍有改进空间。第二,改进了最大熵模型,提高了谣言识别的准确率。提出了一种新的样本构建方法:中心距离裁剪法,用来解决非平衡数据分类问题中的边界模糊和孤立样本的问题。该方法用带有权重的向量来表示每一条信息,并用向量之间的距离表示信息的相似度,利用样本信息到每一类信息中心的距离来定义孤立点,裁剪边界样本。该方法解决了原始样本孤立点多和边界模糊的问题。提出了一种全新的特征选择方法:差异计算法。该方法充分考虑到了特征出现次数对谣言识别的影响,也充分考虑了在谣言和非谣言两类信息中出现都较多的特征的参考价值较低这一问题,在此基础上计算每个特征的差异值fDC)(,并根据差异值对特征进行排序,选择差异值最大的n个特征用于谣言识别。同时,对最大熵模型的特征函数进行改进,使最大熵模型更适合谣言识别。在构建了基于改进的最大熵模型的谣言识别机制后,本文进行了谣言识别实验,在实验设计中,对训练集的选取进行了改进,并用中心距离裁剪法进行优化,通过实验找到了微网络环境中进行谣言识别的最佳特征数量。将改进后与改进前的最大熵模型实验结果进行了比较,并且与支持向量机模型、BP-神经网络模型、贝叶斯模型和K-means算法的谣言识别结果进行了对比。实验结果表明,通过优化的训练集和特征函数的谣言识别效果明显优于优化之前,并且识别准确率优于其他相关分类方法。第三,对于基于最大熵模型识别谣言结果中分类模糊的信息,基于谣言的爆炸性进行了进一步的识别。建立了谣言制造者和传播者之间的博弈模型以及谣言的on-Trust)ET(Explosi模型,并通过实验找到了传播广泛的谣言所具有的共同特点,即传播广泛的谣言爆炸性值在范围]795.0,695.0[内,因此,谣言的爆炸性值成为谣言识别的重要依据。
其他文献
期刊
伴随着社会经济的快速发展,我国在信息技术的使用方面取得了很大的突破,特别是在电子商务行业体现的尤为突出。当前,在中小型企业当中,电子商务能够带来全新的商务展示平台,改善已有的商业发展模式,进而给企业发展带来新的机遇与挑战,为其经济发展奠定坚实的基础。文中通过研究中小型企业当中电子商务的发展现状,并提出了一系列建议,仅供大家参考。  一、国内中小型企业电子商务面临的挑战与发展现状  (一)电子商务的
在林业建设中,营林建造技术有利于开发我国森林资源的价值、促进林木建设的可持续发展。在森林防火工作中,营林技术的切实高效运用有利于提升森林的火灾防御能力。森林管理部门
近半个世纪以来,世界各国为争夺能源的战争时有发生,且有愈演愈烈的倾向;近期,在我国中部以及东部沿海城市持续出现雾霾天气,突出了环境恶化已相当严峻。因此,能否解决能源萎缩和环
作为影响当今世界发展的大趋势之一,知识经济正在蓬勃兴起。21世纪将是知识经济的世纪。怎样迎接知识经济的挑战,这是各级领导者运筹帷幄的题中应有之义。对此,凤城市委书记
期刊
辩证唯物主义告诉我们:一切事物都是发展变化的。这就要求我们在目前体制转轨时期,党建工作的思路、方法和手段都要适应市场经济的新要求,铁法矿务局晓明矿党委结合企业实际
湖南磷化工总厂直径30m的周边移动式浓缩机,原用于浓缩一200目含量为95%以上浮选后的精矿,现用于浓缩一100目含量90%以上的分级机溢流普钙。由于矿粒变粗,沉降速度加快,当矿浆从浓
期刊
随着服务经济的兴起和发展,全球制造业正在经历从“生产型制造”向“服务型制造”的转变,服务已经成为制造企业重要的收入来源和利润源泉。在“服务型制造”模式下,制造企业