面向舆情监控的虚假网络信息过滤平台的研究与设计

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:linli8010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会信息化程度不断加深,网络舆情与人们的日常生活变得密不可分。面对我国数量庞大的网络群体,部分别有用心的组织机构雇佣水军,对一些社会敏感的焦点和热点,匿名地发表诸多具有导向性的观点,进而引导话题偏向错误的方向,不利于社会的安定以及发展。因此,目前利用计算机技术对网络舆情进行监控已成为热门领域并具有一定的社会价值。本文就网络舆情监控系统关键技术中的虚假网络信息的过滤进行探究。作为虚假网络信息的主要组成部分,虚假评论对社会同样具有一定的危害,因此急需对虚假评论进行识别。对虚假评论的识别主要是提取评论内容特征,并采用传统的机器学习算法来实现的识别虚假评论。由于传统的机器学习多数为浅层结构,无法实现复杂的文本表述。此外,由于虚假评论不仅仅反映在了评论内容本身,同时也体现在了发表虚假评论的评论者的行为上,因此,单一的从文本内容属性的角度出发,无法完全考虑虚假评论具有的特性,这可能会导致特征的流失,进而影响虚假评论的识别效果。本文使用深度学习框架中的卷积神经网络(Convolution Neural Network,CNN),对虚假评论进行识别。对从大众点评网上获取到的酒店数据进行标注,得到有标签的数据集。随后,对获取到的数据集进行中文分词、去停用词等预处理工作,并使用word2vec工具的Skip-Gram模型得到词向量。在CNN模型的构建上,本文从文本内容特征以及用户行为特征两方面出发,提出了基于二者混合特征的虚假评论识别模型。同时,考虑到了文本的语序因素,本文对传统的卷积神经网络进行了改进,使得卷积神经网络更加适用于虚假评论识别。经实验验证,本文提出的模型在虚假评论识别上取得了较好的效果,可以作为一种有效的虚假信息过滤的研究手段应用于实际工作中。
其他文献
轨道交通运输是目前人们的主要出行手段,随着轨道基础建设的现代化发展,作为保障列车行车安全的轨道交通车辆状态信息化技术也紧跟发展。现今中国的轨道交通,特别是轨道交通
微弱信号检测技术在不同领域具有广泛的应用,例如无线通信、故障检测、雷达系统、地质学和生物医学等。微弱信号检测的对象是常规和传统方法不能检测的微弱量。随着科学技术
大量研究表明,融资约束会导致中国全要素生产率(TFP)的大量损失。对这一损失的解释是,中国的资本市场不完善,造成了资本配置扭曲。私有企业比国有企业更具生产力,但却对内部融资的依赖性较强。融资约束是衡量企业在外部融资时难易程度的指标,一定程度的融资约束会导致资本错配和全要素生产率(TFP)的损失。Hsieh&Klenow(2009)研究了中国在资源利用方面的不匹配状况,并指出中国如果能实现美
少数民族农村地区由于师资有限,英语教学方法比较落后,加之环境等因素的影响,导致初中英语教学有效性较低,难以系统地教授学生英语知识,因而学生英语成绩不高,更不要说英语综
随着肉鸡生长速度和饲料转化效率的不断提高,鸡肉产品的品质问题日益突出,难以满足消费者对优质畜产品日益增长的需求。肌内脂肪(Intramuscular fat,IMF)作为改善鸡肉品质的
2003年11月18日,我国国家体育总局宣布把电子竞技列为我国的第99个正式体育运动项目。电子竞技运动是一项以现代信息技术为核心的体育运动,并以其新颖的竞技方式以及独特的竞赛风格,不断的受到社会各界的帮助和认可,并且深受群众喜爱。为促使电子竞技运动在我国能够长期不断的发展,电子竞技运动在我国被认定成体育项目以后,国内开展了多种项目、多种规模的电子竞技职业赛事,电子竞技职业赛事的发展状况是决定电子竞
目的调查分析体检中心甲状腺结节患者的流行病学特征及危险因素,为临床预防治疗提供理论支持。方法随机选取2016年3月至2017年3月体检中心进行体检的1 678人作为研究对象,其
土生空团菌(Cenococcum geophilum Fr.)是一种重要的外生菌根真菌,具有突出的抗旱性。其地理分布和寄主范围都非常广泛。目前,国内关于土生空团菌遗传多样的研究还很少,因此,
近期,随着美国联邦储备委员会12.16日宣布将联邦基金利率上调25个基点到0.25%至0.5%的水平,人民币兑美元中间价报6.9508元,这是人民币自2014年开始贬值以来,八年半来的最低水
本论文工作包括两个部分:1.伏立康唑合成。伏立康唑是一种新型的三唑类广谱抗真菌药物。本文介绍了抗菌药物的作用机制和伏立康唑的合成进展。首先2-氟丙酰乙酸乙酯与醋酸甲