网络虚假新闻检测系统的研究与实现

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:dannychan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的进步,人们获取新闻的方式也随之发生改变,更倾向于通过网络平台获取新闻信息。网络新闻同传统的新闻相比有着较快的更新和传播速度,此外新闻的发布平台也更加多样化,在为人们带来便利的同时也使得新闻的真实性无法确定。虚假新闻具有较强的影响力,如果人们误信并进行传播,轻则造成群众的误解引发负面情绪,重则将会影响社会稳定。因此本文研发了网络虚假新闻检测系统,辅助新闻机构和媒体平台及时识别虚假新闻,阻止虚假新闻的传播,降低其影响力,从而达到维护社会稳定,促进社交网络健康发展的目的。本文仔细分析了国内外关于虚假新闻检测的研究现状,发现在特征选择方面,大多数研究提取的都是一些比较浅显的基于统计的特征,而忽略了新闻文本自身的特征。因此本文在原有的特征基础上,提出了基于文本内容自身的情感倾向性,虚假相似性特征、以及评论的情感类别特征,将提取的特征进行集成,作为SVM模型的输入特征训练分类器,实现对虚假新闻的识别。本系统实现的主要功能模块是新闻数据和评论数据的获取、新闻数据的检索与分析、网络新闻的虚假性检测、虚假新闻数据可视化。在本系统中,首先通过TextRank算法对文本进行主题词提取,根据主题词找到对应的虚假新闻文章;其次使用余弦相似度算法计算待检测新闻文本与相应虚假新闻文本的相似度,提取出新闻文本的相似度特征;然后需要对新闻文本和评论进行情感分析,提取出新闻文本的情感倾向特征以及评论的情感类别特征;最后将提取出的新闻文本特征、评论的特征以及基于统计的用户特征构造成特征向量,并对SVM分类器中c和gamma进行优化,使用优化后的值对数据进行训练得到检测模型,在系统中使用该模型对新闻数据进行检测,从而实现对虚假新闻的识别。
其他文献
【正】 1988年10月20日,东禅四村八社关贵和,5岁,约60公斤母猪于9月28日产仔,10月3日晚直肠脱出,约12厘米,未及时就诊,10月7日整复缝合固定,未投药。10月19日,肛门部肿大,排
自我表露是指个体将有关自己的信息告知目标人的过程,“热情”与“能力”是人们进行社会认知的核心内容,也是区分各类刻板印象的核心维度,“热情”与“能力”可以通过自我表
目的:了解高职医学生吸烟状况和相关知识知晓情况,为开展无烟校园建设提供基线资料。方法:采用问卷调查法对1280名在校高职医学生吸烟行为进行调查。结果:调查的1280名高职医学生
贵州省日前出台《省人民政府办公厅关于打造“黔系列”民族文化产业品牌工作方案》,积极构建具有贵州特色的民族文化产业品牌体系,切实把贵州省从“非遗”资源大省打造为民族特
内蒙古大兴安岭林区莱姆病的临床研究内蒙古大兴安岭林业中心医院(牙克石,022150)李华,曹长江,杨丽清,王琦中国预防医学科学院流行病学微生物学研究所张哲夫,万康林内蒙大兴安岭林区被确认
<正>~~
期刊
生物活性玻璃由于其特有的化学组分以及无定型结构,使其具有良好的生物相容性,生物传导性以及生物诱导性,在骨修复及牙齿修复领域具有重要的应用。然而生物活性玻璃作为药物
中国煤炭机械与电气专家委员会2009年年会于11月26日在海南博鳌召开。该会委员及相关煤炭行业专家共计37人参加了会议。中国煤炭工业协会科技发展部刘峰部长亲临会议,并做了重
在湖北省人民政府与教育部签订共建武汉城市圈教育综合改革国家试验区协议后,湖北瘩教育厅采取了一系列措施,推进协议贯彻落实。文章就如何全面贯彻落实省部共建协议有关职业教