社会化媒体突发热点事件检测及其可信度分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户：winxb

【摘要】

：

近年来，社会化媒体获得高速发展，人们的意见表达空间得到了空前扩展。以微博为代表的社会化媒体正在成为很多热点事件的首发平台，如何快速发现和检测社会化媒体中的突发热点事件

【作者】

：

刘呈祥

【出处】

：

哈尔滨工业大学

【发表日期】

：

2013年期

【关键词】

：

突发热点事件可信度分析社会化媒体谣言发现原创度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来，社会化媒体获得高速发展，人们的意见表达空间得到了空前扩展。以微博为代表的社会化媒体正在成为很多热点事件的首发平台，如何快速发现和检测社会化媒体中的突发热点事件，对舆情分析等应用来说至关重要。同时在社会化媒体中，捕风捉影、造谣生事的情况时常发生，造成恶劣影响。对社会化媒体中的事件进行可信度评估并识别网络谣言，可以降低其不良影响，维护经济和社会稳定。目前，突发热点事件的检测主要通过检测热词来发现事件，在实际应用中往往存在着将周期性突发事件和短时间内集中发布的广告误识为突发热点的问题；在社会化媒体事件可信度分析研究中，目前主要的分析方法有基于可信度排序和基于分类器判别两种思路，但大部分方法未考虑用户的观点和情感倾向性对谣言事件判别的作用。此外，对用户特征的挖掘也存在不足之处。针对以上问题，本文对突发热点事件的检测及其可信度分析方法进行了研究。首先，本文设计实现了一种基于热词识别和原创度过滤的突发热点事件检测方法。首先利用微博的文本内容及其传播特性，挖掘出突发热词。然后对热词进行聚类，形成高度相关的簇，从而发现突发热点事件。此外，本文提出利用话题原创度为主要特征，对在内容和传播规律上酷似热点的广告类事件进行过滤的方法，有效提高了突发热点事件检测的精度。在此基础上，本文研究了基于特征挖掘的事件可信度分析和谣言检测方法。针对检测到的突发热点事件，通过利用事件在文本内容、发表用户特征、话题以及在社会化媒体中的传播特性等特征，构造分类器发现虚假谣言事件。本文的主要贡献包括：第一，本文设计实现了一种利用回顾窗口，综合考虑词语的词频及其增长速度进行热词识别的方法，有效改善了周期性事件误检的问题；第二，本文提出和设计话题原创度指标，并用于对应用环境中常见的广告事件进行过滤，提高了突发热点事件检测准确率；最后，本文提出的利用多视角特征进行事件可信度分析的方法，可以较好地检测社会化媒体中的谣言。文中提出的一系列谣言事件判别特征对相关领域的研究也有很好的促进作用。

其他文献

为迎接第十三届国际档案大会在北京召开本刊编辑部将举办两年的征文活动——《兰台情愫》企盼着您赐稿

1996年9月,第13届国际档案大会将在我国的首都北京召开,这是档案界的大喜事,全国档案工作者正以孜孜不倦的努力工作,豪情满怀地迎接“十三大”在北京的召开。为向全国、向世

期刊

征文活动编辑部档案界档案工作者兰台云南边疆首都北京报告文学努力工作给奖金

守望与轮回——观动画片《大鱼海棠》有感

<正>国产动画片曾经在20世纪60年代和80年代两次出现艺术创作的高峰,许多脍炙人口的动画作品相继问世,《大闹天宫》、《哪吒闹海》等国产动画史上的经典,时至今日,人们依旧津

期刊

动画片《大鱼海棠》动画产业

在ICU中采集桡动脉血标本和足背动脉血标本的临床比较

目的探讨足背动脉与桡动脉穿刺抽取动脉血的临床效果比较,寻找最佳穿刺部位。方法对2013年2月~10月共计568例入院呼吸科ICU的患者进行不同部位动脉血采集,将其分为两个组,A组

期刊

桡动脉足背动脉动脉采血血气分析

1960年代初国民经济调整研究

1960年代初的国民经济调整是中国共产党为了纠正“大跃进”以来的“左”倾错误作出的一项重大战略决策,在党史和共和国史上都占有举足轻重的地位。本文从党的政策决策制定和

学位

中国共产党调整执政能力决策

解放战争时期中共军队社会形象建构

解放战争时期的亲历者在媒介上刊发大量有关中共军队社会形象的报道、访谈、评论、诗歌、民谣、回忆录等文本作品,这些内容既蕴含了当事人丰富的情感体验与社会主张,也呈现出

期刊

解放战争中共军队社会形象

党内法规的三重意义与建构逻辑析论——基于政党制度化的视角

制度化是政党政治研究的重要视角,政党制度化的理论与实践都蕴含着党内法规建设的内在指向。党内法规不仅是政党制度化所追求价值目标的直接呈现,也是制度化探索上升为普遍要

期刊

政党制度化党内法规中国共产党

室性早搏对心功能的影响

室性早搏(室早)是临床上最常见的心律失常之一,既往的研究多强调室早的原因、产生机制及引起猝死的危险性[1-3],而对室早所引起的心功能变化研究较少.本文作者从整体上分析了

期刊

室性过早搏动每搏量心排出量心电描述术阻抗

浅析初中语文文言文的教学策略

在初中语文教学中,教师要通过文言文的教学,提高学生们的语文综合能力,让学生扎实的掌握文言文的学习规律,提高他们在语文学习活动中的积极性,文言文教学要注重直观生动,要让

期刊

初中语文文言文教学语文教学Junior middle school ChineseClassical Chinese Teachingteaching o

论“脑室为腑”

脑室腑与脑髓脏耦合，共同组成脑奇恒之腑，成为一身神机之主枢。脑室腑与脑髓脏相关，属于心主与三焦的表里关系之一，其功能分属于全身脏腑系统。脑室腑的生理特性为中空似腑、畅通

期刊

脑室膜脑脊液脑屏障脑室腑

基于金融大数据的客户风险评估及预测

随着互联网金融行业的快速发展,银行业对于数据挖掘和机器学习技术的运用越来越多。基于银行数据库中的客户个人信息、交易信息、账户资产信息等数据,银行可以挖掘出很多潜在

学位

金融大数据机器学习客户画像流失预测可视化

社会化媒体突发热点事件检测及其可信度分析方法研究

与本文相关的学术论文