社会化媒体突发热点事件检测及其可信度分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:winxb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,社会化媒体获得高速发展,人们的意见表达空间得到了空前扩展。以微博为代表的社会化媒体正在成为很多热点事件的首发平台,如何快速发现和检测社会化媒体中的突发热点事件,对舆情分析等应用来说至关重要。同时在社会化媒体中,捕风捉影、造谣生事的情况时常发生,造成恶劣影响。对社会化媒体中的事件进行可信度评估并识别网络谣言,可以降低其不良影响,维护经济和社会稳定。目前,突发热点事件的检测主要通过检测热词来发现事件,在实际应用中往往存在着将周期性突发事件和短时间内集中发布的广告误识为突发热点的问题;在社会化媒体事件可信度分析研究中,目前主要的分析方法有基于可信度排序和基于分类器判别两种思路,但大部分方法未考虑用户的观点和情感倾向性对谣言事件判别的作用。此外,对用户特征的挖掘也存在不足之处。针对以上问题,本文对突发热点事件的检测及其可信度分析方法进行了研究。首先,本文设计实现了一种基于热词识别和原创度过滤的突发热点事件检测方法。首先利用微博的文本内容及其传播特性,挖掘出突发热词。然后对热词进行聚类,形成高度相关的簇,从而发现突发热点事件。此外,本文提出利用话题原创度为主要特征,对在内容和传播规律上酷似热点的广告类事件进行过滤的方法,有效提高了突发热点事件检测的精度。在此基础上,本文研究了基于特征挖掘的事件可信度分析和谣言检测方法。针对检测到的突发热点事件,通过利用事件在文本内容、发表用户特征、话题以及在社会化媒体中的传播特性等特征,构造分类器发现虚假谣言事件。本文的主要贡献包括:第一,本文设计实现了一种利用回顾窗口,综合考虑词语的词频及其增长速度进行热词识别的方法,有效改善了周期性事件误检的问题;第二,本文提出和设计话题原创度指标,并用于对应用环境中常见的广告事件进行过滤,提高了突发热点事件检测准确率;最后,本文提出的利用多视角特征进行事件可信度分析的方法,可以较好地检测社会化媒体中的谣言。文中提出的一系列谣言事件判别特征对相关领域的研究也有很好的促进作用。
其他文献
1996年9月,第13届国际档案大会将在我国的首都北京召开,这是档案界的大喜事,全国档案工作者正以孜孜不倦的努力工作,豪情满怀地迎接“十三大”在北京的召开。 为向全国、向世
<正>国产动画片曾经在20世纪60年代和80年代两次出现艺术创作的高峰,许多脍炙人口的动画作品相继问世,《大闹天宫》、《哪吒闹海》等国产动画史上的经典,时至今日,人们依旧津
目的探讨足背动脉与桡动脉穿刺抽取动脉血的临床效果比较,寻找最佳穿刺部位。方法对2013年2月~10月共计568例入院呼吸科ICU的患者进行不同部位动脉血采集,将其分为两个组,A组
1960年代初的国民经济调整是中国共产党为了纠正“大跃进”以来的“左”倾错误作出的一项重大战略决策,在党史和共和国史上都占有举足轻重的地位。本文从党的政策决策制定和
解放战争时期的亲历者在媒介上刊发大量有关中共军队社会形象的报道、访谈、评论、诗歌、民谣、回忆录等文本作品,这些内容既蕴含了当事人丰富的情感体验与社会主张,也呈现出
制度化是政党政治研究的重要视角,政党制度化的理论与实践都蕴含着党内法规建设的内在指向。党内法规不仅是政党制度化所追求价值目标的直接呈现,也是制度化探索上升为普遍要
室性早搏(室早)是临床上最常见的心律失常之一,既往的研究多强调室早的原因、产生机制及引起猝死的危险性[1-3],而对室早所引起的心功能变化研究较少.本文作者从整体上分析了
在初中语文教学中,教师要通过文言文的教学,提高学生们的语文综合能力,让学生扎实的掌握文言文的学习规律,提高他们在语文学习活动中的积极性,文言文教学要注重直观生动,要让
脑室腑与脑髓脏耦合,共同组成脑奇恒之腑,成为一身神机之主枢。脑室腑与脑髓脏相关,属于心主与三焦的表里关系之一,其功能分属于全身脏腑系统。脑室腑的生理特性为中空似腑、畅通
随着互联网金融行业的快速发展,银行业对于数据挖掘和机器学习技术的运用越来越多。基于银行数据库中的客户个人信息、交易信息、账户资产信息等数据,银行可以挖掘出很多潜在