微博网站的谣言检测方法研究

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:wwqewwqe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着社交媒体的兴起,越来越多的人选择借助社交网络来发布和获取信息。许多谣言或不实信息也随之在网络上广泛传播并对群众乃至社会造成了不同程度的影响。因此对社交媒体网站进行谣言的自动检测已经成为一项重要的研究课题,目前的研究都将谣言检测视为分类问题,即通过提取微博/推文在文本内容、用户资料和消息传播等方面的特征,训练监督学习算法得到“谣言”分类器。多数工作仅仅考虑微博/推文在特定时刻下特征的统计数值,却忽略了这些特征在微博/推文传播过程中随时间的“变化趋势”,而这种“变化趋势”往往能为谣言检测提供有价值的信息。本论文针对微博/推文在传播过程中特征随时间变化的趋势,建立了一种新的动态时间序列模型,该模型能对时间敏感的特征进行建模分析。本论文的主要贡献如下:(一)分析谣言和非谣言微博/推文在传播过程中,特征随时间动态变化的曲线所反映出的不同传播模式;(二)将本文提出的动态时间序列模型分别在两个数据集上进行验证,Twitter上的英文数据集和新浪微博上的中文数据集;(三)为验证模型的实用性,本文设定了两种情景:(1)已知特定主题微博的完整生命周期数据,训练“谣言分类器”判断其是否为谣言;(2)已知特定主题微博在其传播早期阶段的数据,本论文将动态时间序列模型应用于对谣言的早期发现。两组实验结果都表明了动态时间序列模型的有效性。(四)将本文提出的谣言检测分析方法应用于Twitter的情感分析任务中,得到了良好的实验结果。
其他文献
目的分析1型糖尿病酮症酸中毒(DKA)患儿的电解质和血脂状况,探讨儿童1型糖尿病低钾血症与酮症和血糖纠正时间的关系。方法对1999年1月1日至2004年12月31期间在本院住院且为首
目的探讨肌钙蛋白I等心肌损伤血清标志物对重症胰腺炎患者预后的影响。方法48例本院收治的重症急性胰腺炎患者,检测其入院48h内的肌钙蛋白I(cTnI)、肌酸磷酸激酶同工酶(CKMB)
絮凝是水质净化的重要方法之一.絮凝剂的作用对象主要是水中由不溶性物质形成的憎液溶胶及悬浮颗粒.近年来的研究发现,将重金属离子的某些强配位基团通过化学反应连接到高分
<正> 近年,理论界的一些同志围绕着社会主义公有制经济中的劳动力是否商品的问题展开了新一轮的争论和探讨,这在理论和实践上都具有重要的意义。我认为,主张社会主义公有制经
随着党的十九大的召开,中国国防和军队建设也进入新的阶段。过去5年,我们取得了举世瞩目的辉煌成就,面对前所未有的巨大机遇,一套与世界接轨同时具有鲜明特色的武器装备建设
报纸
近年来,计算机视觉、语音识别和机器翻译领域深度学习技术取得了极大的成功,其中表示学习领域研究的不断进步起到了很大的作用。表示学习在文本表示、语音等领域贡献极大。学
随着化石燃料储量耗竭与环境问题日益严峻,发展绿色能源体系变得尤为重要。在诸多体系中,锂离子电池因能量密度高,循环寿命长等优点被广泛应用于社会的方方面面。但是,锂资源
本文借鉴国外利率市场化改革的经验与银行风险监管的策略,对我国利率市场化改革中的商业银行风险管理展开探讨,总结利率市场化改革对银行风险的影响,剖析利率市场化条件下银
对23年前设计的中医心理学基础理论的"六论"框架,进行了必要的补充完善和调整,重新提出新的"七论"框架。其中"三才整体论"和"形神合一论"的整体观,是中医心理学基础理论的基
<正>1976年德国著名麻醉科医生美茵次(Meinz)发起并成立了急救和灾害医学俱乐部,之后不久即更名为世界急救和灾害医学协会(World Association for Emergency and Disaster Me