基于社交网络的流感监控和预测算法

被引量 : 0次 | 上传用户:kungm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交网络的出现和不断发展,使得由社交网络产生的数据量不断增大,信息量也不断丰富。基于社交网络进行的数据分析和挖掘的应用越来越多。大数据已经渗透到生活的方方面面,若能有效的利用大数据将会为生活提供更多便利。公共卫生事业作为社会发展的根基与每个人生活息息相关,影响整个社会的稳定和发展。但是,目前对于流行病的监控手段主要依赖临床数据。随着社交网络的普及和数据多样化,我们可以通过分析和挖掘社交网络中相关数据对特定病症进行监控及预测,在保证数据的实时性基础上,可以及时的进行监控和预测,为公共卫生事业提供较早的决策支持和帮助。本文中的社交网络数据主要以新浪微博数据作为主要数据源,以PM2.5数据作为辅助,在国内范围内,针对流行性感冒进行监控和预测。文章考虑流感的潜伏期、发病期等时间因素的影响,以及流行病的传播模式,结合目前数据,分析和研究基于社交网络的流感监控和预测的方法。针对内容繁杂的社交网络数据,本文首先对源数据进行数据预处理,考虑流感的病症特点主要采用关键字过滤技术,获取与流感相关的用户信息,并分别采用KNN分类、朴素贝叶斯分类(NB)和支持向量机(SVM)分类三种分类算法进行比较,将分类效果最好的算法得到的结果集作为研究的核心数据。在监控方面,将核心数据与疾病控制中心(CDC)数据在时间和空间粒度上进行对比,验证社交网络数据的有效性;并考虑空气质量对流感的影响,将PM2.5数据与社交数据进行对比,证明PM2.5数据与流感的关联关系,从而证明通过对社交网络数据进行分析可以用来监控流感现状。在预测方面,主要使用动态贝叶斯算法结合隐马尔科夫模型,考虑社交网络中的社交关系和所处地理位置对流感传播的影响,及流感的周期性和一段时间内的PM2.5指数对流感发病率的影响,将这些影响因素作为模型中考虑的主要参数,在数据量一定的基础上,进行交叉实验对模型的预测效果进行评估。
其他文献
近似商标和类似商品的认定是商标侵权理论和实务中的两大难点。关于商标侵权行为的判定标准,我国以往的商标立法采用“双相似”标准,而学者们则从商标法的立法目的和商标的功
根据体育运动队长期以来存在思想政治工作难做,管理不到位等现象,以笔者从事训练管理工作多年的经验出发,重点阐述了在新的形势下,对做好体育运动队伍政治思想工作的重要性、
目前,盾构法已经成为城市地铁、跨越江海等大型隧道的主流施工方法,其结构的稳定性越来越受到人们的重视。大量盾构隧道,尤其是水下盾构隧道管片衬砌结构在建成一段时间以后(
目的:急性A型主动脉夹层患者术前常伴有严重低氧血症,我们试图明确术前低氧血症危险因素。通过对C反应蛋白(CRP)和白介素6(IL6)在急性A型主动脉夹层(AAD)患者血浆和肺组织的
<正>从山东省茌平县杜郎口中学开始,学校教育正沿着它应有的方向行走。河南省洛阳市西工区西下池小学、江苏省昆山市前景教育集团、山西省晋城市泽州一中等一大批学校,作为第
我国的法治化进程经历了"依法治国"阶段,现在正努力推进法治中国建设。"法治中国"目标的提出,既在理论上丰富和完善了中国特色社会主义法治建设,又在实践上将中国法治建设推
以某电站厂房后缘边坡开挖为工程依托,介绍了该厂房的地质水文条件,利用GTS软件建立了边坡的模型,并模拟了边坡开挖的施工步骤,对各施工步骤下的边坡稳定情况进行了分析,为边
目的:探讨电击伤致心跳呼吸骤停患者脑复苏的护理。方法:对16例电击伤致心跳呼吸骤停患者的气道管理、药物治疗、亚低温治疗及高压氧治疗的护理进行总结。结果:16例电击伤致
随着城市交通的不断发展,环境友好的现代新型有轨电车作为城市综合交通发展战略框架中的重要组成部分,在限制小汽车的使用和实现城市道路资源优化配置中扮演着重要的角色,尤
在倡导全面推进素质教育的今天,初中生学业不良问题逐渐成为人们关注的热点。学业不良初中生作为学生群体的一部分,获得全面发展是他们的权利。这也是体教育公平和“以人为本