论文部分内容阅读
研究背景在公共卫生领域,随着信息化进程不断推进,已积累形成了丰富的数据资源,符合典型的大数据特征。大数据时代的到来,对于我们更深入地了解疾病因果关系、健康危险因素,提高疾病的预测预警和防控能力,从而改善健康具有重要作用。如何从大数据资源中发现有用的知识以及提高信息的利用率是迫在眉睫的任务,目前公共卫生大数据的分析利用还处于研究探索阶段,数据资源的价值还远远没有得到挖掘和利用,还需要进一步深入研究探索新的数据分析方法和工具来用于公共卫生大数据资源的挖掘。我国在结核病防控方面尽管已取得了很大的成就,结核病疫情的形势依然严峻,仍然是国家政府需要关注的重要公共卫生问题。在大数据应用快速发展的背景下,可以引入大数据的思维和分析方法,将其应用于结核病等疾病的流行规律及病因危险因素研究中,为制定更加有效的防控策略和措施提供参考。研究目的应用大数据分析的技术和方法,对中国2005-2014年结核病报告的个案数据进行空间热点和病例流动分布变化情况的分析,探讨结核病流行的空间动态变化规律,并为传染病监测数据提供新的分析方法与手段。研究方法对结核病报告病例的空间点分布进行核密度估计,在此基础上采用局部空间统计方法进行统计学检验,分析结核病的空间聚集分布及随时间的变化情况,绘制空间分布热点地图。根据个案数据中现住地址国际编码变量代表病例居住地、报告单位地区编码变量代表病例就诊地,分析结核病报告病例的流动就诊情况,描述病例流动就诊的流向和流量分布。进一步对跨省流动就诊病例,分析各省之间病例相互流入流出和流动就诊病例就诊医院级别情况,绘制病例居住地-报告地-就诊医院流动情况 Sankey 图。研究结果2005-2014年全国结核病报告病例数及报告发病率整体均呈下降趋势,但2011年后下降趋于平缓,在时间分布上有一定的季节性趋势,男性报告病例数明显高于女性,以20-30岁青壮年为主,农民病例数量远高于其它的职业。在2005-2014年全国结核病报告病例的空间聚集性分布中,报告病例空间聚集热点区域主要集中于我国东南部地区,东北及新疆的部分地区也存在一些热点区域。十年间广东南部、新疆西南部和湖南中北部等区域聚集热点强度和范围有所增大。在2005-2014年全国结核病报告病例流动就诊分布中,平均有79%的病例未流动,在本区县内就诊,但仍有平均21%的病例流动到本市其他区县、本省其他地市和其他省就诊,且流动就诊病例所占比例逐年升高;结核病报告病例流动就诊在省内主要流向省会城市,跨省流动主要从中西部地区流向北京、广东、浙江、上海等东部一线发达省份,以邻近省份之间的相互流动居多,跨省流动就诊的病例大多去往三级甲等医院就诊。利用空间聚集性模型,分析了结核病聚集热点在空间上的连续性分布变化情况,为确定结核病高发热点地区提供了依据;运用流动就诊模型分析了结核病报告病例就诊的流向和流量分布,与传统分析方法相比,更能够反映病例的空间动态流动情况,为研究结核病的传播扩散规律提供参考。研究结论我国结核病疫情的流行状况依然严峻,报告病例数下降趋于平缓,需要针对严峻的耐药结核病和流动人口患病问题,研究制定更加有效的控制措施。结核病的发生在空间分布上存在明显的高发热点区域,高发聚集地区须加强干预措施,针对聚集性情况研究制订更有效的防控策略。各地区应根据本地的病例流入流出情况,分别针对本地和流动病例采取针对性的措施,病例相互流动较多的地区需加强信息共享交流合作,完善对流动病例的管理控制;三级甲等医院对于异地就诊的结核病病例要加强监测管理工作,及时转诊保证其得到规范治疗。空间聚集性和病例流动就诊模型分析结果较传统方法能更好地反映出结核病的空间聚集热点和病例流动就诊的分布,形成的模型可推广应用于其他疾病的研究中。