论文部分内容阅读
随着信息技术不断的发展,医学及气象领域中产生的大量数据不断积累下来,与此同时,新的数据还在继续不断地产生,呈现出明显的大数据特征,这无疑为医学气象学这一新兴交叉学科的发展奠定了重要的数据基础,为深入研究天气气候变化对人类健康的影响注入了动力与活力。为此,本文旨在将大数据的理念引入至医学气象服务中来,探索大数据时代下的医学气象服务框架,研究大数据的方法与技术在医学气象服务中的应用,以利于推动医学气象学的快速发展。本文首先尝试建立了基于大数据的医学气象服务框架,该框架总体分为四层,从下到上依次为:数据源层、整合层、大数据平台层和应用层,可为基于大数据的医学气象服务提供了从数据的获取、存储、预处理、预报模型的建立及应用等一系列应用需求的解决方案。其次,针对医学气象数据的特点提出了基于大数据的数据存储模型,该模型利用分布式及网页爬取等先进技术,能够获取不同存储地点的结构化与非结构化的医学、气象及空气污染监测数据;该存储模型中还构建了医学气象数据仓库,将获取的相关数据进行及时质控与存储。同时本文还以兰州市某三甲医院的医学数据及相应的气象、空气污染指数数据为基础,进行了数据仓库实例的建设试验。再次,我们通过比较现有数据预处理技术的基础上,针对医学气象的大数据特点进行了数据的变换和预报因子的特征选择,结果表明:在没有进行数据分级处理(数据变换)时,对于高血压、上呼吸道感染及糖尿病病情变化就诊的人数预报的准确率分别为:4.20%、2.91%和2.70%,经过数据预处理后预报的准确率上升为为:25.50%、41.50%和19.50%,显然,预报准确性得到了明显的提高;再经过特征选择的优选预处理后,上述三种疾病的气象预报因子由进行特征选择之前的31个分别减少至9、10和10个,在同一服务器上三种疾病的预报建模(BP神经网络)时间由未进行处理前的19.45s、27.05s和31.04s,分别减少为:11.20s、20.38s和6.39s。由此可见,经过上述有针对性的医学气象大数据的科学预处理,从预报的准确性及建模时间上都有大幅的提高。此外,针对基于大数据的医学气象服务预报模型构建的现实需求,通过比较了已经在医学气象服务预报中使用的各种预报模型算法的优缺点,研究提出了大数据时代下,医学气象服务预报模型构建的一种新方法---基于遗传非线性规划的支持向量回归算法,并利用已存储的相关数据进行了检验,结果表明:(1)该算法的预报准确性比已使用的其它算法有大幅的提高,以高血压、上呼吸道感染及糖尿病病情变化就诊人数的预报为例,预报的准确率分别达到:75.50%、98.75和62.00%。(2)利用该算法进行预报模型的建立,建模时间明显优于其他算法,对于以上提出的三种疾病的建模时间分别降至为:4.57s、4.23s和3.20s。(3)该算法在应用时易于实现,本文中利用编程工具.NET2008中已有的库函数及相关技术,进行了算法的实现。其占用的存储空间较小,程序运行较快,适合于实时的医学气象预报服务业务应用。最后,本文尝试开发了医学气象预报及服务系统软件平台,除了研制开发WEB网站之外,还针对当前比较流行的移动互联网进行了开发,包括:基于Android系统、IOS系统的手机APP及微信公众号的开发。该软件平台不仅通过友好的界面可将医学气象预报结果以多种形式展现到使用者面前,还能够对用户进行定位,将其所在地的气象与环境信息及防病知识进行推送,及时提醒用户进行有效防护。此软件平台具有大数据时代的特征,对于相关疾病患者群体有较好的预警效能,目前已开始试用并显示出了良好的服务效果。