基于Hadoop的健康物联网数据挖掘算法研究与实现

被引量 : 3次 | 上传用户:kaishizai2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗卫生体系的发展水平直接关系到人民群众的身心健康和中国梦的实现,是全社会关注的热点。在如今医疗改革的关键时期,应紧密结合物联网和云计算技术,切实加强医疗健康领域的信息化水平。健康物联网旨在通过先进的感知技术实现医疗信息的准确、实时感知,通过便捷全方位的通信技术实现医疗健康领域的互联互通,通过高效的数据处理技术实现医疗健康信息的全面、科学分析和预测。健康物联网数据处理总体流程是通过接收健康物联网智能采集终端的海量异构数据,对数据进行分布式存储,过滤进而对其进行分布式数据挖掘,让医学专家更有效的对病情进行分析。基于Hadoop平台对健康物联网数据进行处理挖掘时,本文首先对Hadoop源码进行研究,设计实现了分布式数据清洗算法以过滤冗余数据;接着重点研究设计了若干分布式数据挖掘算法,并对这些分布式算法进行了正确性验证。通过对这些算法的设计实现,可以为上层的健康服务应用提供良好的预测模型。对生理数据进行分布式数据挖掘时,首先分析了分布式聚类算法,又结合了蚁群的核心思想设计实现了基于Hadoop的分布式DKBAC(Distributed Kmeans Based on Ant Clustering)聚类算法。本文对病理信息数据进行聚类,通过实验将DKBAC算法与相关分布式聚类算法在准确率、平均查全率及时间效率等性能指标上做了比较和分析。为满足健康物联网各种预测分析的需要,需研究实现更多数据挖掘算法和模型,本文主要研究了基于Hadoop的分布式随机森林分类算法与分布式关联规则算法,并对算法进行具体的分布式设计,将其在Hadoop下进行部署实现并与相关算法进行了性能指标的比较和分析。通过研究实现这些主要的分布式数据挖掘算法,本文总结出分布式数据挖掘算法的一般设计原则及适用范围,为后续实现更多健康物联网分布式数据挖掘算法指明了万向。
其他文献
随着我国经济社会的快速转型,部分青少年由于独生子女的个性缺陷与性格障碍、对网络的依赖性等造成困难的人际交往以及性无知引发的情感困惑和恋爱危机等原因,导致违法犯罪现
随着世界经济的发展和软件技术的发展,软件产品大部分都面向全世界的客户,包括企业和个人用户。软件行业的竞争也越来越激烈,不光体现在软件的功能,使用便利性,而且用户体验
“优秀的人才”作为企业核心竞争力之一,对于企业发展而言起着十分重要的作用,特别是在知识经济时代下的今天,如何留住优秀人才,吸引更多潜在的“雇员”,成为企业在发展过程
在一些先进的工业应用中,需要实现旋转和直线运动的结构。在这些应用中通常使用旋转电机搭配旋转到直线的机械连轴器。但是这种结构有复杂的力学计算、较大的空间、频繁的机
深部煤层开采引起的采空沉陷区地面变形,是矿山开采普遍存在的环境工程地质问题,不仅破坏矿山环境,而且造成巨大经济损失。结合力学分析及矿山数据资料,本文运用三角函数方法
运动模糊广泛地存在于日常生活中,为图像信息的有效获取带来不便。围绕图像运动模糊的复原问题开展算法研究,通过数学分析、算法设计和仿真实验相结合的方法,研究出能够有效
研究北方既有居住建筑节能改造项目技术经济评价,可为项目在改造前所制定的改造方案选择提供帮助。笔者通过实际调查与理论相结合,建立了切实可行的评价指标体系,并运用层次
在中国历史上,把女性别立于史册《列女传》中已经有很长的历史,而历朝历代的《列女传》在选材标准与书写重点上均略有差异,且差异中也显出其总体发展的趋势。起初刘向在撰写
<正>晶晶,高一入学军训期间我就注意到了她,一个认真,勤奋,懂事,大方的女孩。短短的军训5天,她给我留下了深刻的美好印象,继而被我任命为班长。事实证明,我的眼光没错,她工作
期刊
通过分析具有规范版式的中文文档,以2013年全国大学生数学建模竞赛B题附件3的数据为样本,提出基于文字特征的规则碎纸片的自动拼接算法.该算法通过研究文字行高、间距等特征