基于云计算与医疗大数据的Apriori算法的优化研究

被引量 : 42次 | 上传用户:lihai_feng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着医疗行业的不断发展,医疗数据的规模不断扩大,而其蕴含的价值也不断增高,医疗大数据的概念已经成为很多专家及学者研究的目标。面对医疗大数据庞大的数据规模,传统的存储架构已不能满足其需求,而云计算的出现为医疗大数据的储存和调用提供了一个完美的解决方案。医疗大数据中潜在信息的价值更是无穷无尽的,如何将这些潜在的信息挖掘出来是研究的重点。数据挖掘技术以及关联规则挖掘是能体现医疗大数据价值的重要技术,但是传统的挖掘算法已不能满足医疗大数据以及云计算的要求,通过对算法的改进和优化以适用于医疗云平台,将是未来研究的重要方向。本文首先根据医疗大数据以及云计算的概念及特点,提出了一种医疗云平台的架构方案,包括数据采集层、数据云储存层、数据挖掘层、企业及数据库以及应用层5个部分。针对现有医疗数据挖掘技术中的关联规则算法,本文进行了分析与研究,并通过引入了兴趣度对经典Apriori算法进行改进,并且运用云计算和云平台Hadoop的知识,提出了一种基于MapReduce化以及兴趣度的改进Apriori医疗数据挖掘算法。最后,本文通过搭建Hadoop平台进行仿真实验,算法用JAVA实现,通过对训练数据进行挖掘,结果表明改进算法在处理大数据时空间复杂度更低,且挖掘时间随着数据规模的增大呈线性增长,验证了改进算法在进行大数据挖掘时的优越性。
其他文献
以前学者对洋务企业的研究主要是从历史学和经济学的角度来进行。福州船政局自它创办以来,特别是从辛亥革命前后起,一直是历史学者和经济学者重视和探讨的一个重要课题,不少
随着国内汽车行业的迅猛发展,世界各大汽车零部件企业也纷纷在国内设立工厂,汽车零部件制造行业竞争日趋激烈。在这样的行业形势下,各大企业都面临着采购成本、产品开发和客户服
水上交通是国家经济、社会和人民生活的重要基础之一。我国18000多公里的海岸线和珠江、长江、黑龙江三大水系以及京杭运河和星罗棋布的湖泊,为我国水上交通的繁荣和发展提供
新一轮基础教育课程改革正在逐步推进,最受社会关注的是教师专业发展.教师的专业发展水平关系到教育的质量问题,决定了教育的可持续发展.教师作为培养祖国未来的生力军,其质量直接
在项目建设过程中,风险无处不在。无论是技术风险、质量风险,还是进度风险或环境风险,如果不能对项目中的风险因素进行有效识别评估,一旦潜在风险变成现实事故,就会给项目建设带来
目的寻求如何最大限度地发挥医生的智慧和团队的创造力、保持医院核心竞争力的医院绩效管理方法是本次研究的重要目的。因此,研究应用循证及层次分析的方法,研制一套对优秀的医
政府采购在国内原有研究中往往被归类于宏观调控问题之中,由此,政府采购调控的干预表现和行政职能极为明显,法律表现尤其经济法表现极其模糊。而经济法是将其归入宏观调控法
视频监控是人们生活中的一种重要的安保手段。近年来,随着计算机视觉技术的长足进步,传统的视频监控系统也开始向着自动化、无人化、全天候发展,逐步形成了新一代的智能视频监控
品牌钟爱(Brand Love)是品牌关系领域又一新的概念,是一种存在于消费者与品牌之间的类似爱情的关系,主要表现为消费者对品牌的积极的、正面的认知和情感。随着市场成熟度的增加和
近几年中国已成为留学大国,来华留学的人数不断上升。据2012年的数据统计,来华留学生已超过32万。中国政府与相关管理部门以及各所高校携手努力改善生活设施,为各国的留学生