基于大数据的医疗质量评价模型的研究与实现

来源 :电子科技大学 | 被引量 : 8次 | 上传用户:xsxiaomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,各行各业的数据量都在极速增长。医疗大数据作为最有价值的行业大数据之一,近年来人们对它的研究层出不穷。其中对于医疗质量评价的方法,研究者多数采用传统的基于经验或统计的方法进行分析,而随着医疗数据的逐步增长,传统医疗质量评价方法存在着样本过大、处理缓慢等问题。本文立足于某地的医保大数据,将传统医学的评价方法和数据挖掘进行融合应用,研究与实现了基于大数据的医疗质量评价模型,具体研究内容如下:1.离群指标的建立:经过噪声处理之后,数据是准确有效的,此时的离群点本身能够反映一定的医疗质量信息。本文通过对KNN算法进行了剪枝等改进,降低了算法的时间复杂度,使之更加适应大数据处理。然后基于统计的离群点检测算法和改进的KNN离群点检测算法,构建了离群指标,定义为两者检测结果中每个医院的离群点占比的比值。实验结果证明,它很好的检测出了医疗质量不佳的医院。2.病例优良率指标的建立:将数据挖掘中的聚类思想应用到病例质量研究领域使用广泛的包罗模型之中,由以往的经验二分法变成从数据本身出发的自动聚类多分法,构建了评价更加准确的病例优良率指标。采用X-means算法进行自动聚类,由于其在四维以上数据中效率低下,本文提出了一种新颖的基于属性重叠率(AOR)的分类方法,对得到的分类结果再进行聚类。实验结果显示聚类纯度和病例优良率指标准确度都得到了提升。3.医疗质量评价模型:基于离群指标和病例优良率指标,通过模型计算公式,得到每个医院最终的模型评价分数,进而对医院进行医疗质量评价分级,实验结果证明该模型能够较好的评价医院的医疗质量。4.大数据医疗质量评价系统的设计和开发:本系统基于Hadoop分布式平台,通过sqoop与Oracle数据库进行数据传输,采用HDFS和HIVE进行数据存储和管理,开发了集成离群指标和病例优良率指标的大数据医疗质量评价系统,并将相应的结果进行了可视化展示,结果显示本系统有着很高的实用价值。
其他文献
随着互联网的快速发展,计算机软件的运行环境逐渐开放化,软件动态演化已经成为软件工程领域的研究热点之一。面向方面编程(AOP)是一种新兴的编程技术,其关注点分离技术能较好
随着互联网的各种应用在生活中的普及度逐渐提高,全球数据量呈指数级别的增长。根据互联网数据中心的调查显示,早在2011年全球数据量已突破2万亿GB。IBM副总裁在2016年的闪存
随着网页信息量越来越大,采用通用搜索引擎搜索某一个方面的信息时覆盖率和准确率低,回馈的内容不够详细,噪音过多,维护庞大的网页索引库特别困难,在信息的采集和存储面临着
目标反射光在湍流的大气中传播,传播过程中受到随机的干扰,其折射率随时间和空间变化而随机变化,光的传播方向和相位发生抖动,这使成像焦平面产生像点强度随机起伏,强度分布
随着信息技术的发展,数据挖掘技术得到了广泛的关注。在很多研究领域中,关联规则挖掘是数据挖掘中比较重要和活跃的研究方法之一,对它进行深入研究不仅有重要的理论意义,而且
P2P是近年来互联网最热门的技术之一,在VoIP、文件下载、流媒体、协调计算等领域得到飞速发展。P2P应用对网络带宽资源消耗巨大,据统计P2P业务的带宽占用比率大致是40%~60%,在极端
多智能体系统的理论和应用,是人工智能领域重要的研究方向。在本文中,我们将对多智能体系统的构建与分析两个方面进行研究。首先,阐述和讨论了一个多智能体系统的开发方法,并以此
随着生物医学领域文献的爆炸性增长,从生物医学文献中自动获取生物医学知识已经成为生物信息学研究的重要领域。由于蛋白质相互作用关系对于生命科学有着特殊的重要意义,因而
伴随着世界各国汽车数量的增加,城市交通状况日益受到人们的重视。智能交通系统也成为人们研究的热点,车牌识别系统是智能交通系统的一个重要组成部分,它的成功开发必将大大
云计算是近年来的热门话题,兴起了IT产业对服务使用方式的变革,越来越多的组织和个人使用云计算来部署自己的应用,开发自己的平台。云计算厂商的将更多的时间放在了虚拟化、