数据挖掘技术在医疗费用数据中的应用研究

被引量 : 17次 | 上传用户:pigho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机技术在医疗卫生领域的飞速发展,使得医疗信息系统、疾病诊断系统、医学影像系统等系统不仅在大型综合性医院应用,由此向下直至卫生院的各级别医院也应用广泛,日积月累,产生了大量的医疗卫生数据。我国自2003年起逐步实施了新型农村合作医疗制度,到2010年逐步实现基本覆盖全国农村居民,近几年各级政府更是加大了对新农合的投入力度。但是,医疗资源的配置仍然存在不公平性,城乡医疗卫生水平也有着较大差距。通过数据挖掘技术与医疗卫生领域相结合来探究一种适用于新农合费用数据的数据挖掘方法,讨论医疗卫生领域常用的数据处理方法的不足,并进行分析比较,具有一定的现实意义与研究意义。论文研究比较既有四分位数处理方法并尝试使用数据挖掘算法对数据进行处理,根据预测精度进行对比,并使用可视化技术呈现。采集的医疗费用原始数据有区别于其他数据如真实性、隐私性、多样性、不完整性、冗余性等的特点,为此本研究在挖掘前期进行了大量反复的数据规约、数据变换、异常错误处理等处理流程。在形成统一的数据格式之后,对数据中的8个系统疾病分5个级别医院进行了初步统计其均值、方差、四分位数等工作。之后根据统计的结果分析了其不足以及对挖掘的帮助,在指出医疗费用数据成偏态分布的同时指出了一些其他研究者采用四分位数分类法或仅凭经验来判定医疗费用高低的不科学性和不合理性。为此本文研究使用基于K-means聚类算法的处理技术,K-means是基于自学习的非监督聚类算法,用来探索和特性化费用数据集,该算法不易受数据分布特征的影响同时又兼顾数据本身的特点。使用C4.5决策树算法对经过K-means算法处理过的数据进行医疗费用影响因素的分析,根据算法的预测精度得出本文的结论:K-means算法在处理血液病医疗费用数据时的优势明显大于基于四分位数数的处理方法。之后介绍了医疗数据的可视化平台,与一般统计可视化展示不同该平台具有动态展示、可交互、进行简单计算等的功能。文章最后对形成医疗费用影响因素的可能原因给出了解释。
其他文献
乡村振兴是相对于乡村衰落而言的,真正意义上乡村振兴首先应是通过振兴乡村生活空间,恢复乡村生活属性,提升乡村生活品味,通过产业发展模式转型升级吸引更多的人返乡参与乡村
用哲学方法抓落实,能够取得事半功倍的效果。抓落实要坚持一切从实际出发,把上级指示精神与本地实际情况结合起来,坚持用统筹兼顾的科学方法处理问题;必须遵循客观规律,善于
<正>北美成人便秘患病率为2%~27%,特别是年龄超过65岁的老年女性更为高发。尽管国内尚无明确的统计数字,但由于生活、工作、饮食、年龄结构等变化,发病率有逐年增高趋势。
现代工业生产以及产业部门以至我们的日常生活,离不开各种各样的化工机械设备,它们已成为当今生产活动和日常生活中最主要的生产设备,保证其的正常运行非常重要。因此,对化工机械
作为一种Ⅲ-Ⅴ族化合物半导体材料,AlN不仅具有超宽直接带隙(6.2 eV)、高热导率、高电阻率、高击穿场强、优异的压电性能和良好的光学性能,而且AlN晶体还与其他Ⅲ-N材料具有
随着世界经济一体化进程的不断加快,国际贸易竞争的日趋激烈,汇率对国际贸易的影响是不争的事实,长期以来理论界从没有停止对该问题的研究,大量的研究证明,灵活性较强的汇率
随着科技地进步及生活节奏地加快,越来越多的人出现了用眼疲劳等现象,继而引发各种眼部问题。众所周知,我国是一个“眼镜”大国,而配一副准确舒适的眼镜离不开准确严谨的验光
对成都市万年场14^#综合楼地下室底板第一施工段的裂缝进行了计算、分析,找到了出现裂缝的原因,并针对性地采取了对策,使第二、三施工段偿不再有裂缝出现。
【正】欧盟的债务危机,根本上是源于欧盟这个组织制度的硬伤:只有统一的货币政策,而没有统一的财政政策。如今再次看到诸如"国际信用评级机构标准普尔公司又下调西班牙信用评
在翻译过程中,译者的身份和意识形态是两个非常重要的因素。然而之前的翻译研究主要关注的是原文和译文。近三十年来,在语言学和翻译学领域出现了许多新观点,越来越多的学者