健康大数据预处理技术及其应用

来源 :电子科技大学 | 被引量 : 7次 | 上传用户:jaczolo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息科技的快速发展,人类社会开始步入创造和挖掘知识的信息革命时代。信息技术逐渐应用于电信、金融、教育、电子商务甚至政府决策等领域。而在国家全面建设医疗信息化的浪潮中,将大数据技术应用于与民生息息相关的医疗健康领域成为当下发展的一个热点。由于医疗数据的特点如海量、高维度、不规范等,对医疗健康信息进行数据预处理是挖掘分析前的一个不可或缺的重要步骤。通过预处理分析不仅可以提高数据挖掘的质量,还能从一定程度上提高挖掘效率。本文结合现有技术,分别对两个医疗健康数据集进行预处理分析并对部分方法进行技术改进,主要工作如下:(1)“人口死亡”数据集预处理方法的研究与改进。对“人口死亡”数据集进行特点分析并对其进行合适的预处理分析,着重研究采用随机森林算法对数据集“死亡方式”属性的缺失值进行填补。由于该数据集的非平衡性大大影响随机森林填补缺失值的效果,因此采用过采样技术SMOTE算法对数据集进行平衡性改善;并针对SMOTE算法存在的缺陷提出创新性改进。实验表明,数据集在使用改进的SMOTE算法进行平衡性改造后,随机森林对数据集的缺失值填补效果更佳。(2)“癫痫病脑电波”数据集预处理方法的研究与改进。研究脑电波数据集预处理相关技术;并着重研究局部线性嵌入算法对脑电波频域信号进行降维。针对局部线性嵌入算法选择邻域点过大时造成的“短路边”问题,提出一种基于K-Means和均值的自适应选择方法。经过实验对比分析,改进后的局部线性嵌入算法具有更好的降维效果并具有良好的推广能力。(3)对两个健康数据集进行预处理分析设计与实现。结合各自特点,将预处理技术及其相关改进应用于“人口死亡”数据集和“癫痫病脑电波”数据集分析中,为下一步的数据挖掘工作提供有效的高质量数据集。经实验表明,通过预处理后的数据集挖掘质量更佳且效率更高。
其他文献
目的针对结核病患者展开护理研究,了解护理干预重要性。方法选取我院在2013年3月-2014年3月这一年内收治的结核病住院患者70例,随机分为对照组及观察组。对照组采用常规护理模
以4份贵州地方辣椒资源为研究对象,在苗期、初花期和初果期测定其光合参数,并进一步分析了各光合参数间的相关性。试验结果表明,4份辣椒材料的净光合速率表现为初果期〉初花
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
随着新课程标准改革的进行,全国各地掀起了一场高中教育改革的高潮,在科技的飞速发展的二十一世纪,任何行业的发展都离不开专业人士的兢兢业业、恪尽职守的付出,而做为科技的
日前,从正在建设中的渝宜高速公路工地传来喜讯,该路的重点控制工程——大宁河特大桥主体工程全部完工。
本文从CD23与IgE、CD23与其受体,与CD23有关的信号传导和基因调控等几个方面介绍了CD23研究的最新进展。CD23,即IgE的低亲和力受体(FceRⅡ),是一个45KD的糖蛋白。它是唯一的
为加大干部人事制度改革的力度,优化全区中层干部队伍的结构,逐步营造富有生机与活力的促使优秀年轻干部脱颖而出的用人机制,今年4月份,我区推出一批中层职位面向全区一般干
分岔隧道是在我国西部交通建设中涌现出的一种新式隧道,应用于桥隧连接处,造价低。该文结合漆树槽分岔隧道,介绍了分岔隧道变形监测的方法,并根据监测结果分析了在当前支护和施工
前胃弛缓是由多种原因导致的反刍动物前胃(瘤胃、网胃和瓣胃)兴奋性降低、收缩力减弱、内容物运转迟滞等前胃运动和消化机能紊乱综合征。其特征是食欲、反刍紊乱,前胃蠕动减弱或
教师书面反馈在写作教学中已经成为了重要的研究课题。最近,由于我国高中英语教学越来越重视学生的写作能力,因此,关于高中教师书面反馈的实际情况以及书面反馈的有效性研究