健康体检数据仓库的构建及相关数据挖掘

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:liu7605136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化的不断发展以及人们对健康的日益重视,健康体检数据库中积累了大量宝贵的数据,但是还没有得到充分利用。如何充分利用已有的体检数据更好的辅助医生及管理人员为客户提供更好的医疗检查就是本文的研究重点。首先,由于历史数据逐年增多,慈铭健康体检集团规模不断扩大,原有的数据库系统已经无法负荷急剧增长的数据量,也无法从整个企业的角度进行统计分析,构建数据仓库是必经之路。因此,本文结合公司的实际情况,给出了一个分布式数据仓库的模型,描述了其体系结构设计、逻辑模型设计及数据更新方法,并进行了相应的数据分析。其次,针对如何合理制定体检项目组合的问题,本文研究了水平加权关联规则。其中权值的设计借鉴了传统IR领域的TF*IDF的权值定义思想,给出了科室的权值定义公式。通过结合权值归一化思想,使加权支持度不大于1,更易于理解。最后通过比较加权关联规则算法与传统非加权关联规则算法在本文中的应用效果,证明了加权关联规则在本文中的适用性,完成了制定体检项目组合的任务。最后,为了辅助客服医生针对每个客户特点为其推荐合适的体检项目组合,本文研究了基于粗糙集的关联规则挖掘方法,并着重研究了其中的求核算法。由于本文中预处理后的决策表存在大量的不相容记录,并且这些不相容记录属于客观事实,无法进行简单删除,原有的求核算法不再适用。针对这个问题,本文给出了纵向加权求核方法:根据数据的不相容程度,对记录进行纵向加权,删除权值低于给定权值的记录,并再次根据记录的权值计算核属性的权值,最后根据核属性权值决定保留的核属性。实验表明,该方法具有很好的灵活性,通过医生的配合,实现了项目的需求。本文结合北京慈铭健康体检集团的实际数据库,运用上述数据挖掘方法进行相应需求的数据挖掘,并得到了挖掘结果,达到了辅助决策的目的。
其他文献
达·芬奇之前,欧洲画家笔下的人物肖像呆板、僵硬,缺乏生气,直到《蒙娜丽莎》问世,技法上有了空前的飞越。本文主要就达·芬奇的创造性表现在哪里及他的创造精神是如何形
基于溪流底栖硅藻和大型底栖无脊椎动物的生物监测和评价是有效评价溪流水质,溪流水生态系统健康、保护溪流多样性的重要手段。但是在溪流水质生物评价和监测过程中存在一些
德奥浪漫派室内音乐古典音乐后期西方国家的重要音乐类型,它更多地受到浪漫主义文学思想和作品的影响,在音乐中不但有传统音乐的旋律音调,还掺杂着浪漫主义诗歌的情感内涵。
基于协同学思想研究企业内外协同创新及价值,旨在为企业技术创新的研究提供更具理论性的分析,并达到应用性的指导。企业创新系统作为一个典型复杂系统,在系统的运行中单靠一
目的:1.对《中国公民幸福感量表》进行质量分析,系统地检验其信度和效度;2.探索与验证幸福感的结构模型,同时探讨主观幸福感、心理幸福感、社会幸福感和实现幸福感四者间的关
采用溶胶合成法,以正硅酸乙酯(TEOS)与异丁基三乙氧基硅烷乳液制备TEOS/异丁基三乙氧基硅烷复合渗透型防水材料,保证硅烷乳液稳定性的同时提高了乳液中的硅烷含量。通过混凝土毛细
目的分析急诊科临床中抗生素的应用情况,总结合理用药方法。方法回顾性分析2016年1月~2017年1月本院急诊科用药处方600张,统计处方中抗生素的使用情况。结果我院急诊科的600
合成了硅橡胶基吸声涂层材料,研究了涂层材料在水下的吸声性能,探讨了该涂层的微孔及分子结构与吸声性能之间的关系。结果表明:片状填料的用量极大地影响了消声涂层的吸声性
近年来颅内缺血性卒中发病率呈上升趋势,发病患者年轻化,其发病机制受广泛关注。大动脉粥样硬化性狭窄的血管在不同人群里有不一样分布,生理机制的不同导致了动脉粥样硬化发
期刊