健康体检数据仓库的构建与分析系统的实现

来源 :东北大学 | 被引量 : 0次 | 上传用户:taohappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着健康体检业务的不断发展以及体检用户的不断增多,健康体检系统中积累了大量宝贵的数据。如何有效利用这些体检数据为医生和管理者提供决策支持成为相关机构面临的共同问题。本文针对此问题设计实现了一个健康体检数据分析系统。首先,引入数据仓库技术为健康体检数据分析提供了独立的环境,解决了健康体检数据存储和集成问题。通过健康体检数据仓库的维度建模过程,本文对健康体检数据建模涉及的事实、维度、粒度等进行了详细讨论。经过合理的模型构建,仓库数据被重新组织成了适于分析的结构。采用Shell和PL/SQL等高级脚本语言编码实现的ETL系统实现了每日数据的定时加载和更新,同时保证了最大的便捷性和灵活性。其次,为了实现健康体检数据的多维分析,使医生和管理者获得多角度分析关键指标的能力,本文引入了 OLAP技术。通过使用OLAP工具MSTR极大地简化了多维分析报表的开发。利用其提供的ROLAP服务器可以读取关系型数据仓库中的事实表和维度表,将相关数据表模型化成为一个统一的多维度模型。经过工具的配置可以定制多维模型中虚拟立方体的汇集计算结果,最终为医生和管理者提供健康体检数据多维分析报表服务。最后,本文探讨了健康风险评估的方法。通过引入数据挖掘技术中的分类技术,探索用户检验指标和检查结论之间的联系并建立相应的预测模型。文中选取决策树、朴素贝叶斯和支持向量机这三种常用的分类模型在真实数据上进行了实验,三种分类器的准确率都达到了 80%以上,证明了分类方法用于健康风险评估的可行性。此外,针对实验中健康体检数据集出现的非平衡性问题进行了讨论,最终选用数据预处理中的过采样方法对训练数据进行均衡。在对比实验中使用SMOTE算法对训练数据进行预处理之后,三种分类算法在总体分类准确率变化不明显的情况下对少数关注类的分类能力获得了显著提升,最终证明了过采样方法在健康体检数据集的不平衡性问题上应用的可行性。
其他文献
<正>课题:《二泉映月》课型:欣赏课教学目标:1、知识目标:了解作品的曲式结构;2、能力目标:培养学生欣赏音乐的能力,树立正确的审美观;3、情感目标:培养学生热爱生活,热爱音
主要探讨了高效液相色谱法快速检测蚕豆中黄曲霉素B1的提取条件;分别考察了在不同超声波提取时间、不同超声波提取功率下、不同浓度的甲醇对黄曲霉素B1分离检测效果的影响;并
互联网的飞速发展引发了信息的爆炸式增长,让信息过载的问题日益严峻。推荐系统作为一种有效的信息过滤技术,大大方便了人们浏览信息的效率。其中最为流行的是基于协同过滤的推荐算法。但是受限于数据稀缺和冷启动的问题,这些传统的推荐算法在很多应用场景下的效果会大打折扣。近年来,随着社交平台的兴起,社交推荐成为了一种广泛应用的推荐方法。该类方法基于社交影响力理论,挖掘社交网络在推荐系统中的作用,从而缓解个性化推
目前,我国高校的教学质量问题受到越来越多人的关注,各个高校也越来越重视教师及其教学,纷纷开始建立高校教师教学发展中心,以提高高校的教学质量。然而,目前我国的教师教学
新编撰四川方言志语音志存在记录方音体系不完备、不准确、不规范 ,以及方音特点未得到记录等问题 ,这些问题影响到方言志的价值。问题的出现有主观和客观两方面的原因 ,可通
基于我国经济的发展,农村城镇化进程的推进,我国建筑行业呈现出爆发式的发展。建筑工程项目的增多,这使得我们必须加强工程项目的质量管理。论文主要是基于建筑工程施工项目
小微企业融资难、融资贵是一项世界性难题,也是我国经济社会发展的一大瓶颈。党中央、国务院高度重视,部署推动大中型商业银行设立普惠金融事业部,提高金融服务覆盖率和可得
股权转让制度是公司法制度中非常重要的一项,股权转让也是公司法赋予股东的重要权利之一。有限责任公司的股东享有股权转让的权利,在转让股权时所签订的股权转让合同不仅要符
本试验旨在研究不同比例全株玉米青贮饲粮对生长猪生产性能、养分利用、血液学指标和血清氧化应激指标的影响。选取胎次、体重[(33.16±3.49)kg]相近的生长猪(杜×长×大)32