基于Hadoop的医疗大数据分析系统研究

来源 :南华大学 | 被引量 : 1次 | 上传用户:shingang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算、大数据等技术的飞速发展,世界各国医疗产业信息化建设的进程不断加速,因此以电子病历子系统(EMR)和影像归档通信子系统(PACS)为主的医院信息系统(HIS)得到了前所未有的广泛应用。然而传统的以单一节点数据仓库为主体的医院信息系统(HIS)由于受到硬件能力的限制,在处理大量非结构化数据时容易遇到性能瓶颈,很难做到存储能力和计算能力的双向扩展。本文基于当前大数据处理领域的最新科研成果,设计了一个基于Hadoop的石鼓SCool医疗大数据分析系统,以便更好地满足医院对于大量医疗数据的整合分析的需求。本文针对目前各大医院内部医疗数据信息化建设的实际运行情况,首先设计了基于Hadoop的医疗大数据分析系统的体系结构;然后根据Hadoop框架的特点,并结合Hive、Hbase和Sqoop等第三方工具,利用该系统与HIS之间的协同工作,实现了将传统单一节点医疗数据库中存放的各类医疗数据转为HDFS分布式存储管理的功能;在智能辅助诊断和海量原始数据统计分析研究过程中,提出了一种可变Key值的Map/Reduce算法,同时结合该算法建立了特定结构的Hash表,解决了不同数据类型的Key-Value键值对的存储问题;在数据关联规则挖掘研究过程中,提出了耦合度关联模型,并结合经典Apriori算法,改进了传统兴趣度模型中容易生成错误强关联规则的缺陷;最后,本文使用Java语言对该系统进行了封装与代码实现,通过对随即抽取的5万份电子病历进行数据分析,生成了智能医疗辅助诊断模板,并由实验记录的数据结果证明了该系统比传统的单一节点医疗数据库具备更高的数据统计分析效率。该系统具备实施成本低、数据存储安全可靠、可扩展性强以及数据统计分析速度快等特点,可以为医生在临床诊断过程中提供决策支持,也可以为各类医院对庞大医疗数据群的深入挖掘和统筹分析提供技术保障,在一定程度上提高了医院智能与信息一体化的建设水平,促进了医疗产业的高科技化发展。
其他文献
随着汽车动力的更新和新技术的应用,汽车空调技术也在不断进步,向着电动化、环保节能化、个性化的方向发展。结合实际,从传感器、执行机构、整体系统三个方面探讨了汽车空调
在班主任工作的实战中架构情感与班级管理诸多因素协调发展的桥梁非常重要,必须认真探索研究。
<正>灾害与人类如影随形。面对自然灾害风险日益加剧的现实,党的十八大提出"加强防灾减灾体系建设,提高灾害防御能力"的要求。防灾减灾教育是防灾减灾体系建设的基础,而学校
针对足球运动项目的特点,对2012、2013赛季中国足球超级联赛16支参赛队伍在射门、进球等15项原参数指标进行分析,通过运用因子分析法提取原参数指标的共性因子,建立影响中超
回顾我国体育新闻软化和硬化倾向的历史进程,从对历史进程的认识入手,通过内容分析法,对体育新闻过度异化现象进行了探讨,概括出体育新闻过度软化和硬化的时代背景及表现形式
<正>宫颈癌是妇科肿瘤中仅次于乳腺癌的第二大恶性肿瘤[1],高危型人乳头状瘤病毒(high-risk human papillomavirus,HR-HPV)已明确为宫颈癌的病因[2],但不同地区妇女HR-HPV感
报道IgA型多发性骨髓瘤20例,与IgG型多发性骨髓相比较,虽然高粘滞综合征、出血、高钙血症及髓外浸润稍多,但统计学上差异不显著,感染发生率差别也无显著性。然而IgAMM病程进展快,
对高校辅导员制度从何时萌芽(缘起)及辅导员制度发展阶段的划分,有不同的意见。在不同的历史阶段,社会发展的要求不同,大学生思想政治教育的目的、内容、手段、方法也就不同,
科学社会主义的产生是人类思想史上的伟大革命变革。马克思、恩格斯是科学社会主义思想的伟大创立者。马克思、恩格斯从历史事实和发展过程出发得出确切结论,科学揭示了社会
伴随着中国经济的不断提高,我们市场需求对电力的要求将不断增长,那么对于电力相关部门对于基础设备的建设将是一个大考验,处理事情的能力将要增加,随之增加的还是电力工程抢