大数据环境下基于Hadoop平台的医学数据挖掘算法研究

来源 :机床与液压 | 被引量 : 0次 | 上传用户:guoyuan22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了有效利用云平台Hadoop框架的并行处理能力。通过对大数据挖掘技术中的传统关联规则算法-Apriori算法进行了分析和改进,提出了一种基于MapReduce并行模式的改进数据挖掘算法,适用于医学大数据的分析和应用。首先通过布尔排列优化数据库中事务数据的存储方式,从而有效减少数据库被扫描的次数。然后采用关联规则优化减少Apriori算法中冗余的子集。为了验证改进算法的有效性,采用医学历史数据进行实验验证。最后仿真实验结果显示,相比传统的Apriori算法,提出算法的运行效率更高,具有较好的可靠性和有效性
其他文献
本文分析了江西苎麻业的发展现状和机遇,指出了江西苎麻业所面临的各种挑战,并提出了相关发展对策.
大麻纤维受热过程中内部结构和物理性能的变化规律是大麻纺织、染整和大麻纤维增强复合材料加工工艺的理论依据,本论文通过对工业用大麻精干麻、原麻纤维的热学性能测试和受
嵌入式共固化复合材料阻尼结构具有阻尼性能优良、抗老化、不脱落、耐疲劳等优点,在设施农业、机床制造业、航空航天、建筑等技术领域具有广阔的应用前景。应用模态应变能法
目的:探索研究宫腔镜子宫中隔切除术对子宫中隔引起的复发性流产及不孕的治疗效果.方法:选择某院收治的接受宫腔镜子宫中隔切除术(TCRS)且有生育要求中隔子宫患者作为研究对象并
试验表明,用占种子重量0.3%的50%多菌灵WP、77%多宁WP、70%甲基硫菌灵WP拌种,对亚麻出苗生长安全,保苗和防治效果较好.
2005年5月20日,重庆市涪陵区科学技术委员会邀请中国农科院麻类研究所及涪陵区有关专家,对涪陵区农业局经作站主持完成的“苎麻优质高产综合栽培技术研究与应用”项目进行了鉴
目的:分析剖宫产术后腹壁切口愈合不良的原因,在分析原因的基础上进行干预策略的制定。方法:将90例剖宫产术后切口愈合不良产妇列为观察组,同时选取90例列为对照组,分析剖宫产
全国麻业峰会于2006年12月9-10日在北京召开。农业部、科技部、中国农业科学院等部门的领导出席了会议。刘更另、董玉琛院士与多位麻业界知名专家作为特邀代表参加了会议。会
闭式液压系统补油参数的确定与散热需求密切相关,从系统总功率损失出发计算出系统发热功率范围为系统输入功率的18.6%~22%,油冷器所需散热功率范围为系统输入功率的22.3%~26.
目的:探讨宫颈LEEP刀治疗宫颈上皮内瘤变后对妊娠后分娩时各产程的影响。方法:总结2015年1月~2016年10月间在某院分娩的产妇中曾行宫颈LEEP刀治疗的孕妇68例,并随机抽取同期在