基于关联规则挖掘的出生缺陷预警系统的研究与实现

被引量 : 1次 | 上传用户:kevin7878
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国出生缺陷发生率逐年增加,对人类可持续发展和社会经济发展造成的威胁越来越大,数据挖掘领域的关联规则挖掘可以找出与出生缺陷相关的致病因素,从而进行出生缺陷预防。但传统的关联规则挖掘算法存在耗时长以及规则冗余的问题,并且无法直接应用于分布式的数值型医疗数据的挖掘。针对以上两大挑战,本文对医疗数据的关联规则挖掘方法做了探索性的研究。本文选题自“十一五”国家科技支撑计划课题“安全可信的电信级生殖健康运营支撑体系关键技术研究”,主要解决了如何从采集到的一百六十多万份家庭档案中挖掘出跟出生缺陷相关的因素,从而实现预警目标的问题。论文的工作主要体现在以下几个方面:1.研究了关联规则挖掘的理论知识,包括基本概念和分类等,对最有影响的算法即Apriori和FP-gorwth算法进行重点研究并进行比较分析。2.提出了一种将用户兴趣约束引入关联规则挖掘的新算法ACARMT,解决了现有算法耗时长和规则冗余的问题。3.设计了一个针对医疗数据的预处理模型,该模型实现分布式数据集成,定义了数据转换规则,将数量庞大的源数据转换成适用于直接挖掘的中间数据,解决了医疗数据无法直接进行关联规则挖掘的问题。4.设计并实现了一个出生缺陷预警系统,达到出生缺陷致病因素的挖掘以及对可疑档案实时预警的目标。论文的主要贡献是,提出了一种基于约束的关联规则挖掘新算法ACARMT,提高了挖掘效率和挖掘结果的针对性,设计了一个针对医疗数据挖掘的数据预处理模型,使海量医学数据可以使用新算法进行关联规则挖掘。最后,在出生缺陷预警系统的设计与实现中应用ACARMT算法和数据预处理模型,通过对“国家免费孕前优生健康检查信息服务管理平台”采集到的一百多万份档案进行关联规则挖掘,验证了算法与模型的有效性,最终实现出生缺陷预警。
其他文献
水资源是基础自然资源,是生态环境的控制性因素之一,同时又是战略性经济资源,是一个国家综合国力的有机组成部分。洪水具有灾害与资源的双重性,如何缓解城市干旱缺水,树立以
农家书屋是设立在农村供农村居民使用的公益性文化场所。截止2012年8月,农家书屋工程竣工,然而农家书屋工程的竣工并不等于农家书屋工作的结束,反而是农家书屋正式投入运行状
作者从双语教学背景及目的性教育、教材的选择、师资的培养、教学中英比例的设置、"四步双语教学法"的运用、网站的建设、教学内容的充实、考试成绩的分配、教学结果诸方面,对
<正> 第十五条国家鼓励个人或者集体对荒山、荒地、荒滩进行承包开发、治理,并保护承包人的合法权益。[释义]这是国家对开发性生产项目承包治理的特殊鼓励和保护。荒山、荒地
目的:探讨在新药临床试验中多终点变量对药物疗效评价的影响。方法:通过Monte Carlo模拟探索在不同疗效分布类型中多终点变量间的相关性及其对疗效客观评价的影响,并比较不同
素有"举国大考"之称的高考在我国已成为一个超越教育本身的社会"热点"问题。维护公平是高考制度形成的逻辑基点和演进的基本价值取向。当前,高考公平问题的实质是转型时期新
过量地接纳硫酸盐会对水体生态平衡产生不利的影响,很多国家的工业废水排放标准中都详细地明确了硫酸盐的排放要求。本文详细的阐述了硫酸盐的危害以及硫酸盐废水处理技术的
随着媒体在监督企业违规行为,保护中小投资者权益方面发挥日益重要的作用,媒体的公司治理作用逐渐成为主流财务学研究关注的焦点和重要内容。一方面,倡导者坚定的认为,作为法
随着网络的日益普及,大学生网络成瘾问题也日渐突出,并成为影响不少大学生正常学习和生活的难题。网络自身的诱惑力,大学生个体人格的心理特征,家庭、学校及社会工作滞后是大
<正>在众多印后设备品种中,我国模切机产品的技术和产业化已经达到较高的水平,其主要标志表现在以下几个方面:一是模切机的进口额下降,出口额在不断提高。据海关统计:2002年