关联分类算法研究及其在冠心病诊断中的应用

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:candyhaiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济的发展与物质条件的不断充裕,国民生活方式愈发趋于不健康化。在社会老龄化与城市化不断加速的背景下,以冠心病为代表的心血管疾病近年来在中国的流行趋势明显,已成为居民死亡的首要原因。另一方面,信息技术和物理存储技术的不断发展,也使得医疗诊断的手段越发多样、过程越发复杂,由此积累了海量的医疗数据。如何有效地利用这些数据,发现其中有价值的信息,为疾病的预防与诊断提供参考,具有重要的研究意义。本文的具体研究成果如下:针对现有关联分类算法资源消耗大、规则剪枝难、分类模型复杂的缺陷,提出了一种基于分块挖掘和事先剪枝的关联分类算法改进方案ACCP。根据分类属性值的不同对分类规则前项进行分块挖掘,并对频繁项集挖掘过程和规则修剪过程进行了改进与优化。基于UCI数据集的实验结果表明,此算法改进方案相比传统CBA关联分类算法和C4.5决策树算法有着更好的分类性能,平均分类准确率分别提高了3.93和5.4个百分点,平均灵敏度分别提高了3.95和4.51个百分点,且在算法运行时间上明显优于传统CBA算法,取得了较好的应用效果。针对传统Relief系列算法无法过滤冗余特征的问题,提出了一种基于Relief F算法和互信息的特征选择算法——FSRMI算法。在原有Relief F算法基础上,放弃了通过设定特征权重阈值来剔除无效特征的方式,采用基于互信息的启发式特征约简方法。通过计算特征子集与类别属性的互信息进行特征子集序列前向搜索,并将其是否达到特征全集与类别属性的互信息量作为特征子集生成过程的终止条件。最后,对已生成的特征子集进行基于互信息特征选择的二次约简,通过计算信息度量MIFS去除特征子集中的冗余特征,达到了更好的降维效果。实验结果表明,FSRMI算法在UCI数据集Breast上的特征约简率达到了44.4%,且分类性能相对于特征全集有了进一步的改善。基于实际收集的冠心病数据集,对本文所提出的ACCP关联分类算法与FSRMI特征选择算法在冠心病诊断中的实际应用进行了性能验证。首先对数据集进行数据筛选、缺失值填补以及数据离散化等预处理操作,然后基于FSRMI特征选择算法得到包含有11个特征的特征子集。最后在处理好的冠心病数据集上开展了一系列的对比实验,证明了ACCP关联分类算法在冠心病诊断中的实用性和有效性。除此之外,还基于ACCP分类算法在FSRMI特征选择前后的数据集上分别开展了验证实验,证明了FSRMI特征选择算法可以有效降低特征集的冗余度,具有良好的应用效果。
其他文献
中共中央颁布的《党政领导干部选拔任用条例》首次将引咎辞职纳入领导干部制度,引起社会的广泛关注,引咎辞职是党政领导干部承担政治责任而非行政责任或法律责任的一种形式,但它
凡立法必有其适用范围,草拟中的国际民商事关系法律适用法也不例外.文章从立法的角度,以条文设计的形式,深入阐述了我国国际民商事关系法律适用法之适用范围的理论与实践,具
对于明中叶史家唐顺之重要史论著作——两部《解疑》,后世一直存在着截然相反的两种评价。两部《解疑》的产生,应是充满忧患意识的士大夫唐顺之对明中叶以来剧烈社会变化的历史
我国道德危机的最主要原因是法律上的,是由法制不健全引起的。因此,道德重建应从法制建设着手。法律中含有诸多道德因素,法律强制对道德的发展产生巨大的影响。在我国市场经济条
信用是市场经济的道德纽带,是保证市场契约关系,从而实现正常的市场交往的道德机制,是人们在市场经济交往中应遵循的基本行为准则。市场经济就是信用经济。因此,建设一个包括政府
面对新形势下大学生思想政治工作中出现的新情况、新问题,关键在人。在论述大学生思想政治教育及其实效性内涵的基础上,找出了影响大学生思想政治工作实效性的内外部因素,提
文章在探讨当今西方法理学关于法律和道德、规则和原则等若干争论的基础上,从整体上把握当代法律本体论的一种重要理论走向:即在哲学诠释学的知识背景上,诠释逐渐上升为法律的本
本文论述了我国土地资源趋于恶化、水资源严重紧缺的原因及治理措施。控制生态恶化,改善生态环境质量.是实现社会经济可持续发展的一项长期任务。
目的探讨后路椎弓根螺钉内固定联合自体髂骨椎间融合治疗成人腰椎滑脱症的临床疗效。方法自2003年1月~2009年6月收治66例伴有明显双下肢神经症状的成人腰椎滑脱患者,根据椎体融
一段时期以来,我国食品市场上出现了果脯、野山椒、淀粉食品SO2超标、蛋糕铝超标、熟肉和酱腌菜质检不合格等事件,食品安全问题不断成为社会关注的热点.