贝叶斯在医疗诊断系统中的应用研究

被引量 : 15次 | 上传用户:laoshuzhuimao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着时代飞速的发展,各方面都开始智能化。特别是机器学习和数据挖掘的发展,使得各种专家系统都开始出现。这种专家系统的出现主要有三个目的:一、帮助专家进行诊断,提高决断的精确度。二、简化诊断流程,使得诊断的效率提高。三、减少诊断的花销。专家系统的出现使得许多方面都开始了智能化。各种成熟的技术都被应用到智能系统中来,具有很好的社会效益。随着人们生活水平的提高,有一些疾病开始大量的出现。例如,心脑血管疾病,高血压病,都成为现代人们生活的几个头号杀手。对这些病的诊断也是一个比较复杂的过程,因此,开发一个能解决这类问题的专家系统将具有很好的实用价值。其优点也是显而易见的,例如,可以帮助专家进行精确的诊断,提高诊断的准确度,可以提高诊断的效率,可以减少诊断的费用等等。一个专家系统的出现,与其采用的诊断方法有很大的关系。机器学习领域就提供了很多可以用来进行实际预测的分类方法,比较成熟方法有:决策树,贝叶斯,K近邻。K聚类等等。这些方法都已经被成功的应用在了多个领域。这些方法都基本分为两个流程:一个是训练阶段,一个是测试阶段。训练阶段就是采用收集到的数据进行训练,训练好了模型之后就可以对测试数据进行分类和预测。举个例子来说,比如专家已经对很多的病人进行了诊断,这样的一些的数据进行训练,然后建立好了模型之后,对于新来的病人就可以对其进行预测,是健康或者不健康。根据建立模型和训练的方式,这些方法可以被分为两类,一类是有指导的学习,一类是无指导的学习。其主要的分别如下,有指导的学习就是每一个实例都含有类标记可以指导模型的建立,然后再用这样的模型进行预测,这类算法在学习的过程中是有老师指导的。还有一类其中的实例是没有类标记的,在模型的建立过程中只是根据实例之间的相似程度来进行的,处于同一类的实例具有很好的相似性,处于不同类之间的实例有很好的区分性,这种没有学习方式称为无导师的学习。另外,这样的机器学习方法可以分为两类:一类是懒惰的学习方式,这类学习方式对于每一个测试实例来临时,然后根据这样的实例去建立自己的模型,再进行预测。每来一个实例,就建立一次模型,这样的分类算法可想而知,很慢。那些不是懒惰的学习方式就是,先建立模型,然后每来一个实例都用这个模型进行预测,也就是说这样的模型只建立一次,然后被重复用很多次。每种算法都有自己的优缺点。懒惰的学习方式分类精度好,但是时间的花费比较大。那些不是懒惰的学习方式虽然分类精度可能没有前一种好,但是其时间花费较少。本文主要研究了贝叶斯算法在医疗诊断中的应用。贝叶斯算法是一种懒惰的学习方式,以前简单实用被广泛的应用于各个方面,本质上是一种基于概率的判别方式。每个实例的判别结果是属于概率最大的那个类。本文从贝叶斯算的基本理论开始讲起,分别介绍了朴素贝叶斯,贝叶斯网络,最优贝叶斯等,分别总结了它们各自的优缺点,以及各自适应的范围,总的说贝叶斯算法一共有如下的几个特点:(1)其理论简单,实用性强。只要在先验概率可知的情况下,算法是很好计算的,众多的实验应用证明,这种算法具有很强的使用性。(2)贝叶斯是一种基于概率的分类方式。由此可以看出,训练集的个数只要不是很大的变动,其分类结果是不会改变的。也就是说,算法具有好的鲁棒性。(3)学习的速度很快。没有许多大量重复的工作。本文开发了基于朴素贝叶斯的医疗诊断系统,导入训练集之后进行训练,便可以进行预测了。由算法分析可知,有两个主要的因素会对算法的结果产生影响,一个是算法所采用的属性集合,一个是采用几折交叉。也就是说,采用不同的属性集合对目标属性进行预测,采用不同折数进行训练和预测。我们设计多个详细的实验来证实这两个不同因数的影响。一个是固定的折数的情况下,不同的属性集个数的情况下,算法的性能评估。一个是固定属性集个数的情况下,不同的折数的情况下,算法的性能评估。从结果的分析可知,不同的属性集个数的情况下,不同的折数的情况下,算法的性能是有差异的。另外,我们还开发了基于贝叶斯的预警系统,其基本理论就是属于各个类别的概率的之差。也就是说,如果一个实例被判定为归于正常的概率远远大于判定为不正常的概率,那个这个人的健康状况很好,如果一个人被判定为正常的概率和不正常的概率相差不大,虽然这个人被归结为正常,但是其身体的状况可能也游走在健康和不健康之间,这是需要对其健康状况进行预警,告知其要注意身体状况。也就是说,一个实例被归于正常的概率比不正常的概率越大,这个人越健康,反之这个人的健康越接近不健康。为了更好的了解一个人的健康状况,我们根据两个健康与不健康之间的差距,将其分为四个档次:优、良、一般、合格。其中的合格就是指刚刚处于健康的状态。在不同的属性集个数和不同的折数情况下,可能会有一些实例会在这四个档次之间波动,这些实例基本上都是出于两个类之间的边缘的实例。最后的分类等级线明显的表明了这一点。实验证明这个基于贝叶斯的医疗诊断系统的有效性,包括对于新的实例的预测和预警都极有很好的使用效果,在现实生活中有很好的实用性。
其他文献
通过对喷灌工程树状管网水力计算分析,将CAD、Excel、数字图形、工程布置与计算机操作相结合,探索了管网水力计算的计算机实现方式,分析了喷灌工程的水力计算的数据流程。管网水
上世纪70年代,为摆脱财政困境,提高政府效率,提升综合国力,西方国家发起了号称“新公共管理运动”的行政改革浪潮。作为公共管理基础性信息的政府会计系统一直处于公共管理领
空乘专业英语教学改革应该以ESP需求分析理论为基础,调研其教学现状及原因,探索空乘专业英语课程设置、教学模式、教材建设、师资培养等改革新思路,提升高职空乘专业ESP教学
传统的招投标流程信息发布过程复杂,数据录入进程繁琐,信息管理不规范,数据冗余现象严重,统计困难,运作成本高,耗时长,时效性不强。而基于Web的在线招投标系统,有效地将参与招投标过
在柴达木盆地中度盐碱地上,对6个紫花苜蓿品种进行耐盐适应性及生产性能评比试验,结果表明:各苜蓿品种覆膜种植当年出苗率均在80%以上,均能达到开花期;利用层次分析法对6个品
随着我国公司制度不断地完善,公司治理结构为公司的经营发展以及市场的规范起到了很大的作用。然而由于公司治理结构中各个权利主体之间的监督与激励制度不够健全,导致企业管
在经济全球化的大趋势下,品牌作为软实力,已经成为推动企业发展、促进经济进步的重要驱动力,是一个企业、一个地区,甚至一个国家综合实力的重要标志。国家“十二五”规划纲要
信息技术的发展给教育带来了前所未有的发展契机,数字化学习、移动学习、泛在学习等多样化学习形式,将会构建出一个无缝学习空间,在这个空间中,学习变得更加泛在化。而当教育信息
目的:本研究旨在探讨白藜芦醇(resveratrol, Res)抗兔动脉粥样硬化(atherosclerosis, AS)的信号转导机制。方法:57只雄性日本大耳白兔随机分为7组:正常对照组、20周模型组、白藜