基于粗糙集加权的朴素贝叶斯分类模型的应用研究

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:qinlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是当前人工智能研究领域非常活跃的一部分,是后者的核心内容之一。粗糙集理论是一种能够处理不精确和不确定性问题的数学工具,有着坚实的理论基础。本文主要围绕基于粗糙集理论中属性重要度加权的朴素贝叶斯分类模型展开研究工作,针对后者在现实问题中依据的假设不易成立的问题,从应用和理论两个方面对朴素贝叶斯分类模型和粗糙集理论相结合应用于工程实践进行了较深入的研究。主要工作包括以下三方面的内容:(1)系统分析了朴素贝叶斯分类模型的不足,根据某三甲医院提出的病案分类和智能导医的需求,提出了重点改进方向。(2)针对朴素贝叶斯分类模型,分析了粗糙集理论中可以改善其不足和缺点的理论与算法,并据此提出了两者相结合的新的分类模型。该分类模型以属性约简为基础,以属性重要度加权为手段,最后计算出每个属性在分类中的权值。实验表明,上述新的分类模型与朴素贝叶斯分类模型相比,在时间消耗相近的情况下,能够有效地提高分类效果,提升准确率。(3)在研究和分析医院病案的基础上,提出了对医院病案自动分类和智能导医的整体解决方案。首先,针对医院现有海量病案进行整理,提取有用数据组成决策表;然后,利用属性约简对数据进行简化;接下来,对剩余属性进行重要度求值,再对描述词进行二次加权,以便突出病案或用户描述的重点词汇,将二次加权的值作为对属性权值的正确修正参数进行最终的分类计算;最后,通过面向对象分析和程序设计,开发了一套基于粗糙集加权的朴素贝叶斯分类模型系统,并成功应用于医疗领域中的病案分类和智能导医系统。实验表明,本文提出的分类模型相较于朴素贝叶斯分类模型具有更高的准确率,是一种比较成功的分类模型。
其他文献
各种高科技领域的强劲需求不断推动着数据库规模的迅速膨胀,传统的集中式数据库系统已经难以满足这种数据密集型应用的需要,因此,开发高性能、低成本的并行数据库系统将有重大意
学位
伴随着计算技术的发展,在实际应用需求的推动下,数值计算得到了长足进步。数值软件尤其是并行数值软件是当前数值计算的关键环节。日益增多的大规模、复杂实际应用问题,对数值软
学位
XML(eXtensible Markup Language,可扩展标记语言)定义了一种数据格式,这种数据格式允许用户自己定义标记,来描述特定应用领域的数据,以这种格式描述的数据形成的文件称为XML
随着计算机技术的迅速发展和硬件水平的快速提升,尤其是近年来高性能计算机和并行技术的发展,气象、生态问题的高性能计算应用显得日益重要。本课题内容基于国家973项目“高性
学位
计算机网络的迅速发展推动了信息化和全球化的进程。企业与企业之间,企业的各部门之间,信息交换越来越频繁。由于地理位置的分布性和所采用的技术的多样性,直接导致了数据资源的
学位
互联网技术和应用的飞速发展对网络信息传输安全和服务质量保证提出了严峻的挑战,建立高可信的网络服务已经成为网络应用发展的迫切需求。目前可信网络相关技术的研究重点集
学位
强化学习作为一种强有力的机器学习方法,其有效性已经在很多领域得到证明。它研究的是一个很普遍的问题:即如何在一个未知的动态环境中学习,以找到最优的行为策略。强化学习给人
多角度人脸识别是模式识别中极具挑战性的课题,在军用和民用领域有着广阔的应用前景,其目的是让计算机等机器能够自动辨认出各个角度的人脸图像。由于人脸的复杂性和微妙性,
随着多媒体通信技术的飞速发展,多种业务的融合已经成为网络发展的一个趋势。社区宽带综合业务网络系统使用交换式以太网技术,在一个物理网络上实现常规电话网、数字电视网、计
学位